• 제목/요약/키워드: 다중차원축소방법

검색결과 29건 처리시간 0.016초

서포트 벡터 머신 알고리즘을 활용한 연속형 데이터의 다중인자 차원축소방법 적용 (Support vector machine and multifactor dimensionality reduction for detecting major gene interactions of continuous data)

  • 이제영;이종형
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1271-1280
    • /
    • 2010
  • 인간의 질병과 가축의 특성에 영향을 주는 유전자들의 상호작용을 규명하는 방법으로 전통적인 통계방법들이 사용되었지만, 유전자와 같은 고차원의 데이터에는 적합하지 않았다. 따라서 다중인자 차원축소방법이 제안되었다. 다중인자 차원축소방법은 모형에 대한 가정이 필요하지 않는 비모수적 방법으로 이분형 자료에 적용 가능 하지만, 연속형 데이터에는 적용할 수 없는 단점이 있다. 따라서 본 연구에서는 일반화 분류 성능이 뛰어난 서포트 벡터 머신 알고리즘을 통해 연속형 자료를 가공하여 다중인자 차원축소방법에 적용하였다. 아울러 한우의 6번 염색체내 6개의 후보 단일염기다형성을 대상으로 연속형 자료인 실제 한우의 경제형질에 서포트 벡터 머신을 이용한 다중인자 차원축소방법을 적용함으로써 한우의 경제형질에 연관된 우수 유전자 상호작용의 조합을 규명하였다.

CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 검정력 평가 (Power of Expanded Multifactor Dimensionality Reduction with CART Algorithm)

  • 이제영;이종형;이호근
    • Communications for Statistical Applications and Methods
    • /
    • 제17권5호
    • /
    • pp.667-678
    • /
    • 2010
  • 인간의 유전자 상호작용을 분석하기 위해 제시된 다중인자 차원축소방법은 연속형자료에는 적용할 수 없다. 그래서 이를 보완한 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법이 제안되었다. 하지만 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 검정력이 밝혀지지 않았다. 따라서 본 연구에서는 모의실험을 통하여 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 우수한 검정력을 평가하고, 확인된 검정력을 바탕으로 실제 한우 데이터에 적용하여 한우의 경제형질에 영향을 주는 우수 유전자조합을 규명하였다.

생존시간과 연관된 유전자 간의 교호작용에 관한 다중차원축소방법의 확장 (An extension of multifactor dimensionality reduction method for detecting gene-gene interactions with the survival time)

  • 오진석;이승연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1057-1067
    • /
    • 2014
  • 인간게놈 프로젝트 이후 질병과 연관된 변이유전자를 탐색하기 위해 유전형질의 차이에 영향을 주는 단일 유전자를 중심으로 전장유전체 연관성 연구가 활발하게 진행되어왔다. 그러나 전장유전체 연관성 연구에서 접근한 단일유전자 분석방법에 한계점이 발견되면서 최근에는 다중유전자 분석방법이나 유전자-유전자간의 상호작용에 대한 연구들이 활발하게 진행 중이다. 이 중 다중차원축소방법은 유전자-유전자간의 상호작용의 연관성을 찾아내기 위하여 고차원을 일차원으로 축소하는 방법으로 이진형 반응변수를 기반으로 크게 활용되고 있다. 본 논문에서는 이 방법을 생존시간으로 확장하여 생존시간과 연관된 유전자-유전자간의 상호작용을 찾아내는 방법을 제안하고자 한다. 구체적으로 가속화 고장시간 회귀모형 하에서 표준화잔차 스코어를 분류기준으로 사용하여 다중차원축소방법을 적용하는 방법으로 AFT-MDR이라고 지칭하였다. 시뮬레이션 연구를 통하여 기존에 제안된 Surv-MDR과 Cox-MDR과의 검정력을 비교하였으며 국내의 백혈병환자 자료분석에 적용하였다. 시뮬레이션 결과로부터 AFT-MDR은 유전율이 높을수록 검정력이 커지며 회귀모형에 기반하여 공변량의 효과를 고려할 수 있다는 장점이 있으나 센서링 비율이 높아지면서 검정력이 매우 떨어진다는 단점이 발견되었다. 따라서 이를 보완하기 위한 추후연구의 필요성이 요구된다.

다중인자 차원 축소 방법에 의한 대사증후군의 위험도 분석과 오즈비 (The study on risk factors for diagnosis of metabolic syndrome and odds ratio using multifactor dimensionality reduction method)

  • 진미현;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.867-876
    • /
    • 2013
  • 대사증후군은 심혈관질환의 발생을 증가시키는 주요 요인으로 알려져 왔다. 특히 만성적인 대사장애로 여러 질병이 한 개인에게서 복합되어 나타나는 대사증후군의 경우 우리나라에서도 유병률이 점차 증가하는 추세이다. 이에 본 연구는 다중인자 차원 축소 방법을 이용하여 대사증후군의 위험도를 확인하고 여러 대사증후군 진단 조합 중에서 가장 위험한 조합을 제시하는 데 목적을 둔다. 자료는 질병관리본부에서 실시한 제 5기 국민건강영양조사 1차년도 (2010년)자료를 이용하여 성인 중에서 분석방법에 적용이 가능한 3,990명을 대상자로 결정하였다. 다중인자 차원 축소 방법을 적용시킨 결과 대사증후군에 가장 위험한 단일 요인은 복부비만이었고, 복부비만을 포함한 대사증후군 진단 조합은 복부비만과 고지혈증, 고혈압이 가장 위험한 것으로 나타났다. 이것은 대사증후군의 새로운 진단 결과이다. 특히, 남성의 경우는 복부비만, 저 HDL-콜레스테롤혈증, 고혈압이 가장 위험한 조합으로 확인되었고 체질량 지수가 $25kg/m^2$이상인 사람에게서는 복부비만, 고지혈증, 고혈당의 조합이 가장 위험한 대사증후군 조합이었다.

더미 다중인자 차원축소법에 의한 검증력과 주요 유전자 규명 (Power and major gene-gene identification of dummy multifactor dimensionality reduction algorithm)

  • 여정수;라부미;이호근;이성원;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.277-287
    • /
    • 2013
  • 광범위 유전자 관련 연구에서는 유전자-유전자 상호작용을 규명하는 것은 매우 중요하다. 최근 유전자-유전자 상호작용을 규명하는데에 대한 많은 연구가 진행되고 있다. 그 중 하나로 더미 다중인자 차원축소법이다. 이 연구의 목적은 모의실험을 통해 유전자-유전자 상호작용 파악하기 위한 더미 다중인자 차원축소의 검증력을 평가하는 것이다. 또한 이 방법을 적용하여 한우모집단에서 경제형질을 위한 단일 염기 다형성의 상호작용 효과를 확인하였다.

다중축척 공간 데이터베이스에서 축소연산자를 위한 위상 일관성 (Topological Consistency for Collapse Operator on Multi-Scale Databases)

  • 권오제;강혜경;이기준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 추계 학술대회 논문집
    • /
    • pp.27-40
    • /
    • 2004
  • 다중축척 공간데이터베이스란 동일한 현실 공간을 여러 축척의 데이터베이스로 저장한 것을 말한다. 이 다중축척의 데이터베이스는 기존에 구축된 원시 데이터베이스로부터 유도될 수 있다. 그런데 이 유도과정에서 원시 데이터베이스에 있던 기하 및 위상관계는 변형이 된다. 그리고 이 관계 변형은 유도된 데이터베이스의 무결성을 보장하지 못하는 원인이 된다. 때문에 유도된 데이터베이스가 원시 데이터베이스와 일관성이 있는지를 조사할 필요가 있다. 이 논문은 원시 데이터베이스와 유도된 다중축척 데이터베이스간의 위상적 일관성에 초점을 둔다. 특히, 2차원 공간객체가 1차원으로 축소되었을 때 위상관계의 일관성을 평가하는 방법을 제안할 것이다. 즉, 2차원 공간객체간에 위상관계를 표현하는 8가지 위상관계를 2차원과 1차원 공간객체간에 위상관계를 표현하는 19가지 위상관계로 일관성 있게 전환하는 4가지 방법을 제안할 것이다. 이 방법들은 새로 생성된 다중축척 데이터베이스의 위상관계가 원시 데이터베이스로부터 일관성 있게 유도되었는지를 판단하는 근거가 될 수 있다. 또, 다중축척 데이터베이스간에 위상관계의 일관성을 보장하므로 동일 공간에 주어진 사용자 질의는 축척에 상관없이 그 결과가 동일하게 된다.

  • PDF

더미(dummy) 변수를 활용한 다중인자 차원 축소(MDR) 방법 (Multifactor Dimensionality Reduction(MDR) Analysis by Dummy Variables)

  • 이제영;이호근
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.435-442
    • /
    • 2009
  • 통계모형의 상호작용 효과를 분석하기 위해 비모수적인 방법인 다중인자 차원 축소(MDR) 방법을 사용해왔다. MDR 방법은 사례-대조 데이터에만 적용 할 수 있다. 본 논문에서는 연속형 데이터에도 적용 할 수 있는 더미(dummy) 변수를 활용한 MDR방법을 소개한다. 아울러 이를 통해 한우의 주요 경제형질인 등심단면적 (longissimus muscle dorsi area: LMA), 도체중(carcass cold weight: CWT), 일당증체량(average daily gain: ADC)에 영향을 주는 우수 유전자 단일염기다형성(SNP)을 규명한다.

다차원 데이터의 군집분석을 위한 차원축소 방법: 주성분분석 및 요인분석 비교 (A dimensional reduction method in cluster analysis for multidimensional data: principal component analysis and factor analysis comparison)

  • 홍준호;오민지;조용빈;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.135-143
    • /
    • 2020
  • 본 논문은 농식품 소비자패널 데이터에서 소비자의 유형을 나눌 때에 변수간 연관성이 많은 장바구니 분석에서 전처리 방법과 차원축소의 방법을 제안한다. 군집분석은 다변량 자료에서 관측 개체를 몇 개의 군집으로 나눌 때 널리 사용되는 분석기법이다. 하지만 여러 개의 변수가 연관성을 가진 경우에는 차원축소를 통한 군집분석이 더 효과적일 수 있다. 본 논문은 1,987 가구를 대상으로 조사한 식품소비 데이터를 K-means 방법을 사용하여 군집화하였으며, 군집을 나누기 위해 17개의 변수를 선정하였고, 17개의 다중공선성 문제와 군집을 나누기 위한 차원축소의 방법 중 주성분 분석과 요인분석을 비교하였다. 본 연구에서는 주성분분석과 요인분석 모두 2개의 차원으로 축소하였으며 주성분분석에서는 3개의 군집으로 나뉘었지만 분석하고자 하였던 소비 패턴에 대한 군집의 특성이 잘 나타나지 않았으며 요인분석에서는 분석가가 보고자 하는 소비 패턴의 특징이 잘 나타났다.

다중축척 공간 데이터베이스의 축소연산자를 위한 위상관계 일관성 평가 (The Consistency Assessment of Topological Relationships For a Collapse Operator in Multi-Scale Spatial Databases)

  • 강혜경;이기준
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.837-848
    • /
    • 2005
  • 다중축척 공간데이터베이스란 동일한 현실 공간을 여러 축척으로 저장한 것으로, 기존에 구축된 원시 공간 데이터베이스로부터 유도될 수 있다. 이 유도과정에서 원시 데이터베이스에 있던 기하 및 위상관계는 변형이 되고, 이 관계 변형은 유도된 데이터베이스의 무결성을 보장하지 못하는 원인이 되므로, 유도과정이 수행된 후에는 반드시 유도된 데이터베이스와 원시 데이터베이스의 관계 일관성을 조사해야한다. 이 논문에서는 원시 데이터베이스와 유도된 다중축척 데이터베이스간의 위상 관계 일관성을 평가하는 방법을 제시하겠다. 특히, 2차원 공간객체가 1차원으로 축소되었을 때 위상관계의 일관성을 평가하는 방법을 제한할 것이며, 이 평가 방법들의 구현에 대해서 기술하고, 사례를 이용하여 구현결과를 기술하겠다.

한우의 FABP4, SCD, FASN, SREBPs 유전자에서 경제형질에 영향을 미치는 우수 유전자형 선별 (Major genotype identification affecting economic traits in FABP4, SCD, FASN and SREBPs genes of Korean cattle)

  • 이제영;박재철
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1247-1255
    • /
    • 2016
  • Kim과 Lee (2015)는 한우의 등급과 지방산을 향상시키는 우수한 FABP4 유전자를 선별하였다. 본 연구의 목적은 유전자를 확장하여 한우의 경제형질에 영향을 미치는 우수한 유전자형을 선별하는 것이다. 확장된 유전자는 한우의 등급과 지방산과 깊은 연관이 있다고 밝혀진 FABP4, SCD, FASN, SREBPs이다. 우리는 환경적인 요인을 제거하여 보정된 경제형질 값을 활용하여 보정된 경제형질 값에 다중인자차원축소 방법을 적용한다. 그 결과 한우의 등급, 지방산을 향상시키는 우수한 유전자와 유전자형을 선별했다.