• 제목/요약/키워드: 유전자 선택

검색결과 614건 처리시간 0.025초

유전자 알고리즘과 정보이론을 이용한 속성선택 (Feature Selection by Genetic Algorithm and Information Theory)

  • 조재훈;이대종;송창규;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.108-111
    • /
    • 2007
  • 속성선택(Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 부분으로 다양한 기법들이 연구되어지고 있다. 특히, 많은 변수와 속성들을 가지는 데이터를 패턴분류 하는 과정에서 주요 속성부분집합을 추출하여 이용함으로써 분류기의 연산속도 및 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 제안된 기법의 성능을 평가하기 위하여 패턴분류 문제에 적용하고 그 성능이 우수함을 확인하였다.

  • PDF

유전자 알고리즘을 이용한 캐릭터 디자인에 관한 연구 (A Study on the Character Design using Genetic Algorithms)

  • 최성욱;배환국;이재필;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.220-222
    • /
    • 2000
  • 캐릭터를 디자인하는 작업은 전에 없던 새로운 형태의 모습을 만드는 일이므로 디자이너와 같은 사람의 창조적인 능력을 빌어야만 했다. 본 논문은 자연적 선택과 유전학의 이론에 기인하고 있는 유전자 알고리즘을 이용하여 제작된 창조적인 캐릭터 자동 생산 도구와 그 자동화 도구의 제작 원리를 소개함으로써 컴퓨터를 이용하여 간단한 형태의 새로운 캐릭터를 만드는 가능성을 제시한다. 유전자 알고리즘의 선택, 교차, 그리고 돌연변이의 기능을 캐릭터 디자인에 적용하여, 사용자의 기호에 따라 선택을 수행하게 하였고 그 선택된 개체들을 비트 단위로 교차와 돌연변이를 적용하여 부모의 형질을 물려받은 다음 세대의 자식 개체로 진화시키는 과정을 시뮬레이션 하였다.

  • PDF

안정적 유전자 특징 선택을 위한 유전자 발현량 데이터의 부트스트랩 기반 Lasso 회귀 분석 (Lasso Regression of RNA-Seq Data based on Bootstrapping for Robust Feature Selection)

  • 조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권9호
    • /
    • pp.557-563
    • /
    • 2017
  • 많은 수의 유전자 데이터를 이용해서 Lasso 회귀 분석을 할 때, 유전자 발현량 값들 사이의 높은 상관성으로 인하여 회귀 계수의 추정값이 회귀 분석의 반복 시행마다 달라질 수 있다. L1 정규화에 의해 축소되는 회귀 계수의 불안정성은 변수 선택을 어렵게 하는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 부트스트랩 단계를 반복 시행하여 높은 빈도로 선택된 유전자들을 이용한 회귀 모형들을 만들고, 각 모형들에서 안정적으로 선택되는 특징 유전자들을 찾고, 그 유전자들이 위양성 결과가 아님을 입증하였다. 또한, 회귀모형 별 예측지수의 정확도를 실제지수와의 상관관계를 이용해 측정하였는데, 선택된 특징 유전자들의 회귀계수 부호의 분포가 정확도와 관련성을 보임을 확인하였다.

시간 경로 마이크로어레이 자료의 군집 분석에 관한 고찰 (A Review of Cluster Analysis for Time Course Microarray Data)

  • 손인석;이재원;김서영
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.13-32
    • /
    • 2006
  • 생물학자들은 시간에 따라 발현 수준이 변화하는 유전자의 군집화를 시도하고 있다. 지금까지는 마이크로어레이 자료의 군집분석에 관한 연구의 경우 군집 방법 자체를 비교하는 연구가 주를 이루었다. 그러나 군집화 이전에 의미있는 변화를 보이는 유전자 선택에 따라 군집화 결과가 달라지기 때문에, 군집 분석에 있어서 유전자 선택 단계도 중요하게 고려되어야 한다. 따라서, 본 논문에서는 시간 경로 마이크로어레이 자료를 군집 분석하는데 있어서 유전자 선택, 군집 방법 선택, 군집평가 방법 선택 등 3가지 요인을 고려한 폭 넓은 비교 연구를 하였다.

암 분류를 위한 하이브리드 유전자 선택 기법 (Hybrid Gene Selection Method for Cancer Classification)

  • 박영준;;;박명호;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.154-156
    • /
    • 2012
  • 암 분류를 위한 마이크로어레이 데이터로부터의 유전자 선택은 최근 각광을 받고 있는 연구분야이다. 마이크로어레이 데이터는 적은 샘플 수에 비해 대규모의 유전자로 구성된다. 그렇기 때문에 분류의 정확도를 높이기 위하여 대상 암과 관련된 유전자만 선택할 수 있는 차원 축소 기법이 필요하다. 따라서 본 논문에서는 Symmetrical Uncertainty와 Support Vector Machine (SVM)을 이용한 하이브리드 속성선택 기법을 제안하였다. 제안한 기법은 실험 결과를 통해 다른 속성 선택 기법보다 좋은 성능을 보여주었다.

유전자 알고리즘에서의 개선된 유전자 선택기법의 비교 (A Evaluation on Improver Gen Code Selection Method for the Genetic Algorithms)

  • 김태식;정성용
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 추계학술대회 발표논문집:21세기를 향한 정보통신 기술의 전망
    • /
    • pp.63-77
    • /
    • 1997
  • 유전자 알고리즘(Genetic Algorithms)은 우수형질이 계속 번식하고 열성형질은 도태하는 자연의 진화 메커니즘을 모방한 탐색 알고리즘으로 전형적인 조합 최적화 문제에 많이 적용되고 있다. 유전자 알고리즘의 성능을 향상시키기 위해 알고리즘 실행과정에 적용할 수많은 이론과 경험적인 유전자 조작 기법이 제시되고 있는데, 이러한 기법들은 대부분 우수형질을 확보함으로써 최적의 값을 효과적으로 탐색하기 위한 것이다. 그러나, 적절하지 못한 유전자 조작의 경우 탐색지점의 제한등으로 인한 Local Optimum에 빠질 위험이 있으므로, 유전자 조작에 대한 평가가 이루어져야 한다. 본 연구에서는 유전자 알고리즘의 유전자 조작기법중 적응도 비례전략을 개선한 유전자조작이 적절한 선택기법들로 유전자 알고리즘에 응용될수 있는지를 밝히기 위해, 냅색문제를 대상으로 세대수의 변화에 따른 탐색 결과를 평가하였다.

  • PDF

RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석 (Alternative Splicing Pattern Analysis from RNA-Seq data)

  • 공진화;이종근;이은주;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.37-40
    • /
    • 2011
  • 선택 스플라이싱 (alternative splicing)은 mRNA (messenger RNA)의 전구체인 pre-mRNA가 mRNA로 전사될 때 pre-mRNA의 엑손 영역들 (exons)이 여러 가지 유형 (pattern)으로 다시 연결되는 과정을 말한다. 선택 스플라이싱에 의해 하나의 유전자로부터 서로 다른 mRNA가 만들어 지고 서로 다른 이소형의 단백질 (protein isoforms)이 생성된다. 현재까지 알려진 선택 스플라이싱의 유형은 약 7가지 종류가 있으며, 유전자의 돌연변이 및 질병과 밀접한 연관성을 가지고 있는 것으로 알려져 있다. 본 연구에서는 차세대 시퀀싱 (Next Generation Sequencing : NGS) 기술로 생성된 RNA-Seq 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 RNA-Seq 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 RNA-Seq 데이터의 커버리지 정보 및 엑손의 접합 (junction) 정보를 이용하여 발현된 트랜스크립트 (transcript)의 종류와 양을 측정한다. 알고리즘의 유효성을 보이기 위하여 시뮬레이션 데이터를 이용한 인간 유전자 영역에서의 선택 스플라이싱 유형 추출 실험을 수행하였으며, 검증된 선택 스플라이싱 DB와 비교, 검증하였다.

하이퍼망 모델을 이용한 MircoRNA Strand 선택 예측 (Prediction of MicroRNA Strand Selection using Hypernetwork Model)

  • 이지훈;하정우;이제근;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.235-239
    • /
    • 2010
  • MicroRNA는 RNA로 전사된 유전자와의 상보결합을 통해 유전자 발현을 억제하는 조절인자이다. MicroRNA 생성과정에서 pre-microRNA의 3' 또는 5' 부근의 strand가 선택되어 mature 시퀀스가 되고 유전자 조절에 직접 작용하게 된다. 하지만 어떤 특징을 가진 strand가 선택 되는지에 대한 정확한 메커니즘은 아직 연구되어 있지 않다. 본 논문에서는 microRNA 시퀀스 정보를 바탕으로 하이퍼망을 구성하여 strand 선택 예측 모델을 구축하였다. 실험 결과 하이퍼망 학습을 통해 microRNA strand 선택에 중요한 영향을 미치는 시퀀스 특징을 찾을 수 있었고, strand 선택을 높은 정확도로 예측할 수 있음을 확인하였다.

  • PDF

유전자 알고리즘과 SOM 알고리즘을 이용한 효율적 경로 탐색 (Efficient Path Search Method using Genetic Algorithm and SOM Algorithm)

  • 정지인;엄도성;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.87-90
    • /
    • 2011
  • 본 논문에서는 유전자 알고리즘에 SOM 알고리즘을 적용하여 효율적으로 경로를 탐색할 수 있는 방법을 제안한다. 제안된 경로 탐색 방법은 효율적인 경로 탐색에 앞서 유전자 알고리즘에 의해 도출된 각각의 결과 좌표를 뉴런으로 설정하고 각 뉴런들의 모든 거리 값을 SOM 알고리즘에 적용하여 거리에 대한 가중치를 구한다. 뉴런 선택 조건(가장 적은 거리 가중치, 이전에 선택되지 않았던 뉴런)을 만족하는 뉴런 및 해당 뉴런의 이웃 반경 내에 존재하는 뉴런들의 연결 강도를 가우시안 분포(오차율 분포)에 적용하여 변경하고, 가장 강한 연결 강도를 가지는 승자 뉴런에 해당하는 경로를 선택한다. 이러한 과정을 뉴런의 개수만큼 반복하여 모든 뉴런들의 경로를 도출한다. 제안된 방법을 실험한 결과, 기존의 유전자 알고리즘을 이용한 방법보다 제안된 방법이 효율적인 경로를 탐색하는 것을 확인할 수 있었다.

  • PDF

다수의 목표 유전자에서 진화연산을 이용한 Oligonucleotide Probe 선택 (Oligonucleotide Probe Selection using Evolutionary Computation in Large Target Genes)

  • 신기루;김선;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.455-457
    • /
    • 2003
  • DNA microarray는 분자생물학에서 널리 사용되고 있는 실험 도구로써 크게 cDNA와 oligonucleotide microarray로 나뉘어진다. DNA microarray는 일련의 DNA 서열로 이루어진 probe들의 집합으로 구성되며 알려지지 않은 서열과의 hybridization 과정을 통해 특정 서열을 인식할 수 있게 된다. O1igonucieotide microarray는 cDNA 방법과는 다르게 probe를 구성하는 서열을 제작자가 임의로 구성할 수 있기 때문에 목표 서열이 가지는 고유한 부분만을 probe 서열로 사용함으로써 비용절감과 실험의 정확도를 높일 수 있다는 장점이 있다. 그러나 현재 목표 유전자 서열에 대해 probe 집합을 생성하는 결정적인 방법은 존재하지 않으며, 따라서 넓은 해 공간에서 효과적으로 최적 해를 찾아 주는 진화 연산이 probe 선택을 위한 좋은 대안으로 사용될 수 있다[1.2]. 그러나 진화연산을 이용한 probe 선택방법에 있어서 인식하고자 하는 목표 서열의 개수가 많아질 경우, 해 공간의 크기가 커짐으로 인해 문제점이 발생할 수 있다. 따라서 본 논문에서는 다수의 목표 유전자 서열을 대상으로 한 probe 선택 방법에 일어서 보다 효율적인 진화연산 접근 방법을 소개한다. 제시된 방법은 인식하고자 하는 목표 서얼의 일부를 선택해 이를 probe 집합의 후보로 사용하며. 유전 연산자를 이용한 진화과정을 통해 최적에 가까운 probe 집합을 찾는다. 본 논문은 GenBank로부터 유전자 서열을 대상으로 제안된 방법을 실험하였으며, 축소된 목표 서열만을 이용해 probe 집합을 선택하더라도 적합한 probe 집합을 찾을 수 있었다.

  • PDF