• Title/Summary/Keyword: 유전자 선택

Search Result 614, Processing Time 0.045 seconds

Feature Selection by Genetic Algorithm and Information Theory (유전자 알고리즘과 정보이론을 이용한 속성선택)

  • Jo, Jae-Hun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.108-111
    • /
    • 2007
  • 속성선택(Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 부분으로 다양한 기법들이 연구되어지고 있다. 특히, 많은 변수와 속성들을 가지는 데이터를 패턴분류 하는 과정에서 주요 속성부분집합을 추출하여 이용함으로써 분류기의 연산속도 및 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 제안된 기법의 성능을 평가하기 위하여 패턴분류 문제에 적용하고 그 성능이 우수함을 확인하였다.

  • PDF

A Study on the Character Design using Genetic Algorithms (유전자 알고리즘을 이용한 캐릭터 디자인에 관한 연구)

  • 최성욱;배환국;이재필;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.220-222
    • /
    • 2000
  • 캐릭터를 디자인하는 작업은 전에 없던 새로운 형태의 모습을 만드는 일이므로 디자이너와 같은 사람의 창조적인 능력을 빌어야만 했다. 본 논문은 자연적 선택과 유전학의 이론에 기인하고 있는 유전자 알고리즘을 이용하여 제작된 창조적인 캐릭터 자동 생산 도구와 그 자동화 도구의 제작 원리를 소개함으로써 컴퓨터를 이용하여 간단한 형태의 새로운 캐릭터를 만드는 가능성을 제시한다. 유전자 알고리즘의 선택, 교차, 그리고 돌연변이의 기능을 캐릭터 디자인에 적용하여, 사용자의 기호에 따라 선택을 수행하게 하였고 그 선택된 개체들을 비트 단위로 교차와 돌연변이를 적용하여 부모의 형질을 물려받은 다음 세대의 자식 개체로 진화시키는 과정을 시뮬레이션 하였다.

  • PDF

Lasso Regression of RNA-Seq Data based on Bootstrapping for Robust Feature Selection (안정적 유전자 특징 선택을 위한 유전자 발현량 데이터의 부트스트랩 기반 Lasso 회귀 분석)

  • Jo, Jeonghee;Yoon, Sungroh
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.9
    • /
    • pp.557-563
    • /
    • 2017
  • When large-scale gene expression data are analyzed using lasso regression, the estimation of regression coefficients may be unstable due to the highly correlated expression values between associated genes. This irregularity, in which the coefficients are reduced by L1 regularization, causes difficulty in variable selection. To address this problem, we propose a regression model which exploits the repetitive bootstrapping of gene expression values prior to lasso regression. The genes selected with high frequency were used to build each regression model. Our experimental results show that several genes were consistently selected in all regression models and we verified that these genes were not false positives. We also identified that the sign distribution of the regression coefficients of the selected genes from each model was correlated to the real dependent variables.

A Review of Cluster Analysis for Time Course Microarray Data (시간 경로 마이크로어레이 자료의 군집 분석에 관한 고찰)

  • Sohn In-Suk;Lee Jae-Won;Kim Seo-Young
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.1
    • /
    • pp.13-32
    • /
    • 2006
  • Biologists are attempting to group genes based on the temporal pattern of gene expression levels. So far, a number of methods have been proposed for clustering microarray data. However, the results of clustering depends on the genes selection, therefore the gene selection with significant expression difference is also very important to cluster for microarray data. Thus, this paper present the results of broad comparative studies to time course microarray data by considering methods of gene selection, clustering and cluster validation.

Hybrid Gene Selection Method for Cancer Classification (암 분류를 위한 하이브리드 유전자 선택 기법)

  • Piao, Yongjun;Hiep, Vu Quang;Erdenetuya, Namsrai;Piao, Minghao;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.154-156
    • /
    • 2012
  • 암 분류를 위한 마이크로어레이 데이터로부터의 유전자 선택은 최근 각광을 받고 있는 연구분야이다. 마이크로어레이 데이터는 적은 샘플 수에 비해 대규모의 유전자로 구성된다. 그렇기 때문에 분류의 정확도를 높이기 위하여 대상 암과 관련된 유전자만 선택할 수 있는 차원 축소 기법이 필요하다. 따라서 본 논문에서는 Symmetrical Uncertainty와 Support Vector Machine (SVM)을 이용한 하이브리드 속성선택 기법을 제안하였다. 제안한 기법은 실험 결과를 통해 다른 속성 선택 기법보다 좋은 성능을 보여주었다.

A Evaluation on Improver Gen Code Selection Method for the Genetic Algorithms (유전자 알고리즘에서의 개선된 유전자 선택기법의 비교)

  • 김태식;정성용
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1997.11a
    • /
    • pp.63-77
    • /
    • 1997
  • 유전자 알고리즘(Genetic Algorithms)은 우수형질이 계속 번식하고 열성형질은 도태하는 자연의 진화 메커니즘을 모방한 탐색 알고리즘으로 전형적인 조합 최적화 문제에 많이 적용되고 있다. 유전자 알고리즘의 성능을 향상시키기 위해 알고리즘 실행과정에 적용할 수많은 이론과 경험적인 유전자 조작 기법이 제시되고 있는데, 이러한 기법들은 대부분 우수형질을 확보함으로써 최적의 값을 효과적으로 탐색하기 위한 것이다. 그러나, 적절하지 못한 유전자 조작의 경우 탐색지점의 제한등으로 인한 Local Optimum에 빠질 위험이 있으므로, 유전자 조작에 대한 평가가 이루어져야 한다. 본 연구에서는 유전자 알고리즘의 유전자 조작기법중 적응도 비례전략을 개선한 유전자조작이 적절한 선택기법들로 유전자 알고리즘에 응용될수 있는지를 밝히기 위해, 냅색문제를 대상으로 세대수의 변화에 따른 탐색 결과를 평가하였다.

  • PDF

Alternative Splicing Pattern Analysis from RNA-Seq data (RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석)

  • Kong, Jin-Hwa;Lee, Jong-Keun;Lee, Un-Joo;Yoon, Jee-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.37-40
    • /
    • 2011
  • 선택 스플라이싱 (alternative splicing)은 mRNA (messenger RNA)의 전구체인 pre-mRNA가 mRNA로 전사될 때 pre-mRNA의 엑손 영역들 (exons)이 여러 가지 유형 (pattern)으로 다시 연결되는 과정을 말한다. 선택 스플라이싱에 의해 하나의 유전자로부터 서로 다른 mRNA가 만들어 지고 서로 다른 이소형의 단백질 (protein isoforms)이 생성된다. 현재까지 알려진 선택 스플라이싱의 유형은 약 7가지 종류가 있으며, 유전자의 돌연변이 및 질병과 밀접한 연관성을 가지고 있는 것으로 알려져 있다. 본 연구에서는 차세대 시퀀싱 (Next Generation Sequencing : NGS) 기술로 생성된 RNA-Seq 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 RNA-Seq 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 RNA-Seq 데이터의 커버리지 정보 및 엑손의 접합 (junction) 정보를 이용하여 발현된 트랜스크립트 (transcript)의 종류와 양을 측정한다. 알고리즘의 유효성을 보이기 위하여 시뮬레이션 데이터를 이용한 인간 유전자 영역에서의 선택 스플라이싱 유형 추출 실험을 수행하였으며, 검증된 선택 스플라이싱 DB와 비교, 검증하였다.

Prediction of MicroRNA Strand Selection using Hypernetwork Model (하이퍼망 모델을 이용한 MircoRNA Strand 선택 예측)

  • Lee, Ji-Hoon;Ha, Jung-Woo;Rhee, Je-Keun;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.235-239
    • /
    • 2010
  • MicroRNA는 RNA로 전사된 유전자와의 상보결합을 통해 유전자 발현을 억제하는 조절인자이다. MicroRNA 생성과정에서 pre-microRNA의 3' 또는 5' 부근의 strand가 선택되어 mature 시퀀스가 되고 유전자 조절에 직접 작용하게 된다. 하지만 어떤 특징을 가진 strand가 선택 되는지에 대한 정확한 메커니즘은 아직 연구되어 있지 않다. 본 논문에서는 microRNA 시퀀스 정보를 바탕으로 하이퍼망을 구성하여 strand 선택 예측 모델을 구축하였다. 실험 결과 하이퍼망 학습을 통해 microRNA strand 선택에 중요한 영향을 미치는 시퀀스 특징을 찾을 수 있었고, strand 선택을 높은 정확도로 예측할 수 있음을 확인하였다.

  • PDF

Efficient Path Search Method using Genetic Algorithm and SOM Algorithm (유전자 알고리즘과 SOM 알고리즘을 이용한 효율적 경로 탐색)

  • Jeong, Ji-In;Eom, Do-Sung;Kim, Kwang-Beak
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2011.05a
    • /
    • pp.87-90
    • /
    • 2011
  • 본 논문에서는 유전자 알고리즘에 SOM 알고리즘을 적용하여 효율적으로 경로를 탐색할 수 있는 방법을 제안한다. 제안된 경로 탐색 방법은 효율적인 경로 탐색에 앞서 유전자 알고리즘에 의해 도출된 각각의 결과 좌표를 뉴런으로 설정하고 각 뉴런들의 모든 거리 값을 SOM 알고리즘에 적용하여 거리에 대한 가중치를 구한다. 뉴런 선택 조건(가장 적은 거리 가중치, 이전에 선택되지 않았던 뉴런)을 만족하는 뉴런 및 해당 뉴런의 이웃 반경 내에 존재하는 뉴런들의 연결 강도를 가우시안 분포(오차율 분포)에 적용하여 변경하고, 가장 강한 연결 강도를 가지는 승자 뉴런에 해당하는 경로를 선택한다. 이러한 과정을 뉴런의 개수만큼 반복하여 모든 뉴런들의 경로를 도출한다. 제안된 방법을 실험한 결과, 기존의 유전자 알고리즘을 이용한 방법보다 제안된 방법이 효율적인 경로를 탐색하는 것을 확인할 수 있었다.

  • PDF

Oligonucleotide Probe Selection using Evolutionary Computation in Large Target Genes (다수의 목표 유전자에서 진화연산을 이용한 Oligonucleotide Probe 선택)

  • Shin, Ki-Roo;Kim, Sun;Zhang, Byung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.455-457
    • /
    • 2003
  • DNA microarray는 분자생물학에서 널리 사용되고 있는 실험 도구로써 크게 cDNA와 oligonucleotide microarray로 나뉘어진다. DNA microarray는 일련의 DNA 서열로 이루어진 probe들의 집합으로 구성되며 알려지지 않은 서열과의 hybridization 과정을 통해 특정 서열을 인식할 수 있게 된다. O1igonucieotide microarray는 cDNA 방법과는 다르게 probe를 구성하는 서열을 제작자가 임의로 구성할 수 있기 때문에 목표 서열이 가지는 고유한 부분만을 probe 서열로 사용함으로써 비용절감과 실험의 정확도를 높일 수 있다는 장점이 있다. 그러나 현재 목표 유전자 서열에 대해 probe 집합을 생성하는 결정적인 방법은 존재하지 않으며, 따라서 넓은 해 공간에서 효과적으로 최적 해를 찾아 주는 진화 연산이 probe 선택을 위한 좋은 대안으로 사용될 수 있다[1.2]. 그러나 진화연산을 이용한 probe 선택방법에 있어서 인식하고자 하는 목표 서열의 개수가 많아질 경우, 해 공간의 크기가 커짐으로 인해 문제점이 발생할 수 있다. 따라서 본 논문에서는 다수의 목표 유전자 서열을 대상으로 한 probe 선택 방법에 일어서 보다 효율적인 진화연산 접근 방법을 소개한다. 제시된 방법은 인식하고자 하는 목표 서얼의 일부를 선택해 이를 probe 집합의 후보로 사용하며. 유전 연산자를 이용한 진화과정을 통해 최적에 가까운 probe 집합을 찾는다. 본 논문은 GenBank로부터 유전자 서열을 대상으로 제안된 방법을 실험하였으며, 축소된 목표 서열만을 이용해 probe 집합을 선택하더라도 적합한 probe 집합을 찾을 수 있었다.

  • PDF