• 제목/요약/키워드: Gene Algorithm

검색결과 230건 처리시간 0.024초

Simultaneous Optimization of Gene Selection and Tumor Classification Using Intelligent Genetic Algorithm and Support Vector Machine

  • Huang, Hui-Ling;Ho, Shinn-Ying
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.57-62
    • /
    • 2005
  • Microarray gene expression profiling technology is one of the most important research topics in clinical diagnosis of disease. Given thousands of genes, only a small number of them show strong correlation with a certain phenotype. To identify such an optimal subset from thousands of genes is intractable, which plays a crucial role when classify multiple-class genes express models from tumor samples. This paper proposes an efficient classifier design method to simultaneously select the most relevant genes using an intelligent genetic algorithm (IGA) and design an accurate classifier using Support Vector Machine (SVM). IGA with an intelligent crossover operation based on orthogonal experimental design can efficiently solve large-scale parameter optimization problems. Therefore, the parameters of SVM as well as the binary parameters for gene selection are all encoded in a chromosome to achieve simultaneous optimization of gene selection and the associated SVM for accurate tumor classification. The effectiveness of the proposed method IGA/SVM is evaluated using four benchmark datasets. It is shown by computer simulation that IGA/SVM performs better than the existing method in terms of classification accuracy.

  • PDF

A GENETIC ALGORITHM BY USE OF VIRUS EVOLUTIONARY THEORY FOR SCHEDULING PROBLEM

  • Saito, Susumu
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2001년도 The Seoul International Simulation Conference
    • /
    • pp.365-370
    • /
    • 2001
  • The genetic algorithm that simulates the virus evolutionary theory has been developed applying to combinatorial optimization problems. The algorithm in this study uses only one individual and a population of viruses. The individual is attacked, inflected and improved by the viruses. The viruses are composed of flour genes (a pair of top gene and a pair of tail gene). If the individual is improved by the attacking, the inflection occurs. After the infection, the tail genes are mutated. If the same virus attacks several times and fails to inflect, the top genes of the virus are mutated. By this mutation, the individual can be improved effectively. In addition, the influence of the immunologic mechanism on evolution is simulated.

  • PDF

유전자 알고리즘을 이용한 프로모터 영역의 전사인자 결합부위 패턴 탐색 ((Pattern Search for Transcription Factor Binding Sites in a Promoter Region using Genetic Algorithm))

  • 김기봉;공은배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.487-496
    • /
    • 2003
  • 유전자 발현에 매우 중요한 신호역할을 하는 프로모터 영역은 여러 전사인자들이 결합하는 특정 부위들을 갖고 있다. 전사인자의 결합부위는 프로모터의 다양한 부위에 위치하며, 진화론적으로 잘 보존된 Consensus 형태의 염기서열 패턴을 띠고 있다. 본 논문은 이러한 최적의 패턴들을 탐색하기 위해 유전자 알고리즘을 기반으로 하면서, 동시에 MEME 알고리즘의 N-occurrence-per-dataset 모델의 가정과 패턴의 길이를 결정할 수 있는 Wataru 방법의 장점을 따르는 새로운 방법을 제시하고 있다. 이러한 탐색 방법은 유전체 연구자들이 임의의 DNA 염기서열 상에서 프로모터 영역을 예측하거나 특정 전사인자의 결합부위를 탐색하는데 적극 활용할 수 있다.

The Sliding Window Gene-Shaving Algorithm for Microarray Data Analysis

  • 이혜선;최대우;전치혁
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2002년도 제1차워크샵
    • /
    • pp.139-152
    • /
    • 2002
  • Gene-shaving(Hastie et al, 2000) is a very useful method to identify a meaningful group of genes when the variation of expression is large. By shaving off the low-correlated genes with the leading principal component, the primary genes with the coherent expression pattern can be identified. Gene-shaving method works well If expression levels are varied enough, but it may not catch the meaningful cluster in low expression level or different expression time even with coherent patterns. The sliding window gene-shaving method which is to apply gene-shaving in each sliding window after hierarchical clustering is to compensate losing a meaningful set of genes whose variation is not large but distinct. The performance to identify expression patterns is compared for the simulated profile data by the different variance and expression level.

  • PDF

Consensus Clustering for Time Course Gene Expression Microarray Data

  • Kim, Seo-Young;Bae, Jong-Sung
    • Communications for Statistical Applications and Methods
    • /
    • 제12권2호
    • /
    • pp.335-348
    • /
    • 2005
  • The rapid development of microarray technologies enabled the monitoring of expression levels of thousands of genes simultaneously. Recently, the time course gene expression data are often measured to study dynamic biological systems and gene regulatory networks. For the data, biologists are attempting to group genes based on the temporal pattern of their expression levels. We apply the consensus clustering algorithm to a time course gene expression data in order to infer statistically meaningful information from the measurements. We evaluate each of consensus clustering and existing clustering methods with various validation measures. In this paper, we consider hierarchical clustering and Diana of existing methods, and consensus clustering with hierarchical clustering, Diana and mixed hierachical and Diana methods and evaluate their performances on a real micro array data set and two simulated data sets.

더미 다중인자 차원축소법에 의한 검증력과 주요 유전자 규명 (Power and major gene-gene identification of dummy multifactor dimensionality reduction algorithm)

  • 여정수;라부미;이호근;이성원;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.277-287
    • /
    • 2013
  • 광범위 유전자 관련 연구에서는 유전자-유전자 상호작용을 규명하는 것은 매우 중요하다. 최근 유전자-유전자 상호작용을 규명하는데에 대한 많은 연구가 진행되고 있다. 그 중 하나로 더미 다중인자 차원축소법이다. 이 연구의 목적은 모의실험을 통해 유전자-유전자 상호작용 파악하기 위한 더미 다중인자 차원축소의 검증력을 평가하는 것이다. 또한 이 방법을 적용하여 한우모집단에서 경제형질을 위한 단일 염기 다형성의 상호작용 효과를 확인하였다.

진화 알고리즘을 사용한 복수 염기서열 정렬 (Multiple Sequence Aligmnent Genetic Algorithm)

  • 김진;송민동;최홍식;장연아
    • 미생물학회지
    • /
    • 제35권2호
    • /
    • pp.115-120
    • /
    • 1999
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 복수 염기서열 정렬은 염기서열들 사이의 진화관계, gene regulation, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 복수 염기서열 정렬을 얻기 위한 기존의 방법은 progressive pairwise alignment 와같이 빠른 실행시간 내에 만족할 만한 복수 염기서열 정렬을 제공하는 방법과, 최적의 복수 여기서열 정렬을 제공하나 실행시간이 상대적으로 긴 dynamic programming 과 같은 방법 등이 있다. 본 논문에서는 진화 알고리즘을 사용하여 기존의 방법에서 제공하는 복수 염기서열 정렬을 짧은 시간내에보다 개선된 복수 염기서열 정렬을 획득하게 하는 방법을 제시하였으며, 진화 알고리즘의 구성내용을 설명하였으며, 실제의 염기서열을 사용하여 이 방법의 장점을 보였다.

  • PDF

연속형자료의 유전자 상호작용 규명을 위한 SVM MDR과 D-MDR의 방법 비교 (A Comparison Study on SVM MDR and D-MDR for Detecting Gene-Gene Interaction in Continuous Data)

  • 이종형;이제영
    • Communications for Statistical Applications and Methods
    • /
    • 제18권4호
    • /
    • pp.413-422
    • /
    • 2011
  • 유전학에서 유전자 상호작용효과 규명을 위한 방법으로 비모수적인 방법인 Multifactor Dimensionality Reduction(MDR) 방법이 제안되어 현재까지 사용되고 있다. MDR 방법은 이분형 자료에 적합한 방법으로 연속형 자료에는 적용할 수 없는 단점이 있다. 이러한 한계를 극복하기 위해서 Dummy MDR(D-MDR) 방법 그리고 SVM을 활용한 MDR(SVM MDR) 방법 등이 제안 되었다. 본 논문에서는 연속형 자료에 적용 가능한 SVM MDR 방법과 D-MDR 방법을 비교하고, 실제 한우 데이터에 두 방법에 적용한다. 그리고 각 방법의 적용결과를 바탕으로 한우의 종합경제형질에 영향을 주는 유전자 상호작용 조합을 규명한다. 그리고 마지막으로 기존의 SVM MDR 방법과 D-MDR 방법의 장단점 비교를 통해서 추후 새로운 연구방향을 제시한다.

빈발 유전자 발현 패턴과 연쇄 규칙을 이용한 유전자 조절 네트워크 구축 (Constructing Gene Regulatory Networks using Frequent Gene Expression Pattern and Chain Rules)

  • 이헌규;류근호;정두영
    • 정보처리학회논문지D
    • /
    • 제14D권1호
    • /
    • pp.9-20
    • /
    • 2007
  • 유전자들의 그룹은 복잡한 상호작용들을 통해 세포의 기능이 조절되며 이러한 상호작용을 하는 유전자 그룹들을 유전자 조절 네트워크 (GRNs: Gene Regulatory Networks)라고 한다. 이전의 유전자 발현 분석 기법인 군집화와 분류는 단지 상동성에 의한 유전자들 사이의 소속을 결정하는 데에는 유용하나 분자 활동에서의 같은 클래스에서 발견되어지는 유전자들 사이의 조절 관계를 식별할 수 없다. 더욱이 유전자들이 어떻게 연관되는 지와 유전자들이 서로 어떻게 조절하는지에 대한 매커니즘의 이해가 필요하다. 따라서 이 논문에서는 시계열 마이크로어레이 데이터로부터의 유전자들의 조절 관계를 발견하기 위해서 빈발 패턴 마이닝과 연쇄 규칙을 이용한 새로운 접근법을 제안하였다. 이 기법에서는 먼저, 빈발 패턴 마이닝 적용을 위한 적절한 데이터 변환 방법을 제안하였고 FP-growth을 이용하여 유전자 발현 패턴들을 발견한다. 그런 다음, 연쇄 규칙을 이용하여 빈발한 유전자 패턴들로부터 유전자 조절 네트워크를 구축하였다. 마지막으로 제안된 기법의 검증은 공개된 유전자들의 조절 관계와 실험 결과의 일치함을 보임으로써 평가하였다.

서픽스트리 클러스터링 방법과 블라스트를 통합한 유전자 서열의 클러스터링과 기능검색에 관한 연구 (A Study on Clustering and Identifying Gene Sequences using Suffix Tree Clustering Method and BLAST)

  • 한상일;이성근;김경훈;이주영;김영한;황규석
    • 제어로봇시스템학회논문지
    • /
    • 제11권10호
    • /
    • pp.851-856
    • /
    • 2005
  • The DNA and protein data of diverse species have been daily discovered and deposited in the public archives according to each established format. Database systems in the public archives provide not only an easy-to-use, flexible interface to the public, but also in silico analysis tools of unidentified sequence data. Of such in silico analysis tools, multiple sequence alignment [1] methods relying on pairwise alignment and Smith-Waterman algorithm [2] enable us to identify unknown DNA, protein sequences or phylogenetic relation among several species. However, in the existing multiple alignment method as the number of sequences increases, the runtime increases exponentially. In order to remedy this problem, we adopted a parallel processing suffix tree algorithm that is able to search for common subsequences at one time without pairwise alignment. Also, the cross-matching subsequences triggering inexact-matching among the searched common subsequences might be produced. So, the cross-matching masking process was suggested in this paper. To identify the function of the clusters generated by suffix tree clustering, BLAST was combined with a clustering tool. Our clustering and annotating tool is summarized as the following steps: (1) construction of suffix tree; (2) masking of cross-matching pairs; (3) clustering of gene sequences and (4) annotating gene clusters by BLAST search. The system was successfully evaluated with 22 gene sequences in the pyrubate pathway of bacteria, clustering 7 clusters and finding out representative common subsequences of each cluster