• Title/Summary/Keyword: 유전자 분류

Search Result 744, Processing Time 0.041 seconds

A Study on the Training Optimization Using Genetic Algorithm -In case of Statistical Classification considering Normal Distribution- (유전자 알고리즘을 이용한 트레이닝 최적화 기법 연구 - 정규분포를 고려한 통계적 영상분류의 경우 -)

  • 어양담;조봉환;이용웅;김용일
    • Korean Journal of Remote Sensing
    • /
    • v.15 no.3
    • /
    • pp.195-208
    • /
    • 1999
  • In the classification of satellite images, the representative of training of classes is very important factor that affects the classification accuracy. Hence, in order to improve the classification accuracy, it is required to optimize pre-classification stage which determines classification parameters rather than to develop classifiers alone. In this study, the normality of training are calculated at the preclassification stage using SPOT XS and LANDSAT TM. A correlation coefficient of multivariate Q-Q plot with 5% significance level and a variance of initial training are considered as an object function of genetic algorithm in the training normalization process. As a result of normalization of training using the genetic algorithm, it was proved that, for the study area, the mean and variance of each class shifted to the population, and the result showed the possibility of prediction of the distribution of each class.

Evolution of sea Urchin Strongylocentrotus intermedius Based on DNA Sequences of a Mitochondrial Gene, Cytochrome c Oxidase Subunit I (미토콘드리아 유전자, 치토그롬 옥시다제(subunit I)의 염기서열을 이용한 새치성게(Strongylocentrotus intermedius)의 진화과정 분석)

  • Lee, Youn-Ho
    • The Sea:JOURNAL OF THE KOREAN SOCIETY OF OCEANOGRAPHY
    • /
    • v.5 no.2
    • /
    • pp.157-168
    • /
    • 2000
  • Sea urchin S. intermedius occurring in the Korean east coast is a cold water species that belongs to the family Strongylocentrotidae of Echinoidea. Although it is known that there are nine species in the family, species identification criteria, phylogenetic relationships, time and process of evolution of the family members have not been uncovered clearly. In the present study, I tried to find some clues to such problems for S. intermedius by means of DNA sequences. For this, cytochrome c oxidase subunit I (COI), one of the mitochondrial genes that evolve fast and follow maternal inheritance was analyzed. DNA was extracted from the female gonad of S. intermedius, a segment of COI gene amplified by polymerase chain reaction (PCR), and finally a total of 1077 base pair sequence of COI obtained by cloning and sequencing the PCR product. The sequence was compared with homologous genes of other sea urchins and echinoderm species. Phylogenetic trees of the COI gene segment revealed that S. intenedius is a sister species of S. purpuratus which lives along the east coast of the Paciflc. With reference to the fossil records of sea urchins and genetic distances in the molecular phylogenies, it is estimated that the two species were separated about 0.89 million years ago when the earth temperature fluctuated significantly. The current disjunct distribution patterns of the two species and the climate change of the earth at the time of separation suggest that speciation might have occurred by vicariance. The COI gene sequence obtained here now can be used as a molecular character which discerns S. intermedius from the other sea urchin species of Strongylocentrotidae.

  • PDF

COG 알고리즘으로 파악한 Proteobacteria의 보존적 유전자

  • Lee, Dong-Geun;Lee, Jin-Ok;Lee, Jae-Hwa
    • 한국생물공학회:학술대회논문집
    • /
    • 2003.04a
    • /
    • pp.715-718
    • /
    • 2003
  • A COG (clusters of orthologous groups of proteins) algorithm, protein similarities among genomes, was used to detect conserved genes and to figure out their relationships within 42 procaryote, 33 Bacteria and 16 Proteobacteria All analyzed procaryotes shared 75 COGs. COG0195, COG0358 and COG0528 were only represented by the 42 procaryotes. Sixty-four COGs were added as conserved genes in 33 eubacteria. Each Proteobacteria group has a unique repertoire of COGs. Metabolic COGs were more diverse in the beta-Proteobacteria group than in the other groups. The possibilities of detecting new biological molecules is high in phylogenetically related organisms, hence the identification of useful proteins by using this algorithm is possible.

  • PDF

Comparison of recently developed classification tools in microarray data analysis (마이크로어레이자료분석에서의 최신 분류방법들의 비교연구)

  • Lee, Jae-Won;Lee, Jeong-Bok;Park, Mi-Ra
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.99-104
    • /
    • 2002
  • cDNA 마이크로어레이자료를 이용한 분류방법은 수많은 유전자의 발현을 동시에 모니터링 할 수 있으므로 특정 질병간의 분자생물학적 변이를 이해하는데 있어 기존의 분류방법보다 신뢰성이 훨씬 높을 것으로 기대되고 있다 최근에 Dudoit et al.(2001)은 cDNA 마이크로어레이를 이용한 유전자발현자료의 분석에 있어 분류를 위한 여러 고전적인 판별분류기법 및 최근에 개발된 기법들을 비교, 평가하였다. 본 논문에서는 Dudoit et al.(2001)에서 다루지 않았던 많은 최신 기법들을 포함하여 인간의 종양 자료뿐만이 아니라 농작물을 포함한 동식물 자료에 적용하여 보다 폭넓은 비교연구를 하였다.

  • PDF

Classification of Gene Expression Profiles Using Common Features Selected (공통 선택된 특징을 이용한 유전 발현 데이터의 분류)

  • Park, Chan-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.351-354
    • /
    • 2002
  • 최근 생명공학 기술과 분석화학 기술의 발달로 생물 유전 데이터를 대량으로 얻는 것이 가능하게 되었다. 아울러 이렇게 얻어진 데이터를 적절하게 처리하고 분석하는 방법들도 여러 가지가 소개되어 왔다. 본 논문에서는 DNA 마이크로어레이 정보를 분류하기 위하여 세 가지 데이터에 대하여 여러 가지 특징 전혀 방법으로 선택된 유전자들을 사용하여 신경망 분류기에 적용시켜 보았다. 실험 결과 백혈병 데이터의 경우 피어슨 상관계수를 이용한 분류가 97.1%로 가장 높은 인식률을 보여주었다. 한편 여러 가지 특징 선택 방법에 의하여 공통적으로 선택된 유전자를 사용하여 분류하면 더 높은 인식률이 나올 것 같았지만 실제로는 기대에 못 미치는 성과를 보여주었다. 따라서 무조건 여러 번 선택된 특징을 선택하기 보다는 특징들끼리의 상관관계를 고려하여 선택하는 방법이 필요할 것이다.

  • PDF

Feature Selection for Bio Named Entity Recognition from Biological Literature (바이오 문헌에서의 단백질, 유전자 객체 인식을 위한 특징 추출)

  • Kim, Tae-Wook;Li, Meijing;Tsendsuren, Munkhdalai;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.166-168
    • /
    • 2012
  • 바이오 문헌으로부터의 의미 있는 객체 추출 및 상호작용 관계 추출은 수 많은 바이오 문헌으로부터 유용한 정보를 얻기 위한 필수적인 과정이다. 특히 문헌으로부터 유전자 또는 단백질 이름과 같은 바이오 객체를 정확하게 인지하는 것은 새로운 객체인식의 어려움과 객체를 찾기 위한 특징 패턴의 다양성으로 인해 도전적인 과제로 남아있다. 본 논문에서는 전처리 과정을 거친 문헌 데이터로부터 12개의 의미 있는 속성들을 선택하였다. 선택된 속성에 데이터마이닝 기법중 하나인 속성 추출 기법을 적용하여 객체를 분류하는데 있어 의미 있는 속성들을 추출하였다. 특징 추출 방법과 분류 알고리즘이 분류 성능에 미치는 영향을 평가하기 위해 각 방법의 정확도를 사용하여 분류 성능을 비교였으며, Gain Ratio Attribute Evaluation과 Symmetrical Uncertainty Attribute Evaluation 기법에 의해 추출된 속성이 가장 정확한 분류 성능을 보여주었다.

Two-level Classification for Large-scale Fingerprint Identification System (대규모 지문식별시스템을 위한 2단계 분류)

  • 민준기;윤은경;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.730-732
    • /
    • 2004
  • 지문인식시스템은 크게 지문의 특징 추출단계, 입력지문과 유사한 후보지문을 찾는 검색단계, 마지막으로 입력지문과 후보지문들 간의 동일성을 판단하는 검증단계의 세 부분으로 나뉠 수 있다. 그리고 대규모 지문 데이터베이스를 기반으로 인식시스템을 구축하는 경우, 지문인식의 정확성과 더불어 신속성도 함께 고려해야 한다. 본 논문에서는 지문인식시스템의 전체 성능 향상을 위해 분류 단계에서의 개선방안으로 유전자알고리즘 기반의 특징 선택과 이의 조합을 다중분류기로 구축하는 2단계분류방법을 제안한다. NIST 데이터베이스 4에 대하여 실험한 결과 기존연구의 결과에 필적하는 분류율을 나타냈으며, 유전자알고리즘을 통해 적합한 방향성 조합을 제시할 수 있었다.

  • PDF

Web Service Information Clustering using Genetic Algorithm and Neural Network (유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링)

  • 황중연;유춘식;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.127-129
    • /
    • 2004
  • 오늘날, 웹서비스를 이용한 정보 검색을 하기 위해서는 UDDI 레지스트리의 전문적인 지식이 필요하다. 즉 웹 서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야 한다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하면 웹서비스에 대한 정보 검색을 쉽게 할 수 없다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 점보를 카테고리에 맞게 분류하여 검색을 용이하게 할 수가 있다. 따라서 본 논문에서는 보다 효율적으로 웹서비스 정보를 분류하기 위해서 유전자 알고리즘과 신경망을 이용한 클러스터링 기법을 제안하는데 목적이 있다.

  • PDF

Classification of Abstract Images using Digital Chromosome (디지털 유전자를 사용하는 추상 이미지의 분류)

  • Seo, Dongsu;Lee, Hyeli
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.870-874
    • /
    • 2009
  • Genetic algorithms can be effectively used when generating abstract images in an automatic way. However, managing huge number of automatically generated images has been problematic without sufficient managing mechanisms. This paper presents effective classification scheme for the abstract Affine images using form, emotion and color facets, and implements image databases.

  • PDF

An analysis of microarray gene expression using FST (FST를 이용한 마이크로어레이 유전자발현에 관한 해석)

  • Choe, Gyeong-Ok;Jeong, Hwan-Muk
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.77-80
    • /
    • 2007
  • 현재 생명공학은 급속도로 발전하고 있으며, 이를 통해 만들어지는 생물정보의 양은 기하급수적으로 늘어나고 있다. 이러한 것을 가능하게 하는 기술 중의 하나인 마이크로어레이 기법은 현재 질병의 진단 및 신약 개발 등을 위해 사용되고 있다. 마이크로어레이 유전자 발현에 관한 분석은 크게 유의한 유전자 추출, 클러스터링, 분류 및 유전자 네트워크 구축 등으로 볼 수 있다. 유의한 유전자 식별을 위한 통계학적 방법으로 T-test 및 Wilcoxon Rank Sum test 등이 있다. 최근에는 수정인자를 추가하거나 혹은 퍼지이론 등의 지능정보 이론을 추가하여 그 계산결과를 좀 더 상세화하고 세분화하는 연구들이 계속되고 있다. 본 논문에서는 두 개의 그룹에서 발현된 유전자들 중 유의하게 발현되는 유전자를 식별하기 위한 방법으로 퍼지이론을 도입하여 유의한 유전자를 규명하는 FST(Fuzzy Significance Test) 방법을 제안한다.

  • PDF