• Title/Summary/Keyword: 유전자 구조 예측

Search Result 98, Processing Time 0.026 seconds

The Architecture and Identification Algorithm of Self-Organizing Polynomial Neural Networks by GAs (유전자 알고리즘에 의한 자기구성 다항식 뉴럴 네트워크의 구조 및 동정 알고리즘)

  • 박호성;오성권
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.434-437
    • /
    • 2004
  • 본 논문에서는 유전자 알고리즘에 기반을 둔 자기구성 다항식 뉴럴네트워크(Self-Organizing Polynomial Neural Networks: SOPNN)의 새로운 구조를 제안하고, 포괄적인 설계 방법론을 토의한다. 기존의 자기구성 다항식 뉴럴 네트워크는 확장된 GMDH 방법에 기반을 두며, 네트워크의 성장과정을 통하여 각 충의 다항식 뉴런에서 고정된 노드 입력들의 수 뿐만 아니라 다항식 차수(1차, 2차, 그리고 수정된 2차식)를 이용하였다. 더구나, 그 방법은 학습을 통해 생성된 SOPNN이 최적 네트워크 구조를 가진다는 것을 보증하지 못한다. 그러나, 제안된 GA 기반 SOPNN은 그 구조를 구조적으로 더 최적화된 네트워크가 되도록 하고, 기존의 SOPNN보다 훨씬 더 유연하고, 선호된 뉴럴 네트워크가 되도록 한다. 구조적으로 더 최적화된 SOPNN을 생성하기 위해, SOPNN의 각 단계에서의 GA기반 설계 절차는 SOPNN내에서 이용할 수 있는 다음의 최적 파라미터들- 즉 입력변수의 수, 입력변수, 및 다항식 차수-을 가진 선호된 노드들의 선택으로 이끈다. 하중계수를 가진 합성성능지수가 그 모델의 근사화 및 일반화(예측) 능력 사이의 상호 균형을 얻기 위해 제안된다. 상세 설계 절차가 상세히 토의된다.

  • PDF

Evaluation of Geotechnical Parameters Based on the Design of Optimal Neural Network Structure (최적의 인공신경망 구조 설계를 통한 지반 물성치 추정)

  • Park Hyun-Il;Hwang Dae-Jin;Kweon Gi-Chul;Lee Seung-Rae
    • Journal of the Korean Geotechnical Society
    • /
    • v.21 no.9
    • /
    • pp.25-34
    • /
    • 2005
  • This paper proposes a selection methodology composed of neural network (NN) and genetic algorithm (GA) to design optimal NN structure. We combine the characteristics of GA and NN to reduce the computational complexity of artificial intelligence applications and increase the precision of NN' prediction in the design of NN structure. Genetic selection approach of design parameters of NN is introduced to obtain optimal NN structure. Analyzed results for geotechnical problems are given to evaluate the performance of the proposed hybrid methodology.

Design and Application of Genetic-Fuzzy System based on Grammatical Encoding (문법 코딩에 기반한 유전적 퍼지 시스템의 설계 및 응용)

  • Gil, Jun-Min;Go, Myeong-Suk;Hwang, Jong-Seon
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.1
    • /
    • pp.31-45
    • /
    • 2001
  • 퍼지 시스템의 설계시, 퍼지 시스템의 성능 저하 없이 최적의 퍼지 규칙 선택과 퍼지 소속 함수의 단순한 정의는 매우 중요하다. 이러한 목적을 이루기 위해서, 본 논문에서는 입력 공간에 강한 영향을 보이는 퍼지 규칙만을 퍼지 규칙으로 선택함으로써 입력 공간의 증가에 유연하게 대처할 수 있는 퍼지 규칙 구조를 제안한다. 또한, 유전자 알고리즘의 진화 탐색을 통하여 퍼지 시스템의 최적화된 구조를 얻기 위해서 퍼지 시스템의 구조를 생성시키는 문법 규칙을 해개체로 코딩하는 문법 코딩을 이용한 유전적 퍼지 시스템을 제안한다. 문법 규칙은 퍼지 규칙의 복잡한 구조를 단순한 모듈 구조로 표현하므로 문법 규칙의 코딩은 유전자 알고리즘의 빠른 수렴과 효율적인 탐색을 보장한다. 아울러, 제안하는 방법을 많은 입력 공간을 갖는 아이리스 데이타(Iris data) 문제와 시간열 예측(time series prediction) 문제에 적용함으로써 제안하는 방법의 응용성을 보이고 성능을 분석한다. 실험 결과, 제안하는 방법이 직접 코딩을 사용한 다른 설계 방법보다 더 좋은 성능을 보여 주었다.

  • PDF

Pickprimer: A Graphic User Interface Program for Primer Design on the Gene Target Region (픽프라이머 : 유전자 목표 구간 탐색 모듈을 포함한 프라이머 제작 그래픽 프로그램)

  • Chung, Hee;Mun, Jeong-Hwan;Lee, Seung-Chan;Yu, Hee-Ju
    • Horticultural Science & Technology
    • /
    • v.29 no.5
    • /
    • pp.461-466
    • /
    • 2011
  • In genetic and molecular breeding studies of plants, researchers need to design various kinds of primers based on their research purposes. So far many kinds of web- or script-based non-commercial programs for primer design are available. Because most of them do not include user interface for multipurpose usage including gene structure prediction and direct target selection on sequences, it has been a laborious work to design primers targeting on the exon or intron regions of interesting genes. Here we report a primer designing graphic user interface program, Pickprimer, that includes gene structure prediction and primer design modules by combining source codes of the Spidey and Primer3 programs. This program provides simple graphic user interface to input sequences and design primers. Genomic sequence and mRNA or coding sequence of genes can be copy and pasted or input as fasta or text files. Based on alignment of the input sequences using the Spidey module, a putative gene structure is graphically visualized along with exon-intron sequences of color codes. Primer design can be easily performed by dragging mouse on the displayed sequences or input primer targeting position with desirable values of primers. The output of designed primers with detailed information is provided by the Primer3 module. PCR evaluation of 24 selected primer sets successfully amplified single amplicons from six Brassica rapa cultivars. The Pickprimer will be a convenient tool for genetic and molecular breeding studies of plants.

Predicting Transmembrane $\alpha$-helix protein with SVM and HMM (SVM과 HMM을 이용한 $\alpha$-Helix 막횡단 단백질 예측)

  • 송철환;유성준;김민경;설영주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.817-819
    • /
    • 2003
  • 현재 바이오인포매틱스(Bioinformatics) 분야에서 가장 중요한 부분 중의 하나는 유전자 및 단백질의 구조와 기능을 정확하게 예측하는 것이다. 이는 질병 치료 및 신약개발에 유용하여 이로부터 나온 결과로부터 경제적 산업적 효과를 기대할 수 있다. 이 논문에서는 기계학습(Machine Learning)의 한 분야인 SVM(Support Vector Machine)과 HMM(Hidden Markov Model)를 결합하여 단백질의 막횡단(Transmembrane) $\alpha$-Helix 단백질 지역을 예측하는 새로운 알고리즘을 개발, 구현 및 실험하였다. 그 결과 이 두 가지 알고리즘이 결합된 방식을 사용함으로써 성능을 향상 시킬 수 있음을 증명했다.

  • PDF

An Improved Probe Selection Algorithm for Large Genomes (대규모 염색체들을 위한 개선된 Probe 선택 알고리즘)

  • Kwon, Young-Dae;Park, Kyoung-Wook;Lim, Hyeong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.1045-1048
    • /
    • 2005
  • 유전자 칩의 정확성은 각 유전자들의 식별자로 활용되는 probe들에 의해 결정된다. 일반적으로 칩을 구성하는 probe들은 반응 오류를 예측하기 위해 이중구조와 녹는점과 같은 요소들을 고려한다. 또한 다른 유전자들과의 교차반응을 최소화하기 위해 각 probe들의 specificity도 고려되어야 한다. probe가 specificity를 보장하는지 검증하는 것은 전체 유전자들을 탐색해야 하므로 대규모 인간염색체에 대해서는 많은 시간이 소요된다. 본 논문에서는 specificity를 만족하는 probe들을 선택하는 효율적인 알고리즘을 제시한다. 제시한 알고리즘은 해시 테이블을 활용하여 probe가 specificity를 만족하지 못하게 하는 유전자 시퀀스들만을 탐색하여 비교한다. 제시한 알고리즘이 기존 알고리즘보다 효율적임을 실험결과를 통해 보인다.

  • PDF

Research for novel clustering algorithm for protein functional analysis (단백질의 기능 분석을 위한 클러스터링 알고리즘 연구)

  • Han, Seok-Hyeon;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.737-740
    • /
    • 2015
  • 유전자의 기능분석이 필요한 유전자 데이터의 양의 증가로 기능분석을 위한 다양한 연구들이 진행되고 있다. 단백질의 기능과 구조가 밝혀지지 않은 새로운 단백질들의 그 기능을 예측하기 위해 제안된 가중치를 제안하여 새로운 클러스터링 알고리즘을 개발하였다. 단백질의 기능을 계통에 따라 구별하고 있는 pfam의 protein family database를 이용하여 기능을 알지 못하는 단백질에 대해 protein family를 분류하는 방법을 제안하고, 이미 알고있는 데이터를 이용하여 제안된 방법의 기능분석 및 성능을 평가하고자 한다.

Learning miRNA scoring models using base IUPAC code (염기의 IUPAC 코드를 이용한 miRNA Scoring Model의 학습)

  • 이화진;남진우;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.775-777
    • /
    • 2003
  • miRNA(microRNA)는 길이가 약 22nt 정도 되는 작은 ncRNA로서 유전자 작용을 조절하는데 중요한 역할을 하는 것으로 알려져 있다. 다이서(dicer)에 의해 성숙한 miRNA(mature miRNA)를 계산학적(computational)방법으로 학습하여 인간 miRNA의 구조를 예측하였다. miRNA에 관한 구체적인 기작은 아직 확실히 밝혀지지 않았기 때문에 서열 기반과 구조 기반 모두를 포함 하는 모델을 구현 하였으며 ambiguity code를 씀으로써 정보의 손실을 최소화 하도록 하였다. miRNA와 비슷한 구조를 가진 인간 EST로부터 데이터를 무작위 추출하여 실제 인간 miRNA 데이터와 비교함으로써 학습된 결과의 성능을 평가하였다.

  • PDF

Development of Hazard-Level Forecasting Model using Combined Method of Genetic Algorithm and Artificial Neural Network at Signalized Intersections (유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형 개발에 관한 연구)

  • Kim, Joong-Hyo;Shin, Jae-Man;Park, Je-Jin;Ha, Tae-Jun
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.30 no.4D
    • /
    • pp.351-360
    • /
    • 2010
  • In 2010, the number of registered vehicles reached almost at 17.48 millions in Korea. This dramatic increase of vehicles influenced to increase the number of traffic accidents which is one of the serious social problems and also to soar the personal and economic losses in Korea. Through this research, an enhanced intersection hazard prediction model by combining Genetic Algorithm and Artificial Neural Network will be developed in order to obtain the important data for developing the countermeasures of traffic accidents and eventually to reduce the traffic accidents in Korea. Firstly, this research has investigated the influencing factors of road geometric features on the traffic volume of each approaching for the intersections where traffic accidents and congestions frequently take place and, a linear regression model of traffic accidents and traffic conflicts were developed by examining the relationship between traffic accidents and traffic conflicts through the statistical significance tests. Secondly, this research also developed an intersection hazard prediction model by combining Genetic Algorithm and Artificial Neural Network through applying the intersection traffic volume, the road geometric features and the specific variables of traffic conflicts. Lastly, this research found out that the developed model is better than the existed forecasting models in terms of the reliability and accuracy by comparing the actual number of traffic accidents and the predicted number of accidents from the developed model. In conclusion, it is expect that the cost/effectiveness of any traffic safety improvement projects can be maximized if this developed intersection hazard prediction model by combining Genetic Algorithm and Artificial Neural Network use practically at field in the future.

NOGSEC: A NOnparametric method for Genome SEquence Clustering (녹섹(NOGSEC): A NOnparametric method for Genome SEquence Clustering)

  • 이영복;김판규;조환규
    • Korean Journal of Microbiology
    • /
    • v.39 no.2
    • /
    • pp.67-75
    • /
    • 2003
  • One large topic in comparative genomics is to predict functional annotation by classifying protein sequences. Computational approaches for function prediction include protein structure prediction, sequence alignment and domain prediction or binding site prediction. This paper is on another computational approach searching for sets of homologous sequences from sequence similarity graph. Methods based on similarity graph do not need previous knowledges about sequences, but largely depend on the researcher's subjective threshold settings. In this paper, we propose a genome sequence clustering method of iterative testing and graph decomposition, and a simple method to calculate a strict threshold having biochemical meaning. Proposed method was applied to known bacterial genome sequences and the result was shown with the BAG algorithm's. Result clusters are lacking some completeness, but the confidence level is very high and the method does not need user-defined thresholds.