• 제목/요약/키워드: promoter prediction

검색결과 32건 처리시간 0.028초

PromoterWizard: An Integrated Promoter Prediction Program Using Hybrid Methods

  • Park, Kie-Jung;Kim, Ki-Bong
    • Genomics & Informatics
    • /
    • 제9권4호
    • /
    • pp.194-196
    • /
    • 2011
  • Promoter prediction is a very important problem and is closely related to the main problems of bioinformatics such as the construction of gene regulatory networks and gene function annotation. In this context, we developed an integrated promoter prediction program using hybrid methods, PromoterWizard, which can be employed to detect the core promoter region and the transcription start site (TSS) in vertebrate genomic DNA sequences, an issue of obvious importance for genome annotation efforts. PromoterWizard consists of three main modules and two auxiliary modules. The three main modules include CDRM (Composite Dependency Reflecting Model) module, SVM (Support Vector Machine) module, and ICM (Interpolated Context Model) module. The two auxiliary modules are CpG Island Detector and GCPlot that may contribute to improving the predictive accuracy of the three main modules and facilitating human curator to decide on the final annotation.

유전자 프로모터 예측을 위한 Support Vector Machine의 응용 방법에 대한 연구 (A Study On the Application Methods of a Support Vector Machine for Gene Promoter Prediction.)

  • 김기봉
    • 생명과학회지
    • /
    • 제17권5호
    • /
    • pp.714-718
    • /
    • 2007
  • 유전자의 구조 예측 및 발현 기작에 대한 연구는 매우 중요한 사안으로 대두되고 있다. 특히 유전자 발현 제어에 중요한 역할을 하는 프로모터 영역을 예측하는 것은 전체 생명체 네트워크 규명을 위한 단초를 제공하기 때문에 많은 연구가 이루어지고 있다. 본 논문에서는 이러한 진핵생물의 유전자 프로모터 예측을 위한 Support Vector Machine(SVM) 활용방안에 대한 연구내용을 다루고 있다. 특성 벡터 값 생성을 위한 인코딩 방법 및 학습 데이터들의 구성에 대한 다양한 실험을 통해 SVM활용 방안에 대한 올바른 방향을 제시하고 있다.

유전자 알고리즘을 이용한 Promoter 예측 (Promoter Prediction using Genetic Algorithm)

  • 오민경;김창훈;김기봉;공은배;김승목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.12-14
    • /
    • 1999
  • Promoter는 transcript start site 앞부분에 위치하여 RNA polymerase가 높은 친화성을 보이며 바인당하는 DNA상의 특별한 부위로서 여기서부터 DNA transcription이 시작된다. function이나 tissue-specific gene들의 그룹별로 그 promoter들의 특이한 패턴들의 조합을 발견함으로써 Specific한 transcription을 조절하는 것으로 알려져 있어 promoter로 인한 그 gene의 정보를 어느 정도 알 수가 있다. 사람의 housekeeping gene promoter들을 EPD(eukaryotic promoter database)와 EMBL nucleic acid sequence database로부터 수집하여 이것들 간에 의미 있게 나타나는 모든 패턴들을 optimization algorithm으로 알려진 genetic algorithm을 이용해서 찾아보았다.

  • PDF

유전자 알고리즘과 일반화된 회귀 신경망을 이용한 프로모터 서열 분류 (Promoter Classification Using Genetic Algorithm Controlled Generalized Regression Neural Network)

  • 김성모;김근호;김병환
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권7호
    • /
    • pp.531-535
    • /
    • 2004
  • A new method is presented to construct a classifier. This was accomplished by combining a generalized regression neural network (GRNN) and a genetic algorithm (GA). The classifier constructed in this way is referred to as a GA-GRNN. The GA played a role of controlling training factors simultaneously. The GA-GRNN was applied to classify 4 different Promoter sequences. The training and test data were composed of 115 and 58 sequence patterns, respectively. The classifier performance was investigated in terms of the classification sensitivity and prediction accuracy. Compared to conventional GRNN, GA-GRNN significantly improved the total classification sensitivity as well as the total prediction accuracy. As a result, the proposed GA-GRNN demonstrated improved classification sensitivity and prediction accuracy over the convention GRNN.

Promoter classification using genetic algorithm controlled generalized regression neural network

  • Kim, Kun-Ho;Kim, Byun-Gwhan;Kim, Kyung-Nam;Hong, Jin-Han;Park, Sang-Ho
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.2226-2229
    • /
    • 2003
  • A new method is presented to construct a classifier. This was accomplished by combining a generalized regression neural network (GRNN) and a genetic algorithm (GA). The classifier constructed in this way is referred to as a GA-GRNN. The GA played a role of controlling training factors simultaneously. In GA optimization, neuron spreads were represented in a chromosome. The proposed optimization method was applied to a data set, consisted of 4 different promoter sequences. The training and test data were composed of 115 and 58 sequence patterns, respectively. The range of neuron spreads was experimentally varied from 0.4 to 1.4 with an increment of 0.1. The GA-GRNN was compared to a conventional GRNN. The classifier performance was investigated in terms of the classification sensitivity and prediction accuracy. The GA-GRNN significantly improved the total classification sensitivity compared to the conventional GRNN. Also, the GA-GRNN demonstrated an improvement of about 10.1% in the total prediction accuracy. As a result, the proposed GA-GRNN illustrated improved classification sensitivity and prediction accuracy over the conventional GRNN.

  • PDF

Quantitative Assessment of the Diagnostic Role of CDH13 Promoter Methylation in Lung Cancer

  • Zhong, Yun-Hua;Peng, Hao;Cheng, Hong-Zhong;Wang, Ping
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권3호
    • /
    • pp.1139-1143
    • /
    • 2015
  • In order to explore the association between cadherin 13 (CDH13) gene promoter methylation and lung carcinoma (LC) risk, we carried out a meta-analysis with searching of PubMed, Web of Science. Ultimately, 17 articles were identified and analysised by STATA 12.0 software. Overall, we found a significant relationship between CDH13 promoter methylation and LC risk (odds ratio=6.98, 95% confidence interval: 4.21-11.56, p<0.001). Subgroup analyses further revealed that LC risk was increased for individuals carrying the methylated CDH13 compared with those with unmethylated CDH13. Hence, our study identified a strong association between CDH13 gene promoter methylation and LC and highlighted a promising potential for CDH13 methylation in LC risk prediction.

난수발생기와 일반화된 회귀 신경망을 이용한 DNA 서열 분류 (DNA Sequence Classification Using a Generalized Regression Neural Network and Random Generator)

  • 김성모;김근호;김병환
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권7호
    • /
    • pp.525-530
    • /
    • 2004
  • A classifier was constructed by using a generalized regression neural network (GRU) and random generator (RG), which was applied to classify DNA sequences. Three data sets evaluated are eukaryotic and prokaryotic sequences (Data-I), eukaryotic sequences (Data-II), and prokaryotic sequences (Data-III). For each data set, the classifier performance was examined in terms of the total classification sensitivity (TCS), individual classification sensitivity (ICS), total prediction accuracy (TPA), and individual prediction accuracy (IPA). For a given spread, the RG played a role of generating a number of sets of spreads for gaussian functions in the pattern layer Compared to the GRNN, the RG-GRNN significantly improved the TCS by more than 50%, 60%, and 40% for Data-I, Data-II, and Data-III, respectively. The RG-GRNN also demonstrated improved TPA for all data types. In conclusion, the proposed RG-GRNN can effectively be used to classify a large, multivariable promoter sequences.

Backpropagation을 이용한 Promoter 예측 방법 (Prediction of promoter by Backpropagation)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1569-1572
    • /
    • 2003
  • 최근 생명공학 분야의 기술이 혁신적으로 발달함에 따라 게놈 프로젝트가 본래 계획보다 2년 앞당겨져 2003 년 4 월 인간 유전자의 완전한 서열을 밝히고 성공적으로 완료됨으로서 관련 연구자들은 인간의 유전자에 대한 대량의 서열 데이터를 얻게 되었다. 그래서 게놈 프로젝트의 다음 단계로서 엄청난 양의서열 정보 분석으로부터 유전자의 기능을 파악하고자 하는 연구들이 이미 세계적으로 활발히 진행되고 있다. 이러한 연구들의 최종적 목표는 질병 치료와 생명연장의 실현이라고 볼 수 있다. 유전자 연구를 위해선 우선 일차적으로 유전자 부위를 파악해야 한다. 유전자는 구조적으로 다시 여러 부분으로 나뉘는데 유전자 발현의 개시에 매우 중요한 요소 중 하나가 바로 프로모터 (Promoter) 이다. 프로모터 내에는 TATA box 가 있는데 이는 프로모터의 핵심 요소이다. 프로모터는 생명체의 종 그리고 RNA 중합효소의 종류에 따라 다르다. 이 논문에서는 다양한 신경망 알고리즘 중의 하나인 Backtpropagation 을 이용하여 밝혀지지 알은 서열에서 인간을 포함하는 원핵생물의 프로모터 서열을 예측할 수 있는 방법을 얻었기에 소개하고자 한다.

  • PDF

Modelling of starch industry wastewater microfiltration parameters by neural network

  • Jokic, Aleksandar I.;Seres, Laslo L.;Milovic, Nemanja R.;Seres, Zita I.;Maravic, Nikola R.;Saranovic, Zana;Dokic, Ljubica P.
    • Membrane and Water Treatment
    • /
    • 제9권2호
    • /
    • pp.115-121
    • /
    • 2018
  • Artificial neural network (ANN) simulation is used to predict the dynamic change of permeate flux during wheat starch industry wastewater microfiltration with and without static turbulence promoter. The experimental program spans range of a sedimentation times from 2 to 4 h, for feed flow rates 50 to 150 L/h, at transmembrane pressures covering the range of $1{\times}10^5$ to $3{\times}10^5Pa$. ANN predictions of the wastewater microfiltration are compared with experimental results obtained using two different set of microfiltration experiments, with and without static turbulence promoter. The effects of the training algorithm, neural network architectures on the ANN performance are discussed. For the most of the cases considered, the ANN proved to be an adequate interpolation tool, where an excellent prediction was obtained using automated Bayesian regularization as training algorithm. The optimal ANN architecture was determined as 4-10-1 with hyperbolic tangent sigmoid transfer function transfer function for hidden and output layers. The error distributions of data revealed that experimental results are in very good agreement with computed ones with only 2% data points had absolute relative error greater than 20% for the microfiltration without static turbulence promoter whereas for the microfiltration with static turbulence promoter it was 1%. The contribution of filtration time variable to flux values provided by ANNs was determined in an important level at the range of 52-66% due to increased membrane fouling by the time. In the case of microfiltration with static turbulence promoter, relative importance of transmembrane pressure and feed flow rate increased for about 30%.

의존성 반영 분해모델에 의한 유전자의 핵심 프로모터 영역 예측 (Prediction of Core Promoter Region with Dependency - Reflecting Decomposition Model)

  • 김기봉;박기정;공은배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.379-387
    • /
    • 2003
  • 다수의 미생물 유전체 프로젝트들이 완료되면서 엄청난 양의 유전체 핵산 염기서열 데이터들이 양산되고 있다. 이러한 상황에서 전산 기법을 이용하여 유전체 DNA 염기서열 상에서 유전자의 프로모터 영역을 규명하는 문제는 최근에 상당한 연구의 관심대상으로 떠오르고 있다. 본 논문에서는 전사조절의 핵심 역할을 하는 -10 영역과 전사개시 부위를 포함한 원핵생물의 핵심 프로모터 영역에 대한 의존성 반영 분해모델 (Dependency-Reflecting Decomposition Model)을 제안한다. 이 모델은 인접한 위치에 존재하는 핵산 염기들 사이의 의존성뿐만 아니라 인접하지 않은 위치의 핵산 염기들간의 의존성까지 고려함으로써 핵산 염기서열 상에 내포되어있는 중요한 생물학적 의존성들을 함축하고 있다. DRDM 모델은 우수한 성능평가 결과를 보였으며. 미생물 유전체 Contig들 상에서 임의의 유전자 프로모터를 예측하는데 효과적으로 이용될 수 있다.