• 제목/요약/키워드: 유전자 기능 예측

검색결과 100건 처리시간 0.026초

HMM을 이용한 단백질 $\beta$-barrel 막횡단 부위 예측 (Predicting Transmembrane $\beta$-barrel membrane protein with HMM)

  • 안창신;유성준;박현석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.802-804
    • /
    • 2003
  • 2000년대 초 인간 지놈 프로젝트의 완성으로 새로운 포스트-지놈 시대를 맞이하여, 유전자에 대한 해독보다는 인간의 모든 대사와 질병에 직접관여 하고 있는 단백질의 구조와 기능에 대해 많은 관심과 연구가 이루어지고 있다. 특히, 특정 단백질들은 암과 같은 불치병에 직접관여 하고 있으므로 이러한 단백질들의 기능과 구조에 대한 예측 성능의 향상은 새로운 신약 개발에 큰 도움이 될 것이다. 본 논문은 기계학습(Machine Learning)의 한 분야인 HMM(Hidden Markov Model)을 이용하여 $\beta$-barrel 형태로 막횡단하는 단백질의 특성과 기능으로부터 막횡단하는 부위가 존재하는지 여부를 예측하는 프로그램을 구현했다.

  • PDF

Backpropagation을 이용한 Promoter 예측 방법 (Prediction of promoter by Backpropagation)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1569-1572
    • /
    • 2003
  • 최근 생명공학 분야의 기술이 혁신적으로 발달함에 따라 게놈 프로젝트가 본래 계획보다 2년 앞당겨져 2003 년 4 월 인간 유전자의 완전한 서열을 밝히고 성공적으로 완료됨으로서 관련 연구자들은 인간의 유전자에 대한 대량의 서열 데이터를 얻게 되었다. 그래서 게놈 프로젝트의 다음 단계로서 엄청난 양의서열 정보 분석으로부터 유전자의 기능을 파악하고자 하는 연구들이 이미 세계적으로 활발히 진행되고 있다. 이러한 연구들의 최종적 목표는 질병 치료와 생명연장의 실현이라고 볼 수 있다. 유전자 연구를 위해선 우선 일차적으로 유전자 부위를 파악해야 한다. 유전자는 구조적으로 다시 여러 부분으로 나뉘는데 유전자 발현의 개시에 매우 중요한 요소 중 하나가 바로 프로모터 (Promoter) 이다. 프로모터 내에는 TATA box 가 있는데 이는 프로모터의 핵심 요소이다. 프로모터는 생명체의 종 그리고 RNA 중합효소의 종류에 따라 다르다. 이 논문에서는 다양한 신경망 알고리즘 중의 하나인 Backtpropagation 을 이용하여 밝혀지지 알은 서열에서 인간을 포함하는 원핵생물의 프로모터 서열을 예측할 수 있는 방법을 얻었기에 소개하고자 한다.

  • PDF

단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교 (Comparison of External Information Performance Predicting Subcellular Localization of Proteins)

  • 지상문
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.803-811
    • /
    • 2010
  • 단백질의 세포내 위치와 단백질의 기능은 연관성이 크므로, 단백질의 세포내 위치 예측을 통해서 그 기능에 대한 정보를 얻을 수 있다. 예측 정확도를 높이기 위해서 아미노산 서열 정보이외의 외부 정보들을 효과적으로 이용하려는 연구가 활발하다. 본 논문에서는 아미노산 서열 유사성, 단백질 프로파일, 유전자 온톨로지, 모티프, 문헌 정보에 내재된 세포내 위치 예측 능력을 비교한다. 단백질간의 서열 유사성이 80% 이하인 PLOC 자료를 사용한 실험에서는 서열 유사성과 유전자 온톨로지를 이용하는 방법이 효과적이며, 94.8%의 예측정확도를 얻었다. 단백질 서열간의 유사성이 30% 이하로서 단백질간의 서열 유사성이 작은 BaCelLo IDS 자료는 유전자 온톨로지를 사용하는 것이 효과적이었고, 동물은 93.2%, 곰팡이는 86.6%의 예측정확도로 크게 향상된 성능을 얻었다.

단백질의 기능 예측을 위한 도메인 검색 방법 (Search method of Domain for prediction of protein function)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.239-242
    • /
    • 2003
  • 모든 생명체는 유전자의 최종 산물인 다양한 단백질들이 각각의 복잡한 기능을 수행함과 동시에 그들 사이의 긴밀한 상호작용에 의해 생명을 유지한다. 도메인 (Domain)은 단백질의 기능적 단위로서 한 개 단백질은 최대 수십 개의 도메인을 가지는데 이들 도메인에 대한 정보는 단백질의 기능을 예측하는데 도움이 될 수 있다. 본 논문에서는 종양을 억제하는 기능을 가지는 단백질과 그러한 기능을 가질 것으로 추정되어지는 단백질의 아미노산 서열, 또 기능이 밝혀지지 않은 미지의 아미노산 서열을 가지고 이미 밝혀져 있는 도메인 서열과 비교 검색하여 이들 사이에 일치하는 도메인을 통하여 표적 단백질의 기능 동정에 관한 연구에 도움이 되며, 또한 기능이 밝혀지지 않은 아미노산 서열의 도메인을 검색하여 새로운 기능을 예측함으로써 다른 실험적 방법과 비교하여 시간과 비용을 절약할 수 있는 효과적인 방법을 얻었기에 제안하고자 한다.

  • PDF

페이지랭크를 이용한 암환자의 이질적인 예후 유전자 식별 및 예후 예측 (Identification of Heterogeneous Prognostic Genes and Prediction of Cancer Outcome using PageRank)

  • 최종환;안재균
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.61-68
    • /
    • 2018
  • 암환자의 예후 예측에 기여하는 유전자를 찾는 것은 환자에게 보다 적합한 치료를 제공하기 위한 도전 과제 중 하나이다. 예후 유전자를 찾기 위해 유전자 발현 데이터를 이용한 분류 모델 개발 연구가 많이 이루어지고 있다. 하지만 암의 이질성으로 인해 예후 예측의 정확도 향상에 한계가 있다는 문제가 있다. 본 논문에서는 유방암을 비롯한 6개의 암에 대한 암환자의 마이크로어레이 데이터와 생물학적 네트워크 데이터를 이용하여 페이지랭크 알고리즘을 통해 예후 유전자들을 식별하고, K-Nearest Neighbor 알고리즘을 사용하여 암 환자의 예후를 예측하는 모델을 제안한다. 그리고 페이지랭크를 사용하기 전에 K-Means 클러스터링으로 유전자 발현 패턴이 비슷한 샘플들을 나누어 이질성을 극복하고자 한다. 본 논문에서 제안한 방법은 기존의 유전자 바이오마커를 찾는 알고리즘보다 높은 예측 정확도를 보여 주었으며, GO 검증을 통해 클러스터에 특이적인 생물학적 기능을 확인하였다.

네트워크 기반 면역 및 발생관련 최적 miRNA 예측 (Prediction of highly reliable miRNAs related immune and development based on network)

  • 이지후;이현재;김학용
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.373-374
    • /
    • 2013
  • MicroRNA(miRNA)는 단일가닥 RNA 분자로서 유전자 발현을 제어하는 조절인자이다. miRNA에 의해 조절되는 대부분 유전자는 다수의 miRNA에 의하여 조절되어질 수 있기 때문에 최적 miRNA의 선별은 매우 중요하다. 본 연구에서는 먼저 면역 및 발생관련 유전자 상호작용 네트워크를 구축하였다. 이 네트워크에 miRNA 정보를 추가함으로써 유전자간의 상호작용 뿐만아니라 유전자와 miRNA의 상호작용을 분석할 수 있는 기반을 조성하였다. 복잡한 네트워크를 단순화시켜 기능 모듈과 구조 모듈을 도출하고 이로부터 핵심 유전자를 조절하는 최적 miRNA를 예측하였다.

  • PDF

한우 cDNA 라이브러리에서 발현된 ESTs의 기능분석 (Functional Analysis of Expressed Sequence Tags from Hanwoo (Korean Cattle) cDNA Libraries)

  • 임다정;변미정;조용민;윤두학;이승환;신윤희;임석기
    • Journal of Animal Science and Technology
    • /
    • 제51권1호
    • /
    • pp.1-8
    • /
    • 2009
  • 본 연구는 한우의 지방, 간, 등심조직에서 유전자 염기서열을 확보하여 생산된 57,598개의 유전자 발현단편 데이터의 기능규명을 실시하였다. 유전자 발현단편 서열은 Assembly 과정을 통하여 unique한 서열인 4,759 contigs와 7,587 singletons을 확보하였으며, 얻어진 전사체를 이용하여 NCBI의 non-redundant 단백질 데이터베이스에 대하여 서열유사성 검색 (BLAST)을 하여 유전자의 기능을 예측할 수 있었다. 또한 기능에 대한 모호성을 확실히 하기 위해 Gene Ontology 용어를 사용하여 한우의 세 조직에서 확보된 서열들의 생물학적 특성을 기술하였다. Gene Ontology 는 모든 기능이 계층적으로 표현되어 있기 때문에, 각 계층에 대하여 유의적인 기능 여부를 확인하기 위하여 통계 분석인 Pearson's chi-square test를 실시하여 통계적으로 유의한 기능들을 산출할 수 있었다. 그 결과, Molecular function, Biological process, Cellular component 각각의 GO category에서 13, 16, 8개의 유의적인 GO terms이 검출되었다. 또한, 한우의 세 조직에 대하여 조직특이적 유전자의 존재여부를 판단하기 위하여 Audic's test를 실시하여 세 조직에서 각각 조직특이적으로 발현되는 유전자들을 검출할 수 있었다. 이러한 생물정보학적 방법들을 사용하여 한우의 세 조직에서 발현된 대량의 서열들에 대한 기능을 예측할 수 있었으며, 통계 검증을 통하여 유의적으로 검출된 유전자들은 추후에 실험적 검증을 실시하여 충분한 정보를 확보할 수 있을 것으로 사료된다.

유전자 프로그래밍을 이용한 RNA 구조 문법 학습 (Learning of RNA Structural Grammar using Genetic Programming)

  • 남진우;정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.425-427
    • /
    • 2003
  • RNA는 세포내에서 유전자 발현에 직, 간접적으로 중요한 역할을 하며, RNA 구조는 세포 내에서의 기능과 깊은 연관이 있기 때문에 RNA 구조를 예측하는 것은 중요한 의미를 갖는다, 본 논문에서는 진화연산의 한가지인 유전자 프로그래밍(genetic programming) 방법을 사용하여 염기서열 정보를 참고하는 RNA 구조 문법의 학습 방법을 보여 준다. 이 RNA 구조를 의미하는 문법을 트리(tree)형태의 함수로 코드화(encoding) 한 후 이것을 유전자 프로그래밍 방법으로 진화시킨다. 진화를 통해 최적의 적합도를 갖는 트리의 문법을 테스트 데이터를 통해 평가한 결과 0.893의 특이도(speicificity)와 0.752의 민감도(sensitivity)를 보였다.

  • PDF

DLBCL 환자의 대사경로 정보를 이용한 생존예측 (Predicting Survival of DLBCL Patients in Pathway-Based Microarray Analysis)

  • 이광현;이선호
    • 응용통계연구
    • /
    • 제23권4호
    • /
    • pp.705-713
    • /
    • 2010
  • 마이크로어레이 실험 결과로부터 생존예측지표를 개발하는 일은 관찰 유전자수가 환자의 수보다 훨씬 많고 또 반응변수가 중도절단이 포함된 생존시간이기 때문에 어려운 작업이다. 또한 개별유전자 분석의 문제점이 대두되면서 동일한 대사기능을 수행하는 유전자들의 집합을 대상으로 분석하는 방법이 대두되고 있다. DLBCL 환자들의 마이크로어레이 유전자 발현 자료와 생존시간, 유전자들의 대사경로 정보를 바탕으로 생물학적 해석이 쉬운 생존예측지표를 찾고 그 정확성을 검정하는 pilot study를 실시하였다. 또한 유전자 걸러내기가 지표의 효율성에 미치는 영향력도 비교하여 보았다.

Apoptosis Suppressor에 관련된 유전자 스크린 방법과 동정된 유전자 특성 규명

  • 황규찬;옥도원;권득남;신혜경;김진회
    • 한국동물번식학회:학술대회논문집
    • /
    • 한국동물번식학회 2001년도 춘계학술발표대회
    • /
    • pp.16-16
    • /
    • 2001
  • Apoptosis로 일컬어지는 예정된 세포사멸(programmed cell death)은 개별 세포의 입장에서는 곧바로 사멸을 의미하지만, 정상적인 고등 생물의 입장에서는 개체의 발생과 분화하는데 프로그램된 과정이다. 자발적 세포사멸은 다른 조직에 비해 생식 조직인 난소나 정소에서 복잡한 apoptosis 기작들을 가지리라 사료된다. 본 연구는 Bcl-2 family중 apoptotic protein인 Bax에 대해 suppression하는 유전자를 yeast system을 활용하여 돼지 정소와 난소로부터 각각 cDNA library를 구축한 후 탐색하였다. 탐색에 활용된 cDNA library는 돼지의 정소와 난소로부터 mRNA를 분리하여 yeast vector인 pAD-GAL4-2.1에 구축하였고, 마우스 bax 유전자는 gal 1 promoter의 조절 하에 glucose 배지에서는 유도되지 않고, galactose 배지에서만 선택적으로 Bax를 발현할 수 있는 효모 vector(pL19-bax)를 구축하였다. Bax에 의한 apoptosis suppressor를 탐색하기 위해 우선 효모 W303에 pL19-bax를 transform하여 glucose 배지에서 Bax의 발현을 억제하였다. pL19-bax를 가진 효모에 정소와 난소로부터 구축된 cDNA library를 transform 시키고, transform된 효모는 각각 Bax에 의한 toxicity를 저해하는 유전자를 찾기 위해 스크린되었다. 이러한 방법으로 정소 cDNA library 탐색에서는 5 $\times$ $10^{6}$ transformant중 39개, 난소cDNA library 탐색에서는 2 $\times$ $10^{6}$ transformant중 26개의 콜로니가 생존하였다. 이들 콜로니로부터 유전자를 분리하여 분석해 본 결과 여러 그룹으로 분류할 수 있었다. 각 그룹의 관련 유전자는 protein synthesis/degradation 12종, oxidation/reductation 5종, detoxin/ cell cycle promoter 3종, signal transduction/growth factor 5종, 그리고 알려지지 않은 유전자 9종이었다. 그 중, bax-toxicity inhibition에 강력한 survival phenotype을 가지는 유전자(pSEDL)를 동정하였다. 이것은 T3-4-1 콜로니로부터 분리하였는데 140개 아미노산으로 이루어진 인간 SEDL(GenBank, XM_013096) 유전자와 매우 유사한 homology를 가지며, bax와 관련된 기능은 밝혀져 있지 않다. 이외에도 분리된 유전자에는 NADH, thioreduction, 그리고 cytochrome oxidase와 같은 positive 유전자 군이 크로닝되어, Bax를 이용한 효모에서 apoptosis suppressor에 관련된 유전자를 손쉽게 스크린하는 것이 가능하고, 분리된 유전자의 기능을 예측할 수 있어 지금까지 보고된 유전자 크로닝법 보다는 강력한 수단으로 활용될 수 있다는 사실을 시사하였다. 그러나, ORF에 관계없이 Bax 발현에 저항하는 유전자군이 선발된다든지 하는 문제점은 금후 검토가 필요하리라 사료된다.

  • PDF