• 제목/요약/키워드: 단백질 도메인

검색결과 117건 처리시간 0.029초

InterPro의 e-value 조정을 통한 신규 도메인 발견 접근 방식의 문제점 (The Problem of the e-value of InterPro to find additional domains in Domain Combination)

  • 허희영;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.17-21
    • /
    • 2006
  • 도메인 기반 단백질 상호작용 예측 기법은 지난 몇 년 동안 활발히 연구되어 왔다. 도메인 기반 접근 방법 중에서도 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 예측 정확도면에서 다른 기법보다 월등한 결과를 보여주고 있다. 그러나 학습 집단을 사용하는 특징 때문에 전체 도메인 정보를 이용할 수 없는 단점이 있다. 또한, 이 시스템은 도메인 정보가 부족하여 다른 기능을 하는 단백질이라도 같은 도메인 정보를 보여주기 때문에 예측 시스템의 결점을 드러내고 있다. 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 InterPro 데이터베이스의 도메인 정보를 기반으로 사용한다. InterProScan은 InterPro의 여러 멤버 데이터베이스의 정보를 기반으로 Sequence 분석을 하는 소프트웨어로써 검색 후 단계에서 찾아낸 결과들을 e-value를 기반으로 여과한다. 본 논문에서는 제시된 e-value를 조정 방법을 사용함으로써 단백질 내 도메인 패턴의 다양화와 기존 도메인 정보가 없던 단백질의 도메인을 새롭게 발견할 수 있으나 접근 방식의 한계가 존재함을 확인할 수 있었다.

  • PDF

도메인 조합 기반 단백질-단백질 상호작용 확률 예측 틀 (A Domain Combination-based Probabilistic Framework for Protein-Protein Interaction Prediction)

  • 한동수;서정민;김홍숙;장우혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.299-308
    • /
    • 2004
  • 최근 단백질 및 도메인과 관련된 방대한 양의 데이타들이 인터넷상에 공표되고 축적됨에 따라, 단백질간의 상호작용에 대한 예측 시스템의 필요성이 제기되고 있다. 본 논문에서는 이러한 데이타를 이용하여 계산적으로 도메인 조합 쌍에 기반하여 단백질의 상호작용 확률을 예측하는 새로운 단백질 상호작용 예측 시스템을 제안한다. 제안된 예측 시스템에서는 기존의 도메인 쌍(domain pair)의 제약성을 극복하기 위하여 도메인 조합(domain combination)과 도메인 조합 쌍(domain combination pair)의 개념이 새롭게 도입하였다. 그리고 도메인 조합 쌍(domain combination pair 또는 dc-pair)을 단백질 상호작용의 기본 단위로 간주하고 예측을 시도한다. 예측 시스템은 크게 예측 준비 과정과 서비스 과정으로 구성되어 있다. 예측 준비 과정에서는 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합으로부터 각각 도메인 조합 정보와 그 출현 빈도를 추출한다. 추출된 정보들은 출현 확률 배열(Appearance Probability Matrix 또는 AP matrix)로 불리는 배열 구조에 저장된다. 논문에서는 출현 확률 배열에 기반을 두어, 단백질-단백질 상호작용을 예측하는 확률식 PIP(Primary Interaction Probability)를 고안하고, 고안된 확률식을 이용하여, 상호작용이 있는 것으로 알려진 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 도메인 쌍 집합의 확률 값 분포를 생성시킨다. 예측서비스 과정에서는 예측 준비 과정에서 얻어진 분포와 확률식을 이용하여 임의의 단백질 쌍의 상호작용 확률을 계산한다. 예측 모델의 유효성은 효모(yeast)에서 상호작용이 있는 것으로 보고된 단백질 쌍 집합과 상호작용이 없는 것으로 추정되는 단백질 쌍 집합을 이용하여 검증하였다. DIP(Database of Inter-acting Proteins)의 상호작용이 있는 것으로 알려진 효모 단백질 쌍 집합의 80%를 학습 집단으로 사용했을 때, 86%의 sensitivity와 56%의 specificity를 나타내어, 도메인을 기반으로 한 기존의 예측 시스템에 비해서 우월한 예측 정확도를 보여주었다. 이와 같은 예측 정확도의 개선은 본 예측 시스템이 상호작용의 기본 단위로 dc-pair를 채택한 점과 분류를 위하여 새롭게 고안하여 사용한 PIP식이 유효했던 것으로 판단된다.

연관성 규칙에 기반한 보존된 단백질 도베인 조합의 식별 (Identification of Conserved Protein Domain Combination based on Association Rule)

  • 정석훈;장우혁;한동수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.375-379
    • /
    • 2009
  • 도메인은 단백질의 진화와 삼차구조 및 분자 기능의 기본 단위체이다. 단백질은 한 개 이상의 도메인들로 구정 되며, 단백질의 기능 또한 각 도메인이 가진 기능의 집합으로 구현된다. 단백질은 특정 기능을 담당하기 위해 진화되어 왔으므로, 도메인 또한 단백질 내에서 기능을 위한 특정 조합 패턴, 즉 보존도메인 조합을 가진다. 본 논문은 각 도메인 조합의 진화상 보존 정도를 측정할 수 있는 연관성 규칙 기반 계산 기법을 제안한다. 제안된 기법은 기존 기법에서 주로 고려되었던 도메인 조합의 빈도뿐 아니라, 조합 내 소속 도메인간의 상호 의존도를 측정하여 주어진 조합의 보존 정도를 산출한다. 이를 기반으로 S.cerevisiae의 단백질을 대상으로 보존 도메인 조합을 추출하였으며, Gene Ontology를 이용하여 그 생물학적 의미를 분석하였다. 그 결과 제안된 기법으로 추출된 보존 도메인 조합은 기존의 것에 비해 조합 내 기능의 유사도가 높았으며, 따라서 제안된 기법이 생물학적 기능의 협업 위해 보존된 도메인 조합의 추출에 우수하다 할 것이다. 또한 S.cerevisiae 단백질체에는 서로 의존도가 높고 자주 나타나는 보존 도메인 조합이 존재하며, 그러한 조합들은 molecular function의 협업과 관련 있음을 밝혀냈다.

단백질의 기능 예측을 위한 도메인 검색 방법 (Search method of Domain for prediction of protein function)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.239-242
    • /
    • 2003
  • 모든 생명체는 유전자의 최종 산물인 다양한 단백질들이 각각의 복잡한 기능을 수행함과 동시에 그들 사이의 긴밀한 상호작용에 의해 생명을 유지한다. 도메인 (Domain)은 단백질의 기능적 단위로서 한 개 단백질은 최대 수십 개의 도메인을 가지는데 이들 도메인에 대한 정보는 단백질의 기능을 예측하는데 도움이 될 수 있다. 본 논문에서는 종양을 억제하는 기능을 가지는 단백질과 그러한 기능을 가질 것으로 추정되어지는 단백질의 아미노산 서열, 또 기능이 밝혀지지 않은 미지의 아미노산 서열을 가지고 이미 밝혀져 있는 도메인 서열과 비교 검색하여 이들 사이에 일치하는 도메인을 통하여 표적 단백질의 기능 동정에 관한 연구에 도움이 되며, 또한 기능이 밝혀지지 않은 아미노산 서열의 도메인을 검색하여 새로운 기능을 예측함으로써 다른 실험적 방법과 비교하여 시간과 비용을 절약할 수 있는 효과적인 방법을 얻었기에 제안하고자 한다.

  • PDF

생물정보학 기반 암세포 내 DNA 복구 저해를 위한 최적 단백질 도메인 선정 (Selection of optimal protein domains for DNA repair inhibition in cancer cells based on bioinformatics)

  • 조시향;김학용
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.185-186
    • /
    • 2016
  • 최근 DNA 복구 기작 저해가 암 전이를 억제한다는 연구결과가 발표되었다. 이번 연구에서는 DNA 복구 기작을 효율적으로 저해시킬 수 있는 단백질을 선정하고자 했다. 먼저 HPRD에서 59개의 DNA repair 단백질 정보를 얻고 각각의 도메인 정보를 추출하였다. 이 단백질과 상호작용하는 단백질을 KEGG로 부터 추출하고 추출한 단백질의 도메인 정보는 HPRD에서 얻었다. Cytoscape를 통하여 DNA 복구 단백질-상호작용 단백질-도메인의 네트워크를 시각화하였다. 네트워크 상에서 보존적이며 핵심적인 단백질 후보 및 도메인 후보를 선정 하였다. KEGG에서 제공하는 암의 경로(pathways in cancer)을 이용하여 후보의 적용 가능성을 확인하였다. 선정한 최종 후보들은 향후 암 전이 억제에 사용될 수 있는 타깃이 될 수 있을 것으로 기대한다.

  • PDF

상호작용 중요도 행렬을 이용한 단백질-단백질 상호작용 예측 (Protein-Protein Interaction Prediction using Interaction Significance Matrix)

  • 장우혁;정석훈;정휘성;현보라;한동수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권10호
    • /
    • pp.851-860
    • /
    • 2009
  • 최근 계산을 통한 단백질 상호작용 예측 기법 중, 단백질 쌍이 포함하고 있는 도메인들 사이의 관계에 중점을 둔 도메인 정보 기반 예측 기법들이 다양하게 제안되고 있다. 하지만, 다수의 도메인 쌍들이 상호작용에 기여하는 정도를 정밀하게 반영하는 계산 기법은 드문 실정이다. 본 논문에서는 단백질 상호작용에 있어 도메인 조합 쌍의 상호작용 영향력을 수치화하여 반영한 상호작용 중요도 행렬을 고안하고 이를 기반으로 한 단백질 상호작용 예측 시스템을 구현한다. 일반적인 도메인 조합 기법과 달리, 상호작용 중요도 행렬에서는 상호작용을 위한 도메인간의 협업 확률이 고려된 Weighted 도메인 조합과, 다수의 Weighted 도메인 조합 중 실제 상호작용 주체가 될 확률을 도메인 조합 쌍의 힘(Domain Combination Pair Power, DCPPW)으로 수치화한다. DIP과 IntAct에서 얻어온 S. cerevisiae의 단백질 상호작용 데이터와 Pfam-A 도메인 정보를 사용한 정확도 검증 결과, 평균 63%의 민감도와 94%의 특이도를 확인하였으며, 학습집단의 증가에 따른 안정적인 예측 정확도 향상을 보였다. 본 논문에서 구현한 예측 시스템과 학습 데이터는 웹(http://code.google.com/p/prespi)을 통하여 내려 받을 수 있다.

도메인 기반 병렬 단백질 상호작용 예측 (A Domain based Parallel Prediction of Protein-protein interactions)

  • 김철환;정유진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.229-231
    • /
    • 2005
  • 본 논문에서는. 단백질은 도메인으로 모듈화 되어 있으며, 단백질 간 상호작용이 도메인간 상호작용의 결과라는데 착안, SVM을 이용하여 도메인 기반 단백질 상호작용을 예측하는 시스템을 구성하였다. 하지만, SVM 을 통한 실험은 정확한 예측 결과뿐 아니라 빠른 처리속도를 요구하게 되었다. 따라서 SVM을 병렬화하여 빠른 처리시간을 가지는 Parallel SVM을 적용, 도메인을 기반으로 한 단백질 상호작용을 실험하였으며, 이를 통해 정확성과 처리 속도를 측정, 비교함으로써 도메인 기반 병렬 단백질 상호작용 예측을 검증해 본다.

  • PDF

상호작용 및 도메인 정보를 이용한 단백질 기능 분석 시스템 (Protein Function Analysis System Using Protein Interaction and Domain Information)

  • 김기봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.301-303
    • /
    • 2004
  • 기능 유전체학과 단백질체학에 있어서 개별 단백질의 기능 분석은 매우 중요한 핵심사안으로 대두되고 있다. 이러한 기능 분석에 있어서 과거와는 달리 현재는 전체 생명 시스템 상에서 개별 유전자 일 단백질의 기능 및 역할을 규명하는데 않은 초점을 맞추고 있다. 이러한 측면에서 단백질 상호작용 정보 및 도메인 정보를 기반으로 기능 분석을 행하는 것이 올바른 방법으로 인식되고 있으며, 본 논문에서는 그와 같은 분석 시스템을 소개하고 있다. 단백질 상호작용 정보는 모티프 일 도메인의 모듈 정보를 기반으로 하여 특이성과 민감도 측면에서 분석 정확성을 높일 수 있다.

  • PDF

인간 및 초파리 단백질을 대상으로 한 도메인 조합 기반 단백질-단백질 상호작용 예측 기법 검증 (Validation of Domain Combination Based Protein-Protein Interaction Prediction Method Using Human and Fly Proteins)

  • 장우혁;한동수;김홍숙;이성독
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.235-237
    • /
    • 2005
  • 도메인 조합 기반의 단백질-단백질 상호작용 예측 기법(DCPPIP)은 효모 단백질에 대하여 뛰어난 정확도를 보여준다. 그러나 다른 종에서의 예측 정확도 및 기법의 유효성은 아직까지 검증되지 않고 있다. 본 논문에서는, 초파리 및 인간 단백질을 이용한 예측 정확도 검증 및 이종간의 상호작용 예측 실험의 결과를 기술한다. 초파리와 인간 단백질의 실험에서는 각각 10,351개와 2,345개의 상호작용 단백질 쌍이 사용되었다. 초파리와 인간의 상호작용 단백질 쌍 중 $80\%$$20\%$를 각각 학습집단 및 실험집단으로 사용하였으며. 상호작용이 없는 단백질 쌍의 학습집단은 1배에서 5배까지 변화시키면서 예측 정확도를 관찰하였다. 정확도는 실험집단 중 학습집단과 도메인이 완전히 혹은 부분적으로 겹치는 쌍들에 대하여 계산하였다. 이 결과 초파리에서는 약 $77\%$의 민감도와 $92\%$의 특이도가 확인되었고 인간 단백질에 대하여는 약 $96\%$의 민감도와 $95\%$의 특이도를 보여주었다. 이종간의 상호작용 예측 실험은 효모, 초파리, 효모+초파리에 해당하는 학습집단 각각을 바탕으로 Human, Mouse, H. pylori, E. coli, C. elegans 등의 단백질 상호작용 예측을 수행하였다. 실험 결과 학습집단의 도메인이 실험집단의 도메인과 많이 겹칠 수륵 높은 정확도를 보여주었으며, 도메인 집단간의 유사도를 나타내기 위해 고안한 Domain Overlapping Rate(DOR)는 상호작용 예측 정확도의 중요한 요소임을 찾아 내었다.

  • PDF

단백질 상호작용 추론 및 가시화 시스템 (A Visualization and Inference System for Protein-Protein Interaction)

  • 이미경;김기봉
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1602-1610
    • /
    • 2004
  • 다양한 유전체 프로젝트로 말미암아 엄청난 서열 데이타들이 쏟아지고, 이에 따라 핵산 및 단백질 수준의 서열 데이타 분석이 매우 중요하게 인식되고 있다. 특히 최근에는 단백질이 단순하게 개별적인 기능을 가진 독립적인 요소가 아닌 전체 단백질 상호작용 네트워크 상에서 다른 객체들과 유기적인 관계를 갖으며 나름대로의 중요한 역할을 수행하고 있다는 점에 초점을 맞추어 연구가 진행되고 있다. 특히 단백질 상호작용 관계 분석을 위해서는 실제로 상호작용이 일어나는 도메인 모듈 정보가 아주 중요하게 작용하는데, 본 논문에서는 이러한 점을 고려하여 우리가 개발한 단백질 기능 및 상호작용 분석을 위한 PIVS(Protein-protein interaction Inference and Visualization System)에 대해 소개하고 있다 PIVS는 기존의 단백질 상호작용 데이타베이스들을 합쳐서 통합 데이타베이스를 생성하고, 다양한 전처리 과정으로 통합 데이타베이스 서열의 기능 및 주석 정보를 추출하여 로컬 데이타베이스화 하였다. 그리고 특히 단백질 상호작용 관계 분석을 위해 중요하게 작용하는 도메인 모듈 정보들을 추출하여 로컬 데이터베이스를 구축하였고, 기존의 단백질 상호작용 관계 데이타를 이용하석 도메인 사이의 상호작용 관계 정보도 수집하여 분석하였다. PIVS는 단백질의 종합적인 분석 정보, 즉, 기능 및 주석, 도메인, 상호작용 관계 정보 등을 손쉽고 편리하게 얻고자 하는 사용자에게 매우 유용하게 사용될 수 있을 것이다.