한국정보처리학회:학술대회논문집 (Annual Conference of KIPS)
- 한국정보처리학회 2002년도 추계학술발표논문집 (하)
- /
- Pages.1827-1830
- /
- 2002
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
단백질 모티프간 연관성 탐사
Association Discovery Among Protein Motifs
- Lee, Hyun-Suk (Dept of Computer Science, Chonnam University) ;
- Lee, Do-Heon (Department of BioSytems, KAIST) ;
- Choi, Deok-Jai (Dept of Computer Science, Chonnam University)
- 발행 : 2002.11.15
초록
단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix), 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 본 논문에서는 연관성 탐사 기법을 적용하여 Hits 데이터로부터 상당히 높은 연관성을 갖는 모티프 집단을 밝히고, 실제 자연현상에서 자주 나타나는 연관성을 교차타당성 (cross-validation) 기법을 통해 입증하였다. 이렇게 밝혀진 단백질 모티프간 연관성을 트라이 탐색 기법을 통해 웹으로 제공함으로써 단백질의 기능유추에 쉽게 접근하고자 한다.
키워드