• 제목/요약/키워드: 단백질 기능 예측

검색결과 128건 처리시간 0.04초

단백질 상호작용 네트워크에서의 단백질 기능예측을 위한 패턴 마이닝 (Prediction of Protein Function using Pattern Mining in Protein-Protein Interaction Network)

  • 김태욱;이미정;이패패;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1115-1118
    • /
    • 2011
  • 단백질 사이의 상호작용 네트워크(PPI network: Protein-Protein Interaction network)를 이용하여 단백질 기능을 예측 하는 것은 단백질 기능 예측 기법들 중에서 중요한 작용을 한다. 하지만 PPI를 이용한 단백질 기능 예측은 기능의 복잡도와 다양성으로 인해 제한적인 결과를 나타내 왔다. 따라서 본 논문에서는 기존의 연구들 보다 높은 정확도로 단백질 기능을 예측하기 위해 기능 예측을 하려는 단백질과 상호작용 하는 단백질들에 그래프 마이닝 기법을 적용하여 빈발 2-노드 상호작용 패턴을 찾고, 그 패턴을 이용하여 단백질 기능을 예측하는 접근법을 제안하였다. 실험데이터로 DIP(Database of Interacting Proteins)에서 제공하는 단백질 상호작용 데이터를 사용하였으며, 다른 기존의 단백질 기능 예측 기법들보다 높은 정확도를 보여주었다.

상호작용 맵에서 단백질 기능 예측 (A Protein Function Prediction in Interaction Maps)

  • 정재영;최재훈;박종민;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.286-288
    • /
    • 2004
  • 단백질 상호작용 데이터는 현 생물정보학에서 기능이 알려지지 않은 단백질의 기능 예측에 높은 신뢰성이 있는 프로티오믹스의 계산 모델에 이용되고 있다. 일반적으로 이 단백질 기능 예측 알고리즘들은 대규모의 2차원 단백질-단백질 상호작용 맵에서 Guilt-by-Association 개념 기반으로 개발되고 있다. 본 논문에서는 단백질-단백질 상호작용 데이터를 이용한 그래프 기반 단백질 기능 예측 모델을 개발하였다. 특히, 이 모델은 대량의 상호작용 데이터에서 정확한 기능 예측을 수행할 수 있다는 장점을 가지고 있다. 이를 위해 Yeast에 대한 단백질 상호작용 맵, Homology 및 Interaction Generality를 이용하여 이 모델을 평가하였다.

  • PDF

단백질 상호작용 네트워크에서 단백질 기능 예측을 위한 Modified Chi-square 기법 (Modified Chi-square Method for Prediction of Unannotated Proteins from Protein Interaction Network)

  • 강태호;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.785-787
    • /
    • 2008
  • 생명체의 생명현상을 주관하는 각종 화학반응들은 단백질이 관여하고 있다. 단백질은 일정한 질서에 따라 서로 조립되기도 하고, 기능적으로 연관돼 네트워크를 이루고 있다. 이 네트워크를 구성하는 단백질-단백질 상호작용은 단백질의 기능과 밀접하게 관련되어 있다. 즉, 상호작용하는 단백질은 같은 기능을 수행할 가능성이 크다. 이러한 사실은 단백질-단백질 상호작용을 통해 기능이 알려지지 않은 미지 단백질의 기능을 예측할 수 있게 한다. 대표적인 연구로는 이웃 노드에 존재하는 기능분포를 이용하는 이웃노드 카운트(Neighborhood Counting)방식과 특정 기능의 나타날 빈도를 계산하여 기능을 예측하는 카이-제곱(Chi-Square)방식 등이 있다. 본 논문에서는 단백질 기능 예측의 정확성을 높이기 위해 이들 두 방식의 장점을 취합한 보완된 카이-제곱 방식을 제안한다. 그리고 다양한 단백질 상호작용 네트워크 데이터를 비교 분석하여 보완된 카이-제곱 방식이 기능 예측의 정확성이 높음을 증명한다.

단위 신경망을 이용한 단백질 기능 예측 (Modular neural network in prediction of protein function)

  • 황두성
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.1-6
    • /
    • 2006
  • 단백질의 기능 예측 모델은 guilt-by-association 개념을 바탕으로 단백질-단백질 상호작용 맵을 이용하고 있다. 이 방법은 목표 단백질이 기능이 알려진 단백질과 상호작용이 없는 경우 기능 예측이 불가능하다. 본 논문에서는 단백질 기능 예측 모델을 K-class 다중 분류 문제로 재 정의하고 단백질-단백질 상호작용 데이터 및 단백질의 알려진 속성 등을 학습 모델에 이용한 단위신경망의 설계와 응용을 제안한다. 제안하는 모델은 Yeast 단백질 데이터의 기능 예측에서 단백질-단백질 상호작용 데이터를 이용하는 방법에 비해 분류 예측율에서 우수한 성능을 보였으며 또한 상호작용이 밝혀지지 않은 단백질의 기능 예측을 할 수 있다.

서열 유사도와 특징 기반 분류를 융합시킨 단백질 기능 예측 시스템 (A Hybrid Protein Function Prediction System Using Sequence Similarity and Feature-based Classification)

  • 문지환;김유성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.197-200
    • /
    • 2010
  • 단백질의 서열 정보와 기능 정보의 양이 증가함에 따라 컴퓨터 실험을 통한 단백질의 기능 예측이 가능해졌으며 정확성이 높은 예측 시스템을 개발하려는 여러 연구가 시도되고 있다. 대표적인 방법으로 서열 유사도를 기반으로 기능 예측을 하는 시스템이 제안되었으나 단백질 중에는 서열이 유사하지만 기능이 다르거나 또는 서열은 다름에도 불구하고 기능이 같은 단백질이 존재하기 때문에 서열의 유사도 만을 이용해서는 단백질의 기능 예측을 어렵다. 이러한 유사도 방법의 단점을 극복하기 위해 단백질 서열로부터 추출한 특징을 기반으로 분류하는 방법도 제안되었다. 본 논문에서는 이러한 기존 방법들의 장점을 얻기 위하여 서열 유사도 방법과 특징 기반 방법을 융합한 단백질 기능 예측 시스템을 제안하고 예측 정확성 분석을 위한 실험을 실시하였다. 실험의 결과에 따르면 제안된 융합시스템이 서열 유사도만을 이용한 방법과 특징 기반 방법보다 좋은 예측 정확률을 갖는 것으로 분석되었다.

단백질 기능 예측을 위한 그래프 기반 모델링 (Graph-based modeling for protein function prediction)

  • 황두성;정재영
    • 정보처리학회논문지B
    • /
    • 제12B권2호
    • /
    • pp.209-214
    • /
    • 2005
  • 단백질 상호작용 데이터는 현 생물정보학에서 기능이 알려져 있지 않은 단백질의 기능 예측에 높은 신뢰성이 있는 프로티오믹스의 계산 모델에 이용되고 있다. 단백질 기능 예측 관련 연구로는 guilt-by-association 개념을 바탕으로 대규모의 단순 2차원 단백질-단백질 상호작용 맵을 이용하고 있다. 본 논문에서는 단백질-단백질 상호작용 데이터를 이용한 그래프 기반 기능 예측 방법인 neighbor-counting, $\chi^2$-통계치 예측 모델을 살펴보고 대량의 상호작용 데이터로부터 빠른 기능예측에 효과적인 알고리즘을 제안한다. 제안하는 알고리즘은 단백질 상호작용 맵, 서열 유사성 및 경험적 전문가 지식을 이용하는 그래프 기반 모델이다. 제안된 알고리즘은 Yeast 단백질의 기능 예측을 수행하였으며, neighbor-counting, $\chi^2$-통계치 모델의 실험 결과와 비교되었다.

단어 기반의 확률 모델을 이용한 단백질 기능 예측 (Function Prediction of Gene products by Term based Probabilistic Model)

  • Park, Dae-Won;Kwon, Hyuk-Chul
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.73-78
    • /
    • 2003
  • 유전 연구를 통해 밝혀지고 있는 단백질은 각각의 기능적 특성을 가지고 서로 영향을 주고받으며 상호 작용한다. 단백질의 기능적 특성은 생물체에서는 단백질이 나타내는 기능으로 단백질 이름은 이들 단백질의 기능을 정확히 나타낼 수 있도록 붙여진다. 기능적 특성에 의해 명명된 단백질은 단백질을 구성하는 단어도 단백질과 유사한 기능 특성을 가질 가능성이 높다. 이는 텍스트 기반의 연구에서 단어가 가지는 중요성에서 비롯된다. 본 논문에서는 단백질을 구성하는 단어들을 단백질의 기능적 특성으로 분류하고, 이 기능분포에 의해서 단백질의 기능을 역으로 예측하고 판단하고자 하였다.

  • PDF

보완된 카이-제곱 기법을 이용한 단백질 기능 예측 기법 (Fucntional Prediction Method for Proteins by using Modified Chi-square Measure)

  • 강태호;유재수;김학용
    • 한국콘텐츠학회논문지
    • /
    • 제9권5호
    • /
    • pp.332-336
    • /
    • 2009
  • 유전체 분석에서 중요한 부분 중 하나는 기능이 알려지지 않은 미지 단백질에 대한 기능 예측이다. 단백질-단백질 상호작용 네트워크를 분석하는 것은 미지 단백질에 대한 기능을 보다 쉽게 예측할 수 있게 한다. 단백질-단백질 상호작용 네트워크로부터 미지 단백질의 기능을 예측하기 위한 다양한 연구들이 시도되어 왔다. 카이-제곱(Chi-square) 방식은 단백질-단백질 상호작용 네트워크를 통해 기능을 예측하고자 하는 연구 중 대표적인 방식이다. 하지만 카이-제곱 방식은 네트워크의 토폴로지를 반영하지 않아 네트워크 크기에 따라 예측의 정확성이 떨어지는 문제점이 있다. 따라서 본 논문에서는 카이-제곱 방식을 보완하여 정확성을 높인 새로운 기능 예측 방법을 제안한다 이를 위해 MIPS, DIP 그리고 SGD와 같은 공개된 단백질 상호작용 데이터베이스들로부터 데이터를 수집하여 분석하였다. 그리고 제안된 방식의 우수성을 입증하기 위해 각 데이터베이스들에 대해 카이-제곱방식과 제안하는 보완된 카이-제곱(Modified Chi-square)방식으로 예측해보고 이들의 정확성을 평가하였다.

단백질의 기능 예측을 위한 도메인 검색 방법 (Search method of Domain for prediction of protein function)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.239-242
    • /
    • 2003
  • 모든 생명체는 유전자의 최종 산물인 다양한 단백질들이 각각의 복잡한 기능을 수행함과 동시에 그들 사이의 긴밀한 상호작용에 의해 생명을 유지한다. 도메인 (Domain)은 단백질의 기능적 단위로서 한 개 단백질은 최대 수십 개의 도메인을 가지는데 이들 도메인에 대한 정보는 단백질의 기능을 예측하는데 도움이 될 수 있다. 본 논문에서는 종양을 억제하는 기능을 가지는 단백질과 그러한 기능을 가질 것으로 추정되어지는 단백질의 아미노산 서열, 또 기능이 밝혀지지 않은 미지의 아미노산 서열을 가지고 이미 밝혀져 있는 도메인 서열과 비교 검색하여 이들 사이에 일치하는 도메인을 통하여 표적 단백질의 기능 동정에 관한 연구에 도움이 되며, 또한 기능이 밝혀지지 않은 아미노산 서열의 도메인을 검색하여 새로운 기능을 예측함으로써 다른 실험적 방법과 비교하여 시간과 비용을 절약할 수 있는 효과적인 방법을 얻었기에 제안하고자 한다.

  • PDF

잔기 위치 예측을 위한 단백질 기하학적 특징 추출 기법 (An Extraction Technique of Protein Geometric Features for Predicition of Residue Location)

  • 유기진;정광수;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.673-676
    • /
    • 2006
  • 생명현상을 이해하기 위해서는 단백질의 기능 규명이 이루어져야한다. 단백질 기능 규명을 위한 서열분석 방법은 서열 상동성이 현저히 낮은 경우 단백질 기능 예측이 불가능하고, 과거의 전체적인 단백질 구조 분석을 통한 기능 예측의 문제점이 보고되고 있다. 이 논문에서는 기능상 중요한 의미를 가지고 있는 단백질의 특정하위구조의 기하학적 특징을 추출하여 이 특징과 잔기의 위치와의 관계를 규명하였다. 또한 NaiveBayes, SVM, C4.5의 분류알고리즘을 이용하여 각 알고리즘별 분류성능을 평가하였다. 기능상 중요한 의미를 가지고 있는 특정하위구조를 비교함으로써 모르는 단백질의 기능을 예측할 수 있다.

  • PDF