• 제목/요약/키워드: 단백질-단백질 상호작용 예측

검색결과 63건 처리시간 0.029초

단백질 상호작용 네트워크예서 상동성 기반 바이오 콤플렉스 예측 (A Homology-Based Prediction of Biological Complexes in a Protein-Protein Interaction Network)

  • 최재훈;박종민;박수준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.64-66
    • /
    • 2006
  • 본 논문에서는 생물학적 실험에 의해 추출된 이종의 단백질 콤플렉스를 통해 대상 종의 콤플렉스를 단백질 상호적용 네트워크에서 예측할 수 있는 방법을 제안한다. 이 예측은 먼저 이종사이에 단백질의 비교를 통해 상동성을 색인한 다음, 이 상동성을 이용하여 이종의 콤플렉스를 대상 종으로 변형하고 그 형태를 단백질 상호작용 네트워크에서 탐색하는 과정으로 수행된다. Swiss-Prot 데이터 베이스의 단백질들을 대상으로 상동성 색인을 색인하였으며, 콤플렉스 형태를 분석하기 위해 DIP의 단백질 상호작용 네트워크를 이용하였다.

  • PDF

G 단백질 연결 수용체계(GPCR system)에서의 정전기적 포텐셜(Electrostatic Potential)에 따른 효과를 고려한 단백질과 리간드의 상호작용 예측(protein-ligand interaction prediction)

  • 최규홍;신웅희;이동선
    • EDISON SW 활용 경진대회 논문집
    • /
    • 제2회(2013년)
    • /
    • pp.125-137
    • /
    • 2013
  • 2012년 G 단백질 연결 수용체(G-Protein Coupled Receptors ; GPCR) 연구가 노벨 화학상을 받았다. 상당히 많은 병과 관련되어 있어 잠재력이 크고, 많은 연구가 진행 중이다. 현재 리간드와 단백질간의 정전기적 포텐셜 연구를 통한 예측 연구가 진행되고 있지만, GPCR과 리간드 간의 연구에서 아직 리간드의 전하를 통한 단백질과 리간드간의 상호작용 예측 연구가 되어 있지 않다. 그렇기 때문에 이번 연구에서는 8가지 방법으로 전하(charge)를 띠게 하여서 단백질과 리간드의 상호작용을 계산을 통하여 예측하여 보았다.

  • PDF

최적 연관 속성 규칙을 이용한 비명시적 단백질 상호작용의 예측 (Prediction of Implicit Protein - Protein Interaction Using Optimal Associative Feature Rule)

  • 엄재홍;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2006
  • 단백질들은 서로 다른 단백질들과 상호작용 하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질 상호작용의 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이타가 산출되고 있는 현(現) 게놈시대에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모(Saccharomyces cerevisiae)에 대해 공개되어있는 단백질 상호작용 데이타들에서 속성들 간의 연관을 통해 유추 가능한 잠재적 단백질 상호작용들을 예측하기 위한 연관속성 마이닝 방법을 제시한다. 단백질의 속성들 중 연속값을 가지는 속성값들은 최대상호 의존성에 기반을 두어 이산화 하였으며, 정보이론기반 속성선택 알고리즘을 사용하여 단백질들 간의 상호작용 예측을 위해 고려되는 단백질의 속성(attribute) 수 증가에 따른 속성차원문제를 극복하도록 하였다. 속성들 간의 연관성 발견은 데이타마이닝 분야에서 사용되는 연관규칙 발견(association rule discovery) 방법을 사용하였다 논문에서 제안한 방법은 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 최대 약 96.5%의 예측 정확도를 보였으며 속성필터링을 통하여 속성필터링을 하지 않는 기존의 방법에 비해 최대 약 29.4% 연관규칙 발견속도 향상을 보였다.

S. cerevisiae 단백질간 상호작용과 세포 내 위치 정보를 활용한 MAP Kinase 신호전달경로추출 및 예측을 위한 고성능 알고리즘 연구 (High performance Algorithm for extracting and redicting MAP Kinase signaling pathways based on S. cerevisiae rotein-Protein Interaction and Protein location Information)

  • 조미경;김민경;박현석
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.193-207
    • /
    • 2009
  • 세포 내에서 일어나는 단백질 신호 전달 과정은 단백질간의 상호작용을 통해 수행되고 조절된다. Yeast 상호작용 정보와 녹색형광단백질(GFP)을 이용하여 밝혀진 약 5,000여 개의 Yeast 단백질 위치정보를 이용하여 가중치를 부여하고 신호 전달경로 추출 및 예측을 위한 고성능 LocSPF 알고리즘을 최초로 제안하였다. 가중치 알고리즘에 의해 산출된 결과 중 의미 상관도가 높은 것을 채택한 후 KEGG에서 제공하는 신호전달 경로와 같은 신호전달 경로를 추출하는지 유사도 비교를 하였다. 한편 더 나아가 아직 실험을 통해 밝혀지지 않은 단백질 신호전달 경로를 예측하여 결과를 제시함으로써 본 연구를 통해서 알려지지 않은 새로운 신호전달 경로를 발견하거나 이전 경로에 참여하지 않은 단백질들을 발견할 수 있는 가능성을 제시 하였다.

InterPro의 e-value 조정을 통한 신규 도메인 발견 접근 방식의 문제점 (The Problem of the e-value of InterPro to find additional domains in Domain Combination)

  • 허희영;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.17-21
    • /
    • 2006
  • 도메인 기반 단백질 상호작용 예측 기법은 지난 몇 년 동안 활발히 연구되어 왔다. 도메인 기반 접근 방법 중에서도 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 예측 정확도면에서 다른 기법보다 월등한 결과를 보여주고 있다. 그러나 학습 집단을 사용하는 특징 때문에 전체 도메인 정보를 이용할 수 없는 단점이 있다. 또한, 이 시스템은 도메인 정보가 부족하여 다른 기능을 하는 단백질이라도 같은 도메인 정보를 보여주기 때문에 예측 시스템의 결점을 드러내고 있다. 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 InterPro 데이터베이스의 도메인 정보를 기반으로 사용한다. InterProScan은 InterPro의 여러 멤버 데이터베이스의 정보를 기반으로 Sequence 분석을 하는 소프트웨어로써 검색 후 단계에서 찾아낸 결과들을 e-value를 기반으로 여과한다. 본 논문에서는 제시된 e-value를 조정 방법을 사용함으로써 단백질 내 도메인 패턴의 다양화와 기존 도메인 정보가 없던 단백질의 도메인을 새롭게 발견할 수 있으나 접근 방식의 한계가 존재함을 확인할 수 있었다.

  • PDF

상호작용 네트웍 사전 구축을 이용한 단백질 기능 예측 (Protein Function Prediction by Constructing Interaction Network Dictionary)

  • 진희정;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.238-240
    • /
    • 2005
  • 단백체는 세포가 처해있는 환경에 따라, 그리고 각 조직 별로 유동적으로 존재하며, 세포의 실제적인 기능을 표현해준다. 이러한 이유로 세포 내에서 일어나는 실제적인 현상들을 전체 단백질 단계에서 통합적으로 파악하고자 하는 단백체학 연구가 활발하게 진행되고 있다. 미지의 단백질의 기능을 밝혀내는 연구는 단백체학의 가장 기본적이면서 중요한 부분이라고 할 수 있다. 본 논문에서는 "단백질 상호작용 네트웍 사전(PIND)"을 구축함으로써 단백질의 기능을 예측하는 새로운 방법론을 소개한다.

  • PDF

단백질 상호작용 데이터 통합 및 자료 검색 시스템 설계 (Integration of Protein-Protein Interaction Data and Design of Data Search System)

  • 최지혜;;오세종
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 2부
    • /
    • pp.1197-1200
    • /
    • 2010
  • Post-genomic 시대에 접어들면서 단백질의 기능의 주석이 중요한 문제로 떠오르기 시작하였다. 이런 단백질 기능을 예측하기 위해 단백질 상호작용(Protein-Protein interaction) 데이터를 이용한 방법들이 지난 10여 년간 발표되어왔다. 단백질 상호작용(Protein-Protein interaction) 데이터는 단백질들 간의 서열 등의 특징을 이용해 상호간의 연결 관련성이 있는 단백질끼리의 관계를 네트워크로 나타낸 자료이다. 현재 이러한 단백질 상호작용(Protein-Protein interaction) 데이터들은 MIPS, DIP, BioGrid등 약 5~6군데에서 제공되고 있다. 각각의 데이터는 다른 형식을 가지고 있고, 중복되는 정보도 포함하고 있다. 여러 연구 방법에서 데이터를 사용할 때 한군데에서만 추출하기 보다는 여러 데이터에서 추출하는 경우가 많기 때문에 다른 형식의 데이터를 이용하는데 불필요한 수고가 들어가게 된다. 때문에 여러군데의 데이터를 한 가지 형식으로 맞추어 통합적으로 구축하여 연구 시 데이터 사용에 용이하도록 설계 하였다. 또한 발표된 단백질 기능 예측 방법에 대한 정리를 통해 앞으로의 연구를 하는데 있어서 필요한 자료를 얻고 열람할 수 있도록 설계하였다. 이를 통해 관련 연구를 하거나 관심이 있는 사람들의 데이터를 검색하는데 많은 도움이 될 것이다.

  • PDF

BERT Mask-Filling과 단백질-단백질 상호작용 모델을 이용한 SARS-CoV-2 변이 예측 알고리즘 (SARS-CoV-2 Variant Prediction Algorithm Using the Protein-Protein Interaction Model with BERT Mask-Filling)

  • 공현승
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.283-284
    • /
    • 2021
  • 최근 SARS-CoV-2 백신들의 예방접종이 진행됨에 따라 코로나 19 팬데믹의 종결이 예상되고 있다. 하지만 계속해서 출현 중인 변종 바이러스들은 팬데믹 종결의 위험요소로 남아있다. 본 논문에서는 사전학습된 단백질 BERT와 단백질-단백질 상호작용 모델을 활용한 SARS-CoV-2 스파이크 단백질의 변이 예측 분석 알고리즘을 제안한다. 제안하는 기술은 변이 단백질 서열의 예측과 변이 단백질과 human ACE2 수용체의 친화도에 따른 자연선택으로 이루어진다. 이를 통해 시간이 지나며 나타날 수 있는 변종 바이러스들을 시뮬레이션 할 수 있어 변종 바이러스들의 해결에 기여할 것으로 기대된다.

  • PDF

단백질 상호 작용 예측을 위한 SVM의 부정예제 생성방법론 (Negative example generation methods of SVM for predicting protein-protein interactions)

  • 김철환;정유진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.265-267
    • /
    • 2004
  • 생명체의 기본 정보가 저장된 DNA에서 생성되는 단백질은 생명 현상의 중요한 기능적 역할을 수행하기 때문에 단백질과 관련된 다양한 연구가 진행되고 있다. 본 논문에서는 단백질간 상호작용(protein-protein interaction)을 예측하기 위해 시스템을 통계학적 모델인 Support Vector Machine(SVM)을 사용하였다. SVM 시스템은 상호작용이 있는 데이터(긍정예제)와 상호작용이 없는 데이터(부정예제)를 입력으로 하여 모델링 생성과 테스트를 하는데, 상호작용이 있는 데이터는 DIP에 있는 interaction list로 해결이 가능하지만 상호작용이 없는 데이터는 현재 존재하지 않기 때문에 이를 생성하기 위한 생성방법이 필요하다. 이 논문에서는 shuffling, non-interaction list, 그리고 앞의 두 방법을 보완하는 non-interaction list + shuffling이라는 방법을 제시하고 기존의 실험 결과를 상회하는 부정예제 생성방법을 제시한다.

  • PDF

PreSPI: 단백질 상호작용 예측 서비스 시스템 (PreSPI: Protein-Protein Interaction Prediction Service System)

  • 한동수;김홍숙;장우혁;이성독
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권6호
    • /
    • pp.503-513
    • /
    • 2005
  • 계산을 통한 단백질 상호작용 예측 기법의 중요성이 제기되면서 많은 단백질 상호 작용 예측 기법이 제안되고 있다. 하지만 이러한 기법들이 일반 사용자가 손쉽게 사용할 수 있는 서비스 형태로 제공되고 있는 경우는 드물다. 본 논문에서는 현재까지 알려진 단백질 상호작용 예측 기법 중 예측 기법의 완성도가 높고 상대적으로 예측 정확도가 높은 것으로 알려진 도메인 조합 기반 단백질 상호 작용 예측 기법을 이용하여 서비스 시스템으로 설계하고 구현하였다. 효모(Yeast)의 단백질 집합에 대하여 학습한 후, 학습된 단백질 집합과 공통된 도메인을 가지지만 학습 집합에 존재하지 않는 단백질 쌍들에 예측 기법을 적용하여 매우 높은 $77\%$의 민감도(sensitivity)와 $95\%$의 특이도(specificity)를 보였다. 더불어 DIP CORE, HMS-PCI, TAP 데이타의 테스트를 통해서 이 기법의 안정성을 확인하였다. 시스템의 기능들은 핵심 기능, 부가 기능 그리고 일반 서비스 기능으로 분류하였다. 시스템 설계의 주요 목표인 성능, 개방성 그리고 확장성에 따라, 개별 서비스들은 병렬화, 웹 서비스 표준 준수 및 계층화된 구조화를 지원하도록 구현하였다. 본 논문에서는 몇 가지 대표적인 사용자 인터페이스와 상세한 사용 지침도 소개한다.