• 제목/요약/키워드: InterProScan

검색결과 6건 처리시간 0.016초

InterPro의 e-value 조정을 통한 신규 도메인 발견 접근 방식의 문제점 (The Problem of the e-value of InterPro to find additional domains in Domain Combination)

  • 허희영;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.17-21
    • /
    • 2006
  • 도메인 기반 단백질 상호작용 예측 기법은 지난 몇 년 동안 활발히 연구되어 왔다. 도메인 기반 접근 방법 중에서도 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 예측 정확도면에서 다른 기법보다 월등한 결과를 보여주고 있다. 그러나 학습 집단을 사용하는 특징 때문에 전체 도메인 정보를 이용할 수 없는 단점이 있다. 또한, 이 시스템은 도메인 정보가 부족하여 다른 기능을 하는 단백질이라도 같은 도메인 정보를 보여주기 때문에 예측 시스템의 결점을 드러내고 있다. 도메인 조합 기반 단백질 상호작용 가능성 순위 부여 기법은 InterPro 데이터베이스의 도메인 정보를 기반으로 사용한다. InterProScan은 InterPro의 여러 멤버 데이터베이스의 정보를 기반으로 Sequence 분석을 하는 소프트웨어로써 검색 후 단계에서 찾아낸 결과들을 e-value를 기반으로 여과한다. 본 논문에서는 제시된 e-value를 조정 방법을 사용함으로써 단백질 내 도메인 패턴의 다양화와 기존 도메인 정보가 없던 단백질의 도메인을 새롭게 발견할 수 있으나 접근 방식의 한계가 존재함을 확인할 수 있었다.

  • PDF

Web-Based Computational System for Protein-Protein Interaction Inference

  • Kim, Ki-Bong
    • Journal of Information Processing Systems
    • /
    • 제8권3호
    • /
    • pp.459-470
    • /
    • 2012
  • Recently, high-throughput technologies such as the two-hybrid system, protein chip, Mass Spectrometry, and the phage display have furnished a lot of data on protein-protein interactions (PPIs), but the data has not been accurate so far and the quantity has also been limited. In this respect, computational techniques for the prediction and validation of PPIs have been developed. However, existing computational methods do not take into account the fact that a PPI is actually originated from the interactions of domains that each protein contains. So, in this work, the information on domain modules of individual proteins has been employed in order to find out the protein interaction relationship. The system developed here, WASPI (Web-based Assistant System for Protein-protein interaction Inference), has been implemented to provide many functional insights into the protein interactions and their domains. To achieve those objectives, several preprocessing steps have been taken. First, the domain module information of interacting proteins was extracted by taking advantage of the InterPro database, which includes protein families, domains, and functional sites. The InterProScan program was used in this preprocess. Second, the homology comparison with the GO (Gene Ontology) and COG (Clusters of Orthologous Groups) with an E-value of $10^{-5}$, $10^{-3}$ respectively, was employed to obtain the information on the function and annotation of each interacting protein of a secondary PPI database in the WASPI. The BLAST program was utilized for the homology comparison.

영하의 저온에 노출된 'Campbell Early'와 'Muscat Bailey A' 포도나무 신초의 전사체 비교 (Transcriptomic analysis of 'Campbell Early' and 'Muscat Bailey A' grapevine shoots exposed to freezing cold stress)

  • 김선애;윤해근
    • Journal of Plant Biotechnology
    • /
    • 제43권2호
    • /
    • pp.204-212
    • /
    • 2016
  • 환경스트레스 중의 하나인 저온에 대한 생육기의 포도나무의 반응을 분석하고자 -$2^{\circ}C$에서 4일 동안 저온처리 한두 품종('Campbell Early'와 'Muscat Baily A')의 포도나무잎을 이용하여 전사체를 분석하였고 특이발현유전자(differentially expressed genes, DEGs)를 검색하였다. 영하의 저온에 반응한 'Campbell Early'의 DEG를 기능별로 분석한 결과 생물대사에서 17,424개, 세포구성에서 28,954개, 분자기능에서는 6,972개의 유전자와 관련이 있었다. 발현이 유도되는 유전자로는 dehydrin xero 1, K-box region and MADS-box transcription factor family protein과 MYB domain protein 36이 있으며, 억제되는 유전자로는 light-harvesting chlorophyll B-binding protein 3, FASCICLIN-like arabinoogalactan 9와 pectin methylesterase 61 등이 있었다. 'Muscat Baily A'의 DEG는 생물대사에서 1,157개, 세포구성에서 1,350개, 분자기능에서는 431개의 유전자와 관련이 있었다. 발현이 유도되는 유전자로는 NB-ARC domain-containing disease resistance protein, fatty acid hydrozylase syperfamily와 isopentenyltransferase 3이 있으며, 억제되는 유전자로는 binding, IAP-like protein 1과 pentatricopeptide repeat superfamily protein 등이 있었다. Real-time PCR을 이용하여 영하의 저온에서 특이적으로 발현하는 유전자들을 검정하였으며, InterPro Scan을 통해 단백질 도메인을 분석한 결과 두 품종 모두에서 ubiquitin-protein ligase가 가장 많았다. 영하의 저온에 노출된 신초의 전사체 정보를 바탕으로 포도나무에서 저온 내성을 발현하는 기작을 연하는 데에 분자수준의 정보를 제공하고, 내한성 포도를 육종하는데 이용될 수 있을 것이다.

Members of Ectocarpus siliculosus F-box Family Are Subjected to Differential Selective Forces

  • Mahmood, Niaz;Moosa, Mahdi Muhammad;Matin, S. Abdul;Khan, Haseena
    • Interdisciplinary Bio Central
    • /
    • 제4권1호
    • /
    • pp.1.1-1.7
    • /
    • 2012
  • Background: The F-box proteins represent one of the largest families of proteins in eukaryotes. Apart from being a component of the ubiquitin (Ub)/26 S proteasome pathways, their regulatory roles in other cellular and developmental pathways have also been reported. One interesting feature of the genes encoding the proteins of this particular family is their variable selection patterns across different lineages. This resulted in the presence of lineage specific F-box proteins across different species. Findings: In this study, 48 non-redundant F-box proteins in E. siliculosus have been identified by a homology based approach and classified into three classes based on their variable C-terminal domains. A greater number of the F-box proteins have domains similar to the ones identified in other species. On the other hand, when the proteins having unknown or no C-terminal domain (as predicted by InterProScan) were analyzed, it was found that some of them have the polyglutamine repeats. To gain evolutionary insights on the genes encoding the F-box proteins, their selection patterns were analyzed and a strong positive selection was observed which indicated the adaptation potential of the members of this family. Moreover, four lineage specific F-box genes were found in E. siliculosus with no identified homolog in any other species. Conclusions: This study describes a genome wide in silico analysis of the F-box proteins in E. siliculosus which sheds light on their evolutionary patterns. The results presented in this study provide a strong foundation to select candidate sequences for future functional analysis.

생명정보 콘텐트 업데이트에 관한 연구 (A Study on Update of Bioinformatics Contents)

  • 안부영;한정민;홍순찬;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.452-455
    • /
    • 2007
  • 생명과학 기술의 급속한 발달로 인류 복지 증진에 많은 기여를 하였지만 아직도 각종 질병 등으로 많은 사람들이 고통 받고 있으며, 이를 극복하기 위한 연구 및 기술개발은 세계 각처에서 계속되고 있다. 이러한 연구 및 기술개발의 결과로 산출되는 생명정보 데이터의 양은 기하급수적으로 증가하고 있기에 이런 방대한 양의 생명정보 데이터를 분석하고 분석된 데이터에서 인류 복지에 유용한 정보를 얻기 위한 생명정보학(Bioinformatics)이 등장하게 되었다. 이에, 한국과학기술정보연구원(KISTI)은 IT 기반 생명정보 인프라 구축의 중심기관으로 CCBB(Center for Conputationa Biology & Bioinformatics) 웹사이트를 운영하고 있다. CCBB는 전산학적인 기술을 이용한 생명현상 연구를 지원하기 위하여 21종의 생명정보 콘텐트(DB 및 분석도구)를 수집 분석 구축 제공하고 있다. 이 중에서 GenBank, PDB, PIR, Swiss-prot 등의 데이터베이스는 KISTI에서 개발한 KRISTAL 검색엔진을 통하여 국내에서도 빠르고 쉽게 검색 가능하도록 자체 구축하고 있으며, 이와 더불어 BLAST, FASTA, ClustalW 등의 주요 분석 도구 또한 제공하고 있다. 본 논문에서는 CCBB에서 제공중인 21종의 콘텐트 중에서 GenBank, REBASE, GeneCards, InterProScan 등 4종의 대용량 고효율 생명정보 콘텐트의 소개 및 업데이트 방법에 관한 내용을 기술하고자 한다.

Smear layer 처리에 따른 미세누출에 대한 연구 (THE EFFECT OF SMEAR LAYER TREATMENT ON THE MICROLEAKAGE)

  • 이정민;박상혁;최기운
    • Restorative Dentistry and Endodontics
    • /
    • 제31권5호
    • /
    • pp.378-389
    • /
    • 2006
  • 본 연구는 도말층 제거 여부에 따른 근관 밀폐효과를 평가하기 위해 단근관 치아를 3% NaOCl 하에서 Ni-Ti file을 이용하여 crown-down법으로 근관 형성 후 최종세정제로 NaOCl을 사용한 군과 EDTA를 사용한 군, 6개월 보관한 NaOCl-6군과 EDTA-6군으로 분류하였다. Continuous wave법으로 근관 충전 시행 후 색소 침투를 시행한 다음 해부학적 근첨에서 1.5 mm (Level 1), 3.0 mm (Level 2), 4.5 mn (Level 3)에서 수평절단 하여 누출률을 측정하였다. 1. 모든 실험군에서 평균 누출률은 치근단부에서 치경부로 갈수록 감소하였다. 2. NaOCl군의 누출률이 EDTA 군보다 level 1 2, 3에서 높게 나타났으나 level 1에서만 통계학적 유의차를 보였다 (p < 0.05). 3. NaOCl-6군의 누출률이 EDTA-6 군보다 Level 1, 2, 3에서 높게 나타났으나 level 1에서만 통계학적 유의차를 보였다 (p < 0.05). 4. NaOCl-6군의 누출률이 NaOCl군에 비해 Level 1, 2, 3에서 증가하였으나 level 1에서만 통계학적 유의차를 보였다 (p < 0.05). 5. EDTA-6군의 누출률이 EDTA 군에 비해 Level 1, 2, 3에서 증가하였으나 통계학적 유의차는 없었다. 6. 주사전자현미경 관찰 결과 NaOCl 군과 NaOCl-6 군은 도말층이 제거되지 않아 상아세관내로 sealer 및 근관충전재가 침투하지 못한 반면, EDTA 군과 EDTA-6 군에서는 도말층이 제거되고 상아세관내로의 sealer와 근관충전재의 침투가 관찰되었다. 이상의 연구결과 EDTA를 이용하여 도말층을 제거한 경우 근관충전 즉시와 6개월 후 치근단 1/3 부위의 근단부 미세누출을 감소시킬 수 있을 것으로 사료된다.