• 제목/요약/키워드: Protein Structure Prediction

검색결과 104건 처리시간 0.023초

Backbone 1H, 15N, and 13C resonance assignments and secondary structure prediction of NifU-like protein, HP1492 from Helicobacter Pylori

  • Lee, Ki-Young;Kang, Su-Jin;Bae, Ye-Ji;Lee, Kyu-Yeon;Kim, Ji-Hun;Lee, Ingyun;Lee, Bong-Jin
    • 한국자기공명학회논문지
    • /
    • 제17권2호
    • /
    • pp.105-110
    • /
    • 2013
  • HP1492 is a NifU-like protein of Helicobacter pylori (H. pylori) and plays a role as a scaffold which transfer Fe-S cluster to Fe-S proteins like Ferredoxin. To understand how to bind to iron ion or iron-sulfur cluster, HP1492 was expressed and purified in Escherichia coli (E. coli). From the NMR measurement, we could carry out the sequence specific backbone resonance assignment of HP1492. Approximately 91% of all resonances could be assigned unambiguously. By analyzing results of CSI and TALOS from NMR data, we could predict the secondary structure of HP1492, which consists of three ${\alpha}$-helices and three ${\beta}$-sheets. This study is an essential step towards the structural characterization of HP1492.

단백질 구조 예측을 위한 서열 연관 규칙 탐사 (Discovering Sequence Association Rules for Protein Structure Prediction)

  • 김정자;이도헌;백윤주
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.553-560
    • /
    • 2001
  • 바이오정보학(bioinformatic)은 생물학 분야 특히 분자 수준의 유전체 연구에서 발생하는 데이터를 저장, 관리, 분석하여 실험 프로젝트를 지원함은 물론, 기능 예측 및 조절에 대한 실험 설계를 가능하게 하는 제반 컴퓨터 기술을 의미한다. 유전체 연구의 다양한 접근 방식 중 단백체학(proteomics)는 유전체의 최종 산물인 단백질을 직접적으로 다룬다는 측면에서 그 효용성에 대해 많은 기대를 모으고 있다. 본 논문에서는 단백질의 기능을 결정하는 가장 중요한 요소 중 하나인 단백질의 구조를 예측하기 위한 데이터 마이닝 기법을 제안한다. 단백질의 일차 구조인 아미노산 서열에 타나나는 부서열간의 연관성이 해당 단백질의 이차 혹은 삼차 구조를 결정하는 중요한 단서임을 설명하고, 아미노산 부서열간의 연관성을 표현하기 위한 모델로서 서열 연관 규직을 정의한다. 서열 연관 규칙의 유용성을 평가하기 위한 지지도와 신뢰도를 새롭게 정의하고, 주어진 단백질 집단으로부터 유용한 서열 연관 규칙을 발견하기 위한 기법을 제안한다. 아울러, SWISS-PROT 단백질 데이터베이스로부터 입수한 단백질 서열 데이터를 이용하여 제안한 기법의 성능을 평가한다.

  • PDF

단백질 모티프 예측 및 갱신 프로토 타입 구현 (Implementation of Prototype for a Protein Motif Prediction and Update)

  • 노기용;김원식;이범주;이상태;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.845-854
    • /
    • 2004
  • 모티프 데이터베이스는 새롭게 등장하는 원시 단백질 서열의 기능 및 구조 예측에 사용된다. 이러한 모티프 데이터베이스들은 원시 단백질 서열의 빠른 성장과 더불어 급속한 이용 증가 추세를 보이고 있으며, 최근에 이르러 모티프 자원 통합에 관한 연구가 진행되고 있다. 그러나 이러한 모티프 데이터베이스들은 각기 개별적인 메소드로 개발되었기 때문에 각기 다른 형식의 검색 결과를 제공한다. 이러한 문제 해결을 위한 데이터베이스 통합에서는 데이터베이스 자동 갱신 문제, 복잡한 질의 처리 문제, 중복된 데이터베이스 엔트리 핸들링 문제, XML 지원 문제 등을 지니고 있다. 이 논문에서는 기존 문제점들을 해결하기 위하여 데이터베이스 자원 통합 방법론을 제안하였고, 통합된 데이터베이스의 주기적 갱신 방안과 XML로의 변환에 관하여 기술하였다. 아울러 구축된 통합 데이터베이스와 사례 데이터베이스를 비교 평가하였다.

단백질 구조 및 기능 분석을 위한 FEATURE 시스템 개선 (Deciphering FEATURE for Novel Protein Data Analysis and Functional Annotation)

  • 유승학;윤성로
    • 전기전자학회논문지
    • /
    • 제13권3호
    • /
    • pp.18-23
    • /
    • 2009
  • FEATURE는 단백질 내에서 특정 기능이나 구조를 가지고 있는 site의 미세환경분포를 이용하여 다른 단백질 내에서 이와 유사한 미세환경을 가지고 있는 부분을 찾아 그 분분이 site일 확률을 수치적으로 제시해 줌으로써 사용자로 하여금 site의 존재 유무와 그 위치를 판단하는데 기준을 제공해주는 유용한 툴이다. 하지만 기존의 FEATURE에서 사용된 데이터 이외의 새로운 단백질 구조 데이터를 FEATURE에 적용하기 위해서는 FEATURE 내부의 module을 입력 데이터 구조에 맞게 수정해야 한다. 그러나 FEATURE 내부의 module 구조를 수정하는 방식이 직관적이지 않기 때문에 많은 연구자들이 FEATURE를 원활하게 사용하지 못하였다. 따라서 본 논문에서는 FEATURE의 내부 구조를 분석하고 FEATURE를 새로운 단백질 데이터에 적용하기 위한 방법을 제시한다.

  • PDF

Analysis of a Large-scale Protein Structural Interactome: Ageing Protein structures and the most important protein domain

  • Bolser, Dan;Dafas, Panos;Harrington, Richard;Schroeder, Michael;Park, Jong
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.26-51
    • /
    • 2003
  • Large scale protein interaction maps provide a new, global perspective with which to analyse protein function. PSIMAP, the Protein Structural Interactome Map, is a database of all the structurally observed interactions between superfamilies of protein domains with known three-dimensional structure in thePDB. PSIMAP incorporates both functional and evolutionary information into a single network. It makes it possible to age protein domains in terms of taxonomic diversity, interaction and function. One consequence of it is to predict the most important protein domain structure in evolution. We present a global analysis of PSIMAP using several distinct network measures relating to centrality, interactivity, fault-tolerance, and taxonomic diversity. We found the following results: ${\bullet}$ Centrality: we show that the center and barycenter of PSIMAP do not coincide, and that the superfamilies forming the barycenter relate to very general functions, while those constituting the center relate to enzymatic activity. ${\bullet}$ Interactivity: we identify the P-loop and immunoglobulin superfamilies as the most highly interactive. We successfully use connectivity and cluster index, which characterise the connectivity of a superfamily's neighbourhood, to discover superfamilies of complex I and II. This is particularly significant as the structure of complex I is not yet solved. ${\bullet}$ Taxonomic diversity: we found that highly interactive superfamilies are in general taxonomically very diverse and are thus amongst the oldest. This led to the prediction of the oldest and most important protein domain in evolution of lift. ${\bullet}$ Fault-tolerance: we found that the network is very robust as for the majority of superfamilies removal from the network will not break up the network. Overall, we can single out the P-loop containing nucleotide triphosphate hydrolases superfamily as it is the most highly connected and has the highest taxonomic diversity. In addition, this superfamily has the highest interaction rank, is the barycenter of the network (it has the shortest average path to every other superfamily in the network), and is an articulation vertex, whose removal will disconnect the network. More generally, we conclude that the graph-theoretic and taxonomic analysis of PSIMAP is an important step towards the understanding of protein function and could be an important tool for tracing the evolution of life at the molecular level.

  • PDF

단백질 2차 구조를 이용한 유사 GPCR 검출에 관한 연구 (A Study on the Detection of Similarity GPCRs by using protein Secondary structure)

  • 구자효;한찬명;윤영우
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.73-80
    • /
    • 2009
  • GPCR(Gprotein-coupled receptors) 패밀리(family)는 세포막 단백질로서, 외부 신호를 세포막을 경유하여 세포 내로 전달하는 신호전달 기전에서 중요한 역할을 담당한다. 그러나 GPCR마다 다양하고 복잡한 조절기전을 보이며 매우 특이적인 신호전달 기전을 가지는 것으로 알려져 있다. GPCR의 구조적인 특징과 패밀리 및 서브패밀리 등은 기능별로 잘 알려져 있는데 과거 GPCR을 찾아내는 연구 중에 가장 기본이 되는 일이 주어진 단백질 서열로부터 GPCR을 분류하는 일이다. 이미 발견된 GPCR들을 가지고 수학적인 모델을 이용하여 보다 정확하게 분류하는 연구가 주로 진행되어 왔다. 본 논문에서는 단백질의 기능이 입체적 구조에 의해 결정되는 점에 착안하여 두 GPCR의 아미노산 서열의 유사도가 낮은 경우에 그 2차 구조의 서열을 비교함으로써 기존의 발견된 GPCR의 데이터베이스에서 동일한 기능을 가졌을 것으로 추정되는 미지의 GPCR을 검출하는 방법을 제안한다.

도시지역에 있어서 선어의 수요분석 -육류와의 대체관계를 중심으로- (Demand Analysis of Fresh-fish in the Urban Communities)

  • 김수관
    • 수산경영론집
    • /
    • 제15권1호
    • /
    • pp.114-130
    • /
    • 1984
  • The structure of food demand is being changed according to the improvement of living standard. Moreover, the intake of animal protein is stepping up. This paper considers how much fresh-fish is consumed as source of animal protein and what extent fresh-fish have substitutive relation for meat with special reference to the change of income and price of fresh-fish and meat. And it is thought to be important work to estimate demand of fresh-fish in attemps to the prediction of food consume pattern and fishing industries in the future. For this estimation, the substitutive relation of fresh-fish and meat is essentially studied. The main conclusions of this study can be drawn as follows: 1. Fresh-fish and meat have substitutive relation on price axis. By the way, increase in demand of A (fresh-fish which have comparatively low price) can be expected according to the low of it's price against meat, but B (fresh-fish wihich have comparatively middle-high price) have peculiar demand without substitutive relation for meat. 2. Demand of A and B rise according to the income increases. 3. It is not sufficient to explain substutive relation of fresh-fish and meat without income variable. 4. Income increases bring about the more increase in demand of B than A. By the way, price increases bring about the decrease of it's consume expenditure, but A have fundamental demand as the source of animal protein. 5. In future, the intake of animal protein will step up. By the way, meat will occupy the more portion of the source of animal protein than fresh-fish.

  • PDF

단백질 허브 네트워크에서 도메인분석을 통한 단백질 기능발견 시스템 (Protein Function Finding Systems through Domain Analysis on Protein Hub Network)

  • 강태호;류제운;김학용;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.259-271
    • /
    • 2008
  • 본 논문에서는 단백질-단백질 상호작용과 도메인 분석을 통해 기능이 알려지지 않은 미지 단백질의 기능을 예측할 수 있는 알고리즘을 제안한다. 먼저 MIPS 데이터베이스로부터 효모에 대한 단백질-단백질 상호작용(PPI) 네트러크를 구축한다. 구축된 PPI 네트워크는(단백질 3,637개, 상호작용 10,391개) 많은 상호작용을 갖는 소수의 단백질들을 갖으면서 단백질 클러스터의 고유한 모듈성을 보이는 스케일 프리 네트워크와 계층적 네트워크의 특성을 보인다 단백질-단백질 상호작용 데이터베이스는 Y2보(Yeast Two Hybrid) 실험 등으로 얻어졌기 때문에 부정확한 데이터를 포함하고 있다. 따라서 본 논문에서는 세포상의 localization을 고려하여 부정확한 데이터를 정제하여 PPI 네트워크를 재구축한다. 그리고 허브 단백질과 네트워크 구조를 분석하여 네트워크로부터 구조적 모듈을 발견하고 이를 정의한다. 또한 이러한 구조적 모듈로부터 단백질의 도메인을 분석하여 기능적 모듈을 밝히고, 높은 확실성을 가지는 기능적 모듈을 기반으로 미지 단백질에 대한 기능을 예측한다.

소분자 도킹에서 탐색공간의 축소 방법 (Search Space Reduction Techniques in Small Molecular Docking)

  • 조승주
    • 통합자연과학논문집
    • /
    • 제3권3호
    • /
    • pp.143-147
    • /
    • 2010
  • Since it is of great importance to know how a ligand binds to a receptor, there have been a lot of efforts to improve the quality of prediction of docking poses. Earlier efforts were focused on improving search algorithm and scoring function in a docking program resulting in a partial improvement with a lot of variations. Although these are basically very important and essential, more tangible improvements came from the reduction of search space. In a normal docking study, the approximate active site is assumed to be known. After defining active site, scoring functions and search algorithms are used to locate the expected binding pose within this search space. A good search algorithm will sample wisely toward the correct binding pose. By careful study of receptor structure, it was possible to prioritize sub-space in the active site using "receptor-based pharmacophores" or "hot spots". In a sense, these techniques reduce the search space from the beginning. Further improvements were made when the bound ligand structure is available, i.e., the searching could be directed by molecular similarity using ligand information. This could be very helpful to increase the accuracy of binding pose. In addition, if the biological activity data is available, docking program could be improved to the level of being useful in affinity prediction for a series of congeneric ligands. Since the number of co-crystal structures is increasing in protein databank, "Ligand-Guided Docking" to reduce the search space would be more important to improve the accuracy of docking pose prediction and the efficiency of virtual screening. Further improvements in this area would be useful to produce more reliable docking programs.

Analysis, Detection and Prediction of some of the Structural Motifs in Proteins

  • Guruprasad, Kunchur
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.325-330
    • /
    • 2005
  • We are generally interested in the analysis, detection and prediction of structural motifs in proteins, in order to infer compatibility of amino acid sequence to structure in proteins of known three-dimensional structure available in the Protein Data Bank. In this context, we are analyzing some of the well-characterized structural motifs in proteins. We have analyzed simple structural motifs, such as, ${\beta}$-turns and ${\gamma}$-turns by evaluating the statistically significant type-dependent amino acid positional preferences in enlarged representative protein datasets and revised the amino acid preferences. In doing so, we identified a number of ‘unexpected’ isolated ${\beta}$-turns with a proline amino acid residue at the (i+2) position. We extended our study to the identification of multiple turns, continuous turns and to peptides that correspond to the combinations of individual ${\beta}$ and ${\gamma}$-turns in proteins and examined the hydrogen-bond interactions likely to stabilize these peptides. This led us to develop a database of structural motifs in proteins (DSMP) that would primarily allow us to make queries based on the various fields in the database for some well-characterized structural motifs, such as, helices, ${\beta}$-strands, turns, ${\beta}$-hairpins, ${\beta}$-${\alpha}$-${\beta}$, ${\psi}$-loops, ${\beta}$-sheets, disulphide bridges. We have recently implemented this information for all entries in the current PDB in a relational database called ODSMP using Oracle9i that is easy to update and maintain and added few additional structural motifs. We have also developed another relational database corresponding to amino acid sequences and their associated secondary structure for representative proteins in the PDB called PSSARD. This database allows flexible queries to be made on the compatibility of amino acid sequences in the PDB to ‘user-defined’ super-secondary structure conformation and vice-versa. Currently, we have extended this database to include nearly 23,000 protein crystal structures available in the PDB. Further, we have analyzed the ‘structural plasticity’ associated with the ${\beta}$-propeller structural motif We have developed a method to automatically detect ${\beta}$-propellers from the PDB codes. We evaluated the accuracy and consistency of predicting ${\beta}$ and ${\gamma}$-turns in proteins using the residue-coupled model. I will discuss results of our work and describe databases and software applications that have been developed.

  • PDF