• Title/Summary/Keyword: 단백질 구조

Search Result 1,036, Processing Time 0.036 seconds

Development of a Translator from PDB Data to PSAML (PDB 데이터에서 PSAML로의 변환도구 개발)

  • Cho, Min-Su;Lee, Su-Hyun;Lee, Myung-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2403-2406
    • /
    • 2002
  • 현재의 단백질 구조비교 시스템들 사이의 호환성이나 상호작용성의 문제를 해결하고 단백질 구조를 비교하는 시스템을 신속히 개발하기 위해서 단백질 3차구조를 표현하기 위한 데이터를 추출하여 XML과 같은 표준 형식으로 기술된 데이터를 제공하는 것이 바람직하다. 이에 따라 단백질의 2차구조 구성요소와 그들 사이의 관계를 이용하여 단백질 구조를 기술하는 PSA가 제안되었으며, PSA를 기반으로 하여 단백질 데이터의 XML 표현기법인 PSAML이 제안되었다. 본 논문에서는 PSAML 데이터의 생성을 위하여 PDB에서 제공되는 데이터를 PSAML 형식으로 변환시키는 도구를 설계하고 구현하였다. 변환도구는 XML DOM과 Java를 이용하여 구현되었으며, 생성된 데이터는 단백질 구조 및 유사성을 비교하기 위한 단백질 구조비교 시스템에서 사용될 수 있다.

  • PDF

머신 러닝을 통한 단백질의 자유 에너지 예측

  • Lee, Gwang-Jung;Ham, Si-Hyeon
    • Proceeding of EDISON Challenge
    • /
    • 2017.03a
    • /
    • pp.95-99
    • /
    • 2017
  • Protein contact map은 단백질 삼차구조에 대한 정보를 이차원의 이미지로 표현하는 방법의 하나로, 비교적 간략하지만 단백질 구조에 대한 핵심적 정보를 함축하고 있다. 이러한 단백질 구조를 바탕으로 단백질의 internal energy, solvation free energy, free energy 와 같은 열역학 함수를 도출할 수 있다. 본 연구에서는 이미지 인식에 대한 머신러닝 기법을 사용하여 단백질 구조를 함축하는 단백질의 contact map으로부터 단백질의 열역학적 함수를 예측하는 연구를 진행하였다. 단백질의 main-chain 간의 contact map, side-chain 간의 contact map, main-chain과 side-chain 간의 contact map 들로부터 단백질의 여러 가지 열역학적 함수를 예측하고자 했으며 최종적으로 Convolution Neural Network (CNN) 기법을 사용하여 단백질의 free energy를 ~18 kcal/mol의 범위에서 예측 가능함을 보였다. 본 연구를 바탕으로 단백질의 contact map과 열역학 함수 사이의 상관관계가 있으며, 머신러닝 기법을 사용하여 단백질 contact map으로부터 열역학적 함수를 예측하는 것이 가능함을 보였다.

  • PDF

An Efficient Fault Tolerant Apriori Algorithm for Local Protein Structures (단백질 부분 구조를 위한 효율적인 오류 허용 알고리즘)

  • ;;;R.S. Ramakrishna
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.869-871
    • /
    • 2003
  • 단백질 부분 구조는 일종의 단백질 패턴으로써 진화적인 성질을 띄고 있다. 본 논문에서는 단백질 간의 열 안정성과 이러한 단백질 부분 구조 간의 관련성에 대해서 알아보고자 한다. 또한 오류 허용 알고리즘 (FT-Apriori)의 성능을 향상시킬 수 있는 효과적인 기법을 제안한다. 이러한 기법을 단백질 부분 구조에 적용시킴으로써 실제 단백질 데이터에서 그 효용성을 일아본다.

  • PDF

Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences (단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측)

  • Chi, Sang-mun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.9
    • /
    • pp.1816-1821
    • /
    • 2016
  • Protein secondary structure is important for the study of protein evolution, structure and function of proteins which play crucial roles in most of biological processes. This paper try to effectively extract protein secondary structure information from the large protein structure database in order to predict the protein secondary structure of a query protein sequence. To find more remote homologous sequences of a query sequence in the protein database, we used PSI-BLAST which can perform gapped iterative searches and use profiles consisting of homologous protein sequences of a query protein. The secondary structures of the homologous sequences are weighed combined to the secondary structure prediction according to their relative degree of similarity to the query sequence. When homologous sequences with a neural network predictor were used, the accuracies were higher than those of current state-of-art techniques, achieving a Q3 accuracy of 92.28% and a Q8 accuracy of 88.79%.

변형펩타이드(Peptide Mimetics) 연구동향

  • Choe, Jin-Ho
    • Bulletin of Food Technology
    • /
    • v.15 no.2
    • /
    • pp.3-24
    • /
    • 2002
  • 펩타이드와 단백질은 전사, 번역, 후번역 단계에 걸친 모든 생물학적 반응을 조절한다. 그러나 분자수준에서 구조와 기능에 대한 우리의 이해는 초보적인 수준이다. 구조와 기능의 연관성에 대한 문제는 펩타이드와 단백질 자체에 대한 것과는 좀 다르다는 것을 명확히 할 필요가 있다. Multidomain을 갖는 단백질은 작고 통합적이며, 구조적으로 제한된 부분으로 쪼개는 것은 천연 단백질의 활성을 모방하여 저분자의 nonpeptide를 설계하는데 있어서 주요한 일이다. 결정적인 역할을 수행하는 domain을 모방하는 것은 특이성과 치료 효과에 있어서 자연적으로 얻어지는 단백질 물질과 비교하여 이로운 특성을 갖을 수 있고 분자 인지 분야에 관한 연구에 유용한 단서를 제공한다(Chen etal., 1992). 한편 펩타이드는 환경에 의해 구조가 심하게 영향을 받아 특성이 쉽게 변한다(Marshall et al., 1978). 수용액 내에서 이러한 구조적 유동성 때문에 그들이 결합할 수용체나 생리활성을 띄는 구조를 결정하는 것은 어렵고 복잡한 일이다(Fauchre,1987; Hruby, 1987). 구조를 한정하면 이러한 결정을 매우 쉽게 할 수 있다(Hrubyet al., 1987). 단백질 모방학은 분자지각 연구에 강력한 수단이며, 복잡한 단백질과 펩타이드의 구조-기능관계를 탐구하고 분석하는데 독특한 방법이다. 이 장에서는 매우넓고 빠르게 확장되고 있는 Peptidomimetic연구를 간략히 소개하고 있다. 단 본문은 기술 범위를 N-Methylated 아미노산과 스테로이드 등으로 제한하여 소개한다.

  • PDF

Clustered Segment Indexing for Searching on the Secondary Structure of Protein (단백질 이차구조의 검색을 위한 클러스터링된 세그먼트 인덱싱)

  • 서민구;박상현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.298-300
    • /
    • 2004
  • 바이오 인포메틱스에서의 데이터 검색은 DNA와 단백질 시퀀스에 대해서 주로 이루어지며, 지금까지의 연구는 주로 DNA와 단백질 1차 구조의 검색에 대해 이루어졌다. 단백질 2차구조는 1차구조 내 인접한 아미노산들의 공간적인 배열을 나타내며. 단백질의 기능을 예측하는데 중요한 3차구조의 지역적 아미노산의 특성을 나타낸다. 따라서 2차구조에 대한 검색은 단백질의 기능을 이해하는데 매우 중요한 역할을 한다[1]. 이 논문에서는 단백질 2차구조 및 질의 문자열을 세그먼트 단위로 나누고 검색하는 r41의 방법을 개선하여 세그먼트를 조합한 클러스터 구조 및 Look Ahead를 사용해 Exact Matching 및 Wildcard Matching 질의를 효율적으로 처리할 수 있는 기법을 제시한다.

  • PDF

A Performance Comparison of Protein Profiles for the Prediction of Protein Secondary Structures (단백질 이차 구조 예측을 위한 단백질 프로파일의 성능 비교)

  • Chi, Sang-Mun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.22 no.1
    • /
    • pp.26-32
    • /
    • 2018
  • The protein secondary structures are important information for studying the evolution, structure and function of proteins. Recently, deep learning methods have been actively applied to predict the secondary structure of proteins using only protein sequence information. In these methods, widely used input features are protein profiles transformed from protein sequences. In this paper, to obtain an effective protein profiles, protein profiles were constructed using protein sequence search methods such as PSI-BLAST and HHblits. We adjust the similarity threshold for determining the homologous protein sequence used in constructing the protein profile and the number of iterations of the profile construction using the homologous sequence information. We used the protein profiles as inputs to convolutional neural networks and recurrent neural networks to predict the secondary structures. The protein profile that was created by adding evolutionary information only once was effective.

Evaluation of Information Representation Goodness-of-fit According to Protein Visualization Pattern (단백질 가시화 형태에 따른 정보표현적합도 평가)

  • Byeon, Jaehee;Choi, Yoo-Joo;Suh, Jung-Keun
    • Journal of Internet Computing and Services
    • /
    • v.16 no.2
    • /
    • pp.117-125
    • /
    • 2015
  • The information about protein structure gives the clues for the function of protein. It is needed for the improvement for the efficacy and fast development of protein drugs. So, the studies visualizing the structure of protein effectively increase. Most studies of visualization focus on the structural prediction for protein or the improvement on the rendering speed. However, studies of information delivery depending on the form of protein visualization are very limited. The major objective of this study is to analyze the information representation goodness-of-fit for the patterns of the hybrid visualization with primary and secondary structures of protein. Those hybrid visualizations included the patterns which updated current representative visualization services, Chimera, PDB and Cn3D. Information factor to analyze information representation goodness-of-fit is assorted by protein primary structure, secondary protein structure, the location of amino acid and ratio information about protein secondary structure, based on the result of subject-analysis. Subject is the group of experts who are involved in protein drug development over 5 years. The result of this study shows the meaningful difference in the information representation goodness-of-fit by the patterns of hybrid visualization and proves the difference in the information by the pattern of visualization.

A Method to Predict Protein Functional Relationships from Protein Structures (단백질 구조기반 단백질 간의 기능관계 예측 기법)

  • Kim, Sun-Shin;Jung, Kwang-Su;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.55-58
    • /
    • 2005
  • 단백질 구조로부터 단백질사이의 기능관계를 유추하는 일은 생명정보학에 있어서 중요한 연구과제이다. 여기서, 단백질 1차 구조로부터 단백질 기능관계의 예측이 용이한 진화적으로 가까운 종간에는, 아미노산 서열을 비교하여 결과를 획득하고, 진화적으로 먼 종간에는 단백질 3차 구조 및 표면구조를 종합적으로 활용함으로써, 단백질간의 기능관계를 보다 효율적이고 정확하게 예측할 수 있음을 보인다.

  • PDF

Predict Protein Secondary Structure based on Emerging Sequence Mining (출현 시퀀스 마이닝 기반의 단백질 2 차 구조 예측)

  • Li, Meijing;Lee, Heon Gyu;Saeed, Khalid E.K.;Shon, Ho Sun;Ryu, Keun Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.379-382
    • /
    • 2009
  • 최근 단백질 기능 예측을 위한 서열비교와 구조비교 기법들은 정확한 분류가 가능한 반면, 새로운 단백질 기능 분류를 함에 있어서 많은 복잡도가 따른다. 따라서 이 논문에서는 보다 빠른 단백질의 구조 분류 및 예측을 위하여 출현 시퀀스(emerging sequence)를 기반으로 하는 분류기법을 제안하였다. 이 기법에서는 먼저, 출현 시퀀스 마이닝 알고리즘을 이용하여 단백질 서열 데이터로부터 4 가지의 단백질 2 차 구조 출현 시퀀스를 발견하고, SVM을 이용하여 단백질의 출현 시퀀스 속성으로부터 단백질의 2 차 구조를 예측하였다.