• Title/Summary/Keyword: 단백질 구조 비교

Search Result 226, Processing Time 0.025 seconds

A Performance Comparison of Protein Profiles for the Prediction of Protein Secondary Structures (단백질 이차 구조 예측을 위한 단백질 프로파일의 성능 비교)

  • Chi, Sang-Mun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.22 no.1
    • /
    • pp.26-32
    • /
    • 2018
  • The protein secondary structures are important information for studying the evolution, structure and function of proteins. Recently, deep learning methods have been actively applied to predict the secondary structure of proteins using only protein sequence information. In these methods, widely used input features are protein profiles transformed from protein sequences. In this paper, to obtain an effective protein profiles, protein profiles were constructed using protein sequence search methods such as PSI-BLAST and HHblits. We adjust the similarity threshold for determining the homologous protein sequence used in constructing the protein profile and the number of iterations of the profile construction using the homologous sequence information. We used the protein profiles as inputs to convolutional neural networks and recurrent neural networks to predict the secondary structures. The protein profile that was created by adding evolutionary information only once was effective.

Efficient Sequence Association Rule Mining for Discovering Protein Relations (단백질 서열 연관 규칙 마이닝을 위한 효율적인 알고리즘 설계)

  • Kim, Hyun-Min;Kim, Ji-Hye;Ramakrishna, R.S.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1183-1186
    • /
    • 2002
  • DNA 의 염기서열 탐색을 위한 유전체학의 다음 세대인 구조유전체학은 유전체 사업으로 인한 인간 게놈지도의 완성과 축적된 생물정보를 이용한 생물정보학의 발달과 함께 급속한 성장을 계속하고 있다. 포스트 게놈 시대를 맞이하여 생명현상에 대한 궁극적인 이해를 위한 노력으로 단백질의 구조와 기능에 대한 연구가 주목을 받게 되었다. 다양한 구조 규명을 위한 도구들과 단백질 정보를 관리하기 위한 데이터베이스 구축에 따른 관련 기술의 발전은, 앞으로 다가올 생물정보의 방대함을 감안할 때, 가치 있는 지식정보를 얻기 위한 데이터 마이닝 기법들을 통해서만 가능하다. 본 논문은 데이터 마이닝의 근간 기술인 연관규칙 마이닝을 응용한 효율적인 서열 연관 규칙 알고리즘을 제안하며, 단백질 구조의 예측을 위한 단백질 서열 및 DNA 서열간의 패턴 비교 및 연관성을 목적으로 한다. 또한, 공간적 시간적 복잡성을 CMS-tree 라는 자료구조를 통해 알고리즘의 확장성 및 병렬화의 기본 알고리즘으로 사용하도록 개발하였다.

  • PDF

An Extraction Technique of Protein Geometric Features for Predicition of Residue Location (잔기 위치 예측을 위한 단백질 기하학적 특징 추출 기법)

  • Yu, Ki-Jin;Jung, Kwang-Su;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.673-676
    • /
    • 2006
  • 생명현상을 이해하기 위해서는 단백질의 기능 규명이 이루어져야한다. 단백질 기능 규명을 위한 서열분석 방법은 서열 상동성이 현저히 낮은 경우 단백질 기능 예측이 불가능하고, 과거의 전체적인 단백질 구조 분석을 통한 기능 예측의 문제점이 보고되고 있다. 이 논문에서는 기능상 중요한 의미를 가지고 있는 단백질의 특정하위구조의 기하학적 특징을 추출하여 이 특징과 잔기의 위치와의 관계를 규명하였다. 또한 NaiveBayes, SVM, C4.5의 분류알고리즘을 이용하여 각 알고리즘별 분류성능을 평가하였다. 기능상 중요한 의미를 가지고 있는 특정하위구조를 비교함으로써 모르는 단백질의 기능을 예측할 수 있다.

  • PDF

Clustered Segment Index for Efficient Approximate Searching on the Secondary Structure of Protein Sequences (클러스터 세그먼트 인덱스를 이용한 단백질 이차 구조의 효율적인 유사 검색)

  • Seo Min-Koo;Park Sang-Hyun;Won Jung-Im
    • Journal of KIISE:Databases
    • /
    • v.33 no.3
    • /
    • pp.251-260
    • /
    • 2006
  • Homology searching on the primary structure (i.e., amino acid arrangement) of protein sequences is an essential part in predicting the functions and evolutionary histories of proteins. However, proteins distant in an evolutionary history do not conserve amino acid residue arrangements, while preserving their structures. Therefore, homology searching on proteins' secondary structure is quite important in finding out distant homology. In this manuscript, we propose an indexing scheme for efficient approximate searching on the secondary structure of protein sequences which can be easily implemented in RDBMS. Exploiting the concept of clustering and lookahead, the proposed indexing scheme processes three types of secondary structure queries (i.e., exact match, range match, and wildcard match) very quickly. To evaluate the performance of the proposed method, we conducted extensive experiments using a set of actual protein sequences. CSI was proved to be faster than the existing indexing methods up to 6.3 times in exact match, 3.3 times in range match, and 1.5 times in wildcard match, respectively.

단백질 ( I )

  • 최진호
    • KOREAN POULTRY JOURNAL
    • /
    • v.23 no.11 s.265
    • /
    • pp.132-135
    • /
    • 1991
  • 단백질은 동물체 조직의 구성성분으로서 중요한 기능을 가지는 영양소이며 탄수화물이나 지방과 함께 에너지를 발생하는 물질이지만 그 분자 구조내에 질소(N)를 함유하고 있다는 점에서 탄수화물이나 지방과 다르다. 단백질은 사료 중에서 비교적 많은 양을 차지하는 영양소이며 상대적으로 가격도 비싸서 일반적으로 사료내에서 가장 비용이 많이 드는 영양소이다. 따라서 여러 가지 영양소 중에서 가장 많은 관심을 끄는 영양소이기도하다.

  • PDF

A new method to predict the protein sequence alignment quality (단백질 서열정렬 정확도 예측을 위한 새로운 방법)

  • Lee, Min-Ho;Jeong, Chan-Seok;Kim, Dong-Seop
    • Bioinformatics and Biosystems
    • /
    • v.1 no.1
    • /
    • pp.82-87
    • /
    • 2006
  • The most popular protein structure prediction method is comparative modeling. To guarantee accurate comparative modeling, the sequence alignment between a query protein and a template should be accurate. Although choosing the best template based on the protein sequence alignments is most critical to perform more accurate fold-recognition in comparative modeling, even more critical is the sequence alignment quality. Contrast to a lot of attention to developing a method for choosing the best template, prediction of alignment accuracy has not gained much interest. Here, we develop a method for prediction of the shift score, a recently proposed measure for alignment quality. We apply support vector regression (SVR) to predict shift score. The alignment between a query protein and a template protein of length n in our own library is transformed into an input vector of length n +2. Structural alignments are assumed to be the best alignment, and SVR is trained to predict the shift score between structural alignment and profile-profile alignment of a query protein to a template protein. The performance is assessed by Pearson correlation coefficient. The trained SVR predicts shift score with the correlation between observed and predicted shift score of 0.80.

  • PDF

Structure and Cell Adhesion Behavior of Silk Fibroin Nanofiber, Microfiber and Film (실크 피브로인 나노섬유, 마이크로섬유, 필름의 구조 및 세포점착 특성비교)

  • 김소현;남영식;박원호;민병무
    • Proceedings of the Korean Fiber Society Conference
    • /
    • 2003.04a
    • /
    • pp.293-294
    • /
    • 2003
  • 견 피브로인은 대표적인 섬유상 단백질의 하나로 생체적합성, 생분해성, 저독성 등의 유용한 특성을 가지므로 생체재료로 상당한 관심과 연구의 대상이 되어왔다. 우리는 최근의 연구에서 견 피브로인을 생사로부터 추출한 다음, 포름산을 용제로 하여 전기방사함으로써 나노섬유를 제조하고 이들의 각화세포에 대한 친화력을 확인한 바 있다. 본 연구에서는 견 피브로인의 구조체를 나노섬유 부직포, 필름, 마이크로 섬유로 구성된 직물 둥의 형태로 하여 그들의 2차 구조를 비교함과 동시에 구조적 특성이 각화세포와의 친화력에 어떠한 영향을 미치는 가를 비교ㆍ검토 하고자 하였다. (중략)

  • PDF

Study of HubWA Protein Folding Reaction by Measuring the Stability of Folding Intermediate (중간단계의 구조적 안정성을 통한 HubWA 단백질의 접힘(folding) 반응 탐색)

  • Soon-Ho Park
    • Journal of the Korean Chemical Society
    • /
    • v.67 no.2
    • /
    • pp.81-88
    • /
    • 2023
  • The contribution of hydrophobic residues to the protein folding reaction was studied by using HubWA variant proteins with I and L to V mutation. Folding kinetics of all V variant proteins was observed to be satisfied by a three-state on-pathway mechanism, U ⇌ I ⇌ N, where U, I, and N represent unfolded, intermediate, and native state, respectively. Three-state folding reaction was quantitatively analyzed and the free energy of folding of each elementary reactions and overall folding reaction, ΔGoUI, ΔGoIN, and ΔGoUN, were obtained. From the ratio of free energy difference between the variant protein and HubWA, ΔΔGoUI/ΔΔGoUN (ΔΔGoUI = ΔGoUI (variant protein) - ΔGoUI (HubWA) and ΔΔGoUN = ΔGoUN (variant protein) - ΔGoUN(HubWA)), the contribution of hydrophobic residues to HubWA folding was analyzed. The residues which are located in the hydrophobic core between α-helix and β-sheet, I3, I13, L15, I30, L43, I61 and L67, showed ΔΔGoUI/ΔΔGoUN value of ~0.5 when each of these residues was mutated to V, indicating that these residues form relatively solid hydrophobic core in the intermediate state. Residues located at the end of secondary structures and loop, I23, L69 and I36 showed ΔΔGoUI/ΔΔGoUN value below 0.4 when each of these residues was mutated to V, indicating that the region containing these residues are loosely formed in the intermediate state. V17A, L50V and L56V showed fairly high ΔΔGoUI/ΔΔGoUN value of ~0.8. Since L50 and L56 are located in the region containing long loop (residue 46 to 62), it is suggested that the high ΔΔGoUI/ΔΔGoUN value of these residues prevents the formation of aggregate at the early stage of folding reaction.

Regulation of Ferritin Synthesis by Iron-responsive Element in 5'-Untranslated Region (5'-Untranslated Region에 존재하는 Iron Responsive Element에 의한 Ferritin 합성조절)

  • Chung, In-Sik;Lee, Jung-Lim;Kim, Hae-Yeong
    • Applied Biological Chemistry
    • /
    • v.41 no.3
    • /
    • pp.224-227
    • /
    • 1998
  • The expression of ferritin involved in iron metabolism is regulated at the translational level by the interaction of iron regulatory protein with iron-responsive element(IRE) in the 5'-untranslated region of ferritin transcript. To identify the role of structural element utilized for translational regulation of ferritin, we studied the effects of mutations in the ferritin IRE by measuring IRP binding activity and translational activity. Our data suggest that the cytosine at bulged position of IRE within ferritin is important for the formation of RNA secondary structure involved in translational regulation.

  • PDF

The Protein Identification system Design and Implementation by Peptide mass mapping in Distributed Environment (분산 환경에서 Peptide Mass Mapping에 의한 단백질 검증 시스템 설계 및 구현)

  • 신민수;김도완;허철구;임소형
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.571-574
    • /
    • 2000
  • 오늘날 단백질 정보 분석은 HGP(Human Genome Project)이후 Post-genome 시대를 맞이하면서 매우 중요한 분야로 인식되고 있다. 이 단백질 정보를 이용하는 응용은 Discovery of Protein Structure/Function Relationships, Evolutionary Relationships, 3D Modeling 등 많은 분야에서 활용되어진다. 여러 가지 분야들 중에서 특히 단백질 구조 분석을 위한 많은 다양한 소프트웨어들이 출현되고 있다. 하지만 복잡하게 얽혀 있는 단백질들을 검증하기 위해서 Mass Spectrometry에서 발생되는 Peptide Masses의 정보들을 이용할 수 있다. 이에 본 논문에서는 Mass Spectrometry에서 생성된 Peptide Mass Map을 이용하여 기존의 단백질 Database에 있는 단백질들과 비교하는 자동화 단백질 검증 시스템 설계 및 구현에 관한 연구내용을 담고 있다. 이 시스템은 3-계층 중심으로 개발이 이루어지며 이 기종 시스템과의 원활한 통신 다중 계층의 환경에 있는 각 객체들간에 통신을 위해서 RMI 기반의 미들 웨어를 활용하기로 한다.

  • PDF