• 제목/요약/키워드: 단백질 서열 탐색

검색결과 37건 처리시간 0.031초

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

단백질 이차 구조 예측을 위한 단백질 프로파일의 성능 비교 (A Performance Comparison of Protein Profiles for the Prediction of Protein Secondary Structures)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.26-32
    • /
    • 2018
  • 단백질의 이차구조는 단백질의 진화, 구조, 기능을 연구하는데 중요한 정보이다. 단백질 서열 정보만을 이용하여 단백질의 이차 구조를 예측하는 분야에 심층 학습 방법들이 최근 들어 활발히 적용되고 있다. 이러한 방법에서 널리 사용되는 입력은 단백질 서열을 변환하여 만들어진 단백질 프로파일이다. 본 논문에서는 효과적인 단백질 프로파일을 얻기 위하여 단백질 서열 탐색 방법으로 PSI-BLAST와 더불어서 HHblits를 사용하였다. 단백질 프로파일의 구성에 사용되는 상동 단백질 서열을 결정하기 위한 유사도 문턱치와 상동 단백질 서열 정보를 반복적으로 사용하는 회수를 조절하였다. 합성곱 신경망과 순환 신경망을 사용하여 단백질 이차구조를 예측하였는데, 진화적 정보를 한번만 추가하여 만들어진 단백질 프로파일이 효과적이었다.

서열 데이타마이닝을 통한 단백질 서열 예측기법 (A Protein Sequence Prediction Method by Mining Sequence Data)

  • 조순이;이도헌;조광휘;원용관;김병기
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.261-266
    • /
    • 2003
  • 단백질은 아미노산의 선형 중합체(linear polymer)로서 생체의 조직을 구성하고 각종 생화학 반응을 조절하는 역할을 하는 가장 중요한 생체 분자에 속한다. 이러한 단백질의 특성과 기능은 해당 단백질을 구성하는 아미노산의 서열에 의해 결정되기 때문에, 주어진 단백질의 서열을 알아내는 것은 단백질 기능 연구의 출발점이다. 본 논문은 기존의 생화학적 단백질 서열 결정 방법의 단점을 극복할 수 있는 데이터 마이닝 기반 단백질 서열 예측 기법을 제안한다. 복수개의 단백질 절단효소(protease)를 적용함으로써, 서로 중첩된 단백질 조각을 얻어내고, 각 조각의 질량 정보와 단백질 데이타베이스를 이용하여 후보 서열을 식별한다. 얻어진 후보 서열의 조립을 통해 전체 서열을 결정하기 위한, 다중 분할 그래프(multi-partite graph) 구축 및 경로 탐색 기법을 제안한다. 아울러, 대표적인 단백질 서열 데이타베이스인 SWISS-PROT을 이용한 실험을 통해 제안한 방법의 성능을 평가한다.

단백질 서열 연관 규칙 마이닝을 위한 효율적인 알고리즘 설계 (Efficient Sequence Association Rule Mining for Discovering Protein Relations)

  • 김현민;김지혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1183-1186
    • /
    • 2002
  • DNA 의 염기서열 탐색을 위한 유전체학의 다음 세대인 구조유전체학은 유전체 사업으로 인한 인간 게놈지도의 완성과 축적된 생물정보를 이용한 생물정보학의 발달과 함께 급속한 성장을 계속하고 있다. 포스트 게놈 시대를 맞이하여 생명현상에 대한 궁극적인 이해를 위한 노력으로 단백질의 구조와 기능에 대한 연구가 주목을 받게 되었다. 다양한 구조 규명을 위한 도구들과 단백질 정보를 관리하기 위한 데이터베이스 구축에 따른 관련 기술의 발전은, 앞으로 다가올 생물정보의 방대함을 감안할 때, 가치 있는 지식정보를 얻기 위한 데이터 마이닝 기법들을 통해서만 가능하다. 본 논문은 데이터 마이닝의 근간 기술인 연관규칙 마이닝을 응용한 효율적인 서열 연관 규칙 알고리즘을 제안하며, 단백질 구조의 예측을 위한 단백질 서열 및 DNA 서열간의 패턴 비교 및 연관성을 목적으로 한다. 또한, 공간적 시간적 복잡성을 CMS-tree 라는 자료구조를 통해 알고리즘의 확장성 및 병렬화의 기본 알고리즘으로 사용하도록 개발하였다.

  • PDF

누에 핵다각체병 바이러스의 다각체 단백질 유전자의 위치 탐색 및 염기서열 (Location and Nucleotide Sequence of the Bombyx mori Nuclear Polyhedrosis Virus Polyhedrin Gene)

  • 우수동;김현욱;박범석;강석권;양재명;정인식
    • 한국잠사곤충학회지
    • /
    • 제34권2호
    • /
    • pp.20-25
    • /
    • 1992
  • 유용물질을 생산할 수 있는 곤충 baculovirus expression vector system의 국내 개발을 위하여, Bm-NPV의 다각체 단백질 유전자를 탐색, 클로닝 하고 그 구조를 분석한 결과는 다음과 같다. 1. AcNPV의 다각체 단백질 유전자를 포함하고 있는 EcoRI-Ⅰ fragment내의 0.93kb를 probe로 하여 southern 분석한 결과, BmNPV의 다각체 단백질 유전자는 PstⅠ-F fragment(7.4Kb)에 위치하였다. 2. BmNPV의 다각체 단백질 유전자를 포함하는 PstⅠ-F fragment를 E. coli에 클로닝시켜서 pBmP-F라 명명하고, 다시 southern분석을 통해 subcloning하여 pBmP-H라 명명하였으며 pBmP-H의 제한효소 지도를 작성하였다. 3. pBmP-H의 염기서열분석결과 구조유전자를 포함한 1,259 bp의 염기서열이 결정되었다. Iatrou 등이 보고한 BmNPV 다각체 단백질 유전자의 염기서열과 비교한 결과 10개의 염기서열에서 차이를 보였으며, 74 Val이 Ile로, 76 Asn이 Ser으로 155 Met이 Val로 아미노산 변경된 결과를 보였다.

  • PDF

GenScan을 이용한 진핵생물의 서열 패턴 분석 (Anlaysis of Eukaryotic Sequence Pattern using GenScan)

  • 정용규;임이슬;차병헌
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.113-118
    • /
    • 2011
  • 서열 상동성 분석은 생명현상에 관여하는 물질을 정렬, 색인하여 데이터베이스 하는 것으로, 생명정보학의 유용성을 입증하는 분야이다. 본 논문에서는 구조가 복잡한 진핵생물의 서열 패턴을 단백질 서열로 변환하기 위해 은닉마르코프모델을 이용하는 GenScan 프로그램을 이용한다. 서열상동성 분석 중 최소거리 탐색 문제는 문제의 크기가 커지면 계산량이 기하급수적으로 증가하여 정확한 계산이 불가능해진다. 따라서 유사한 아미노산간의 치환과 상이한 아미노산간의 치환 점수를 차등화한 점수표를 적용하고, 은닉마르코프모델 등을 적용해 정교한 전이 확률모델을 적용한다. 변환된 서열을 서열 상동성 분석을 위해 사용되는 blast p를 이용하여, 은닉 마르코프 모델을 도입함으로 인해 단백질 구조 서열로 변환하는 데에 있어서 우수한 기능을 제공함을 알 수 있다.

단백질 모티프간 연관성 탐사 (Association Discovery Among Protein Motifs)

  • 이현숙;이도헌;최덕재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1827-1830
    • /
    • 2002
  • 단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix), 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 본 논문에서는 연관성 탐사 기법을 적용하여 Hits 데이터로부터 상당히 높은 연관성을 갖는 모티프 집단을 밝히고, 실제 자연현상에서 자주 나타나는 연관성을 교차타당성 (cross-validation) 기법을 통해 입증하였다. 이렇게 밝혀진 단백질 모티프간 연관성을 트라이 탐색 기법을 통해 웹으로 제공함으로써 단백질의 기능유추에 쉽게 접근하고자 한다.

  • PDF

호박$(Cucurbita\;moschata\;D_{UCHESNE})$잎에서 리보즘불활성화 단백질의 분리 및 특성 (Purification and Properties of Ribosome-inactivating Proteins from the Leaves of $Cucurbita\;moschata\;D_{UCHESNE}$)

  • 이시명;김영태;황영수;조강진
    • Applied Biological Chemistry
    • /
    • 제40권5호
    • /
    • pp.375-379
    • /
    • 1997
  • 리보즘불활성화 단백질(Ribosome-inactivating protein, RIP)을 생성하는 식물을 탐색하여 그중 호박$(Cucurbita\;moschata\;D_{UCHESNE})$ 잎에서 ammonium sulfate 침전, DE 52-Cellulose, S-Sepharose, FPLC Superose 12 HR, FPLC Mono-S column chromatography에 의하여 ribosome-Inactivating 활성이 있는 단백질(PR 1, PRIP 2)을 분리하였다. 정제된 단백질의 분자량은 SDS-PAGE에서 약 31,000과 30,500인 염기성 단백질로서, 특히 PRIP 1은 열에도 안정하여 $50^{\circ}C$에서 30분간 처리한 경우에도 활성이 유지되었다. 이 단백질들의 ribosome-inactivating 활성을 in vitro translation system에서 측정한 결과 50% 활성저해농도 $(IC_{50})$는 PRIP 1은 0.82nM, PRIP 2은 0.79 nM이었다. PRIP 1과 PRIP 2의 N-말단부분의 아미노산 서열을 분석하여, 이미 밝혀진 리보즘불활성화 단백질들과 아미노산서열의 유사성을 분석해 본 결과, PRIP 1은 Luffa cylindrica에서 분리된 Luffin B 및 Trichosanthes kirilowii Maximowicz에서 분리된 Trichokirin과, PRE 2은 Momordia charantia에서 분리된 Momordin II 및 MAP 30과 유사성이 매우 높았다.

  • PDF

미백제 스크리닝용 단백질칩의 개발 (Developing a Protein-chip for Depigmenting Agents Screening)

  • 김은기;곽은영;한정선;이향복;신정현
    • 대한화장품학회지
    • /
    • 제31권1호
    • /
    • pp.13-16
    • /
    • 2005
  • 미백 물질 탐색 방법으로, MC1R 발현 인자인 Mitf (microrhthalmia transcription factor)를 이용한 protein chip을 적용하였다. MC1R promoter와 Mitf 결합의 저해 인자로써, DNA 상의 결합 부위인 E-box (CATGTG)와 유사한 서열을 가진 oligomer를 사용하였고, E-box 내외부의 서열 변화에 따른 저해율 또한 측정하였다. 그 결과 DNA-Mitf 결합 저해율에 있어서, E-box 서열 내 변화를 준 oligonucleotide 경쟁자는, E-box 이외의 서열 변화를 준 경쟁자보다 낮은 수치를 보였다.

Kernel 기반 학습을 이용한 HPV의 위험군 분류 (HPV Risk Classification Using Kernel Based Learning)

  • 정제균;오석준;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.428-430
    • /
    • 2003
  • 인유두종바이러스(human papillomavirus: HPV)는 감염되었을 때 각종 악성 종양을 유발할 수 있는 작은 DNA 바이러스이다. 고위험군에 속하는 HPV의 감염은 암으로 진행될 수 있는 가능성이 크다. 본 논문은 HPV를 분류할 수 있는 기계 학습 기법을 제안하고자 한다. 제안된 학습 기법은 단백질 서열을 효과적으로 분류할 수 있는 커널(kernel) 방법에 기반을 두고 있다. 위험군 분류는 감염의 메커니즘의 이해와 유전자칩과 같은 새로운 의학 도구의 개발 등에 있어서 중요한 정보를 제공해 줄 수 있다. 실험 결과는 중요한 부위의 탐색에 의한 커널 기반의 학습 방법이 우수한 성능을 보이는 것으로 나타났다.

  • PDF