DOI QR코드

DOI QR Code

Anlaysis of Eukaryotic Sequence Pattern using GenScan

GenScan을 이용한 진핵생물의 서열 패턴 분석

  • 정용규 (을지대학교 의료IT마케팅학과) ;
  • 임이슬 (을지대학교 의료산업학부 의료전산학전공) ;
  • 차병헌 (을지대학교 임상병리학과)
  • Received : 2011.06.25
  • Accepted : 2011.08.12
  • Published : 2011.08.31

Abstract

Sequence homology analysis in the substances in the phenomenon of life is to create database by sorting and indexing and to demonstrate the usefulness of informatics. In this paper, Markov models are used in GenScan program to convert the pattern of complex eukaryotic protein sequences. It becomes impossible to navigate the minimum distance, complexity increases exponentially as the exact calculation. It is used scorecard in amino acid substitutions between similar amino acid substitutions to have a differential effect score, and is applied the Markov models sophisticated concealment of the transition probability model. As providing superior method to translate sequences homologous sequences in analysis using blast p, Markov models. is secreted protein structure of sequence translations.

서열 상동성 분석은 생명현상에 관여하는 물질을 정렬, 색인하여 데이터베이스 하는 것으로, 생명정보학의 유용성을 입증하는 분야이다. 본 논문에서는 구조가 복잡한 진핵생물의 서열 패턴을 단백질 서열로 변환하기 위해 은닉마르코프모델을 이용하는 GenScan 프로그램을 이용한다. 서열상동성 분석 중 최소거리 탐색 문제는 문제의 크기가 커지면 계산량이 기하급수적으로 증가하여 정확한 계산이 불가능해진다. 따라서 유사한 아미노산간의 치환과 상이한 아미노산간의 치환 점수를 차등화한 점수표를 적용하고, 은닉마르코프모델 등을 적용해 정교한 전이 확률모델을 적용한다. 변환된 서열을 서열 상동성 분석을 위해 사용되는 blast p를 이용하여, 은닉 마르코프 모델을 도입함으로 인해 단백질 구조 서열로 변환하는 데에 있어서 우수한 기능을 제공함을 알 수 있다.

Keywords

References

  1. Hughes TR, Marton MJ, Jones AR, et al. "Functional discovery via a compendium of expression profiles." Cell, 2000
  2. Ideker T, Thorsson V, Ranish JA, et al. "Integrated genomic and proteomic analyses of a systematically perturbed metabolic network.", Science, 2001
  3. Curtius T, "Ueber das Glycocoll Chem Ber", 1883
  4. J. Choy and S. B. Cho, "An intrusion detection system with temporal event modeling based on hidden Markov model," Proc. Korea Information Science Society (B), Seoul, pp 306-308, October 1999.
  5. L. R. Rabiner, "A tutorial on hidden Markov models and selected applications in speech recognition," Proc. of the IEEE, vol. 77, no. 2, pp. 257-286, February 1989. https://doi.org/10.1109/5.18626
  6. Karlin S and Ladunga I, "Comparison of eukauyotic genomic sequences", Proc. Natl. Acad. Sci, 1994
  7. GenScan, http://genes.mit.edu/GENSCAN.html
  8. NCBI, http://www.ncbi.nlm.nih.gov
  9. NCBI BLAST, http://blast.ncbi.nlm.nih.gov.
  10. Yong-Gyu Jung, Jeong-Seok Kang, Hospital Security System using Biometric Technology, IWIT Vol.11 No.2, 2011
  11. Yong-Gyu Jung, Go-Eun Hur, Ensemble Classification Method for Efficient Medical Diagnostic, IWIT Vol.10 No. 3, p97-102, 2010
  12. DaeSik Ko, JaeCheol Lee , A design of the DNA Scan System using Rotational Axis, Journal of Korean Institute of. Information Technology, Vol.7 No.1, 2009
  13. HoSeok Chae, JeongAh Kim, MinHee Choi, SungYoung Oh, MinHo Lee and ChiWoo Lee, Reference Model for U-Health Portal System Based on Clinical Decision Supporting Service, Journal of Korean Institute of. Information Technology, Vol.9 No.7, JUL 2011