A Database Retrieval Model for Efficient Gene Sequence Alignment

효율적인 유전자 서열 비고를 위한 데이타베이스 검색 모델

  • 김민준 (미디어코러스(주) 부설정보통신연구소) ;
  • 임성화 (현대디지탈테크(주) 미디어 연구) ;
  • 김재훈 (아주대학교 정보통신전문대학) ;
  • 이원태 (연세대학교 생화학) ;
  • 정진원 (연세대학교 생화학과)
  • Published : 2004.06.01

Abstract

Most programs of bioinformatics provide biochemists and biologists retrieve and analysis services of gene and protein database. As these services retrieve database for each arrival of user's request, it takes a long time and increases server's load and response time. In this paper. by utilizing database retrieval patterns of sequence alignment programs in bioinformatics, grouping method is proposed to share database retrieval between many requests. Carpool method is also proposed to reduce response time as well as to increase system expandability by combining new arriving requests with the previous on going requests. The performance of our two proposed schemes is verified by mathematic analysis and simulation.

대부분의 생물정보학의 프로그램들은 데이타베이스로부터 유전자 등의 데이타를 검색하고 처리하여 생화학자와 생물학자에게 서비스를 제공한다. 이때 각각 클라이언트의 요청마다 데이타베이스의 검색을 수행한다면 많은 디스크 접근 시간이 소요된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 생물정보학에서 서열 검색 프로그램의 데이타베이스 사용 패턴을 이용하여 많은 데이타베이스 요청에 대하여 데이타베이스의 검색을 위한 디스크 접근을 공유하는 그룹핑 기법을 제안한다. 또한, 사용자 요청을 대기 시간 없이 처리중인 작업과 동시에 데이타베이스의 검색을 위한 디스크 접근을 공유하여 시스템 처리율을 높이고 빠른 응답시간을 가지는 카플 방식을 제안한다. 제안된 기법은 수학적 분석과 시뮬레이션을 통하여 성능을 검증하였다.

Keywords

References

  1. Hyun Seok Park, '포스트지놈 시대 생물정보학(Bioinformatics)의 역할', 대학내분비학회지, 제16권, 제1호, pp. 1-8, 2001
  2. Stephen F. Altschul, Warren Gish, Webb Miller, Eugene W. Myers, and David J. Lipman, 'Basic Local Alignment Search Tool,' J. Mol. Biol., pp. 403-410, 1990 https://doi.org/10.1016/S0022-2836(05)80360-2
  3. Tieng K. Yap, Ophir Frieder, and Robert L. Martino, 'Parallel Homologous Sequence Searching in Large Databases,' IEEE Proceedings of the Fifth Symposium on the Frontiers of Massively Parallel Computation(Frontiers'95), 1995 https://doi.org/10.1109/FMPC.1995.380444
  4. Jerry Banks, John S. Carson, and Barry L. Nelson, 'Discrete-Event System Simulation,' Prentice Hall, 2000
  5. SWISSPROT: http://www.espasy.org/
  6. GENBANK : http://www.ncbi.nlm.nih.gov/Genbank/
  7. EMBL : http://www.ncbi.nlm.nih.gov/Genbank/
  8. Ozden, B., R. Rastogi, A. Silberschatz, and C. Martin 'Demand Paging for Video on Demand Servers,' IEEE International Conference on Multimedia Computing and Systems, May 1995 https://doi.org/10.1109/MMCS.1995.484932