Design and Implementation of Service based Virtual Screening System in Grids

그리드에서 서비스 기반 가상 탐색 시스템 설계 및 구현

  • 이화민 (순천향대학교 컴퓨터학부) ;
  • 진성호 (고려대학교 대학원 컴퓨터교육학과) ;
  • 이종혁 (고려대학교 대학원 컴퓨터교육학과) ;
  • 이대원 (고려대학교 대학원 컴퓨터교육학과) ;
  • 박성빈 (고려대학교 컴퓨터교육과) ;
  • 유헌창 (고려대학교 컴퓨터교육과)
  • Published : 2008.06.15

Abstract

A virtual screening is the process of reducing an unmanageable number of compounds to a limited number of compounds for the target of interest by means of computational techniques such as molecular docking. And it is one of a large-scale scientific application that requires large computing power and data storage capability. Previous applications or softwares for molecular docking such as AutoDock, FlexX, Glide, DOCK, LigandFit, ViSION were developed to be run on a supercomputer, a workstation, or a cluster-computer. However the virtual screening using a supercomputer has a problem that a supercomputer is very expensive and the virtual screening using a workstation or a cluster-computer requires a long execution time. Thus we propose a service-based virtual screening system using Grid computing technology which supports a large data intensive operation. We constructed 3-dimensional chemical molecular database for virtual screening. And we designed a resource broker and a data broker for supporting efficient molecular docking service and proposed various services for virtual screening. We implemented service based virtual screening system with DOCK 5.0 and Globus 3.2 toolkit. Our system can reduce a timeline and cost of drug or new material design.

가상 탐색은 대규모의 화학분자 데이타베이스의 화학분자 데이타들을 분자 다킹과 같은 컴퓨팅 기술을 이용하여 한정된 소규모의 화학분자만을 스크리닝하는 과정으로, 대규모 컴퓨팅 파워와 데이터 저장 용량을 요구하는 대표적인 대규모의 과학 어플리케이션이다. AutoDock, FlexX, Glide, DOCK, LigandFit, ViSION 등과 같은 기존의 분자 다킹 소프트웨어나 어플리케이션들은 슈퍼 컴퓨터, 단일 클러스터, 또는 단일 워크스테이션 둥을 이용하여 작업을 수행하도록 개발되었다. 하지만 슈퍼컴퓨터를 이용한 가상 탐색은 너무 많은 비용이 든다는 문제점이 있고, 단일 클러스터나 워크스테이션을 이용한 가상 탐색은 오랜 수행 시간이 요구되는 문제점을 가지고 있다. 이에 본 논문에서는 대규모의 데이타 집약적인 연산을 지원하는 그리드 컴퓨팅 기술을 이용하는 서비스 기반 가상 탐색 시스템을 제안한다. 이를 위해 본 논문에서는 가상 탐색을 위한 3차원 화학 데이타베이스를 구축하였다. 그리고 효율적인 분자 다킹 서비스를 제공하기 위해 자원 브로커와 데이타 브로커를 설계하고 가상 탐색을 위한 다양한 서비스들을 제안하였다. 본 논문에서는 DOCK 5.0과 Globus 3.2를 이용하여 서비스 기반 가상 탐색 시스템을 구현하고 성능 평가를 실시하였다. 본 논문에서 구현한 서비스 기반 가상 탐색 시스템은 신약 개발이나 신소재 개발 과정에서 연구 개발 기간을 단축하고 개발 비용을 절감할 수 있다.

Keywords

References

  1. Shoichet, Bodian, and Kuntz, Molecular docking using shape descriptors, Journal of Computational Chemistry, Vol.13, No.3, pp. 380-397, 1992 https://doi.org/10.1002/jcc.540130311
  2. Morris, Goodsell, Huey, and Olson, Distributed automated docking of flexible ligands to proteins: Parallel applications of AutoDock 2.4, Journal of Computer-Aided Molecular Design, Vol.10, pp. 293-304, 1996 https://doi.org/10.1007/BF00124499
  3. H. Claussen, C. Buning, M. Rarey, and T. Lengauer, FlexE: Efficient Molecular Docking into Flexible Protein Structures, Journal of Molecular Biology, Vol.308, pp. 377-395, 2001 https://doi.org/10.1006/jmbi.2001.4551
  4. S. Makino and I.D. Kuntz. Automated Flexible Ligand Docking Method and Its Application for Database Search, J. Comp. Chem. Vol.18, No.14, pp. 1812-1825, 1997 https://doi.org/10.1002/(SICI)1096-987X(19971115)18:14<1812::AID-JCC10>3.0.CO;2-H
  5. C.M. Venkatachalam, X. Jiang, T. Oldfield, and M. Waldman, LigandFit: A Novel method for the Shape-Directed Rapid Docking of Ligands to Protein Active Sites, J. Mol. Graphics Modeling, 2002
  6. D.W. Ritchie, Evaluation of Protein Docking Predictions Using Hex 3.1 in CAPRI Rounds 1 and 2, PROTEINS: Struct. Funct. Genet. Vol.52, No.1, pp. 98-106, 2003 https://doi.org/10.1002/prot.10379
  7. I. Foster, C. Kesselman and S. Tuecke, The Anatomy of the Grid : Enabling Scalable Virtual Organizations, International Supercomputer Applications, Vol.15, No.3, 2001
  8. Ian Foster, and Carl Kesselman, The Grid : Blueprint for a New Computing Infrastructure, Morgan Kaufmann Publishers, 1998
  9. Thomas Sandhol and Jarek Gawor, Globus Toolkit 3 Core - A Grid Service Container Framework, Globus Project, 2003
  10. I. Foster, C. Kesselman, J. Nick and S. Tuecke, The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration, Global Grid Forum, 2002
  11. Rajkumar Buyya, Kim Branson, Jon Giddy, and David Abramson, The Virtual Laboratory: a toolset to enable distributed molecular modelling for drug design on the World-Wide Grid, Concurrency and Computation: Practice and Experience, Vol.15, No.1, pp. 1-25, 2003 https://doi.org/10.1002/cpe.704
  12. C. Ferrari, Concettina Guerra, G. Canotti, A grid- aware approach to protein structure comparison, Journal of Parallel and Distributed Computing Vol. 63, Issue 7-8, pp. 728-737, 2003 https://doi.org/10.1016/S0743-7315(03)00081-9
  13. H. Casanova, F. Berman, Parameter Sweeps on the Grid with APST, chapter 33 in Grid Computing: Making the Global Infrastructure a Reality, Wiley Publisher, Inc., 2002
  14. Wu, Tai, Murdock, Ng, Johnston, Fangohr, Jeffreys, Cox, Essex, and Sansom, BioSimGRID: a distributed database for biomolecular simulations, Proc. UK e-Science All Hands Meeting, pp. 412-419, 2003
  15. Mario Antonioletti, et al., Experiences of Designing and Implementing Grid Database Services in the OGSA-DAI project, Available: http://www.ogsadai. org.uk/
  16. M.Nedim Alpdemir, Arijit Mukherjee, Anastasios Gounaris, Norman W.Paton, Paul Watson, Alvaro A.A.Fernandes, Jim Smith, OGSA-DQP: A service-Based Distributed Query Processor for the Grid, Proceedings of UK e-Science, 2003
  17. HwaMin Lee, KwangSik Chung SungHo Chin, JongHyuk Lee, DaeWon Lee, Sungbin Park, HeonChang Yu, A Resource Management and Fault Tolerance Services in Grid Computing, Journal of Parallel and Distributed Computing, Vol.65, Issue 11, 2005