GO Guide : Browser & Query Translation for Biological Ontology

GO Guide : 생물학 온톨로지를 위한 브라우저 및 질의 변환

  • 정준원 (서울대학교 전기.컴퓨터공학부) ;
  • 박형우 (서울대학교 전기.컴퓨터공학부) ;
  • 임동혁 (서울대학교 전기.컴퓨터공학부) ;
  • 이강표 (서울대학교 전기.컴퓨터공학부) ;
  • 김형주 (서울대학교 전기.컴퓨터공학부)
  • Published : 2006.06.01

Abstract

As genetic research is getting more active, data construction of genes are needed in the field of biology. Therefore, Gene Ontology Consortium has constructed genetic information by OWL, which is Ontology description language published by W3C. However, previous browsers for Gene Ontology only support simple searching mechanisms based on keyword, tree, and graph, but it is not able to search high quality information considering various relationships. In this paper, we suggest browsing technique which integratesvarious searching methods to support researchers who are doing actually experiment in biology field. Also, instead of typing a query, we propose querv generation technique which constructs query while browsing and query translation technique which translate generated query into SeRQL query It is convenient for user and enables user to obtain high quality information. And by this GO Guide browser, it has been shown that the information of Gene Ontology could be used efficiently.

생물학 분야에서 유전자에 대한 연구가 활발하게 이루어지면서 유전자에 대한 정보 구축 및 통합에 대한 필요성이 대두 되었다. 그 결과 Gene Ontology Consortium은 W3C에서 제정한 온톨로지 기술언어인 OWL로 유전자에 대한 정보와 분류를 담고 있는 Gene Ontology를 구축하였다. 하지만 Gene Ontology를 위한 기존의 브라우저들은 키워드, 트리, 그래프 기반의 단순 검색만을 지원할 뿐 다양한 관계를 고려한 고급 정보 검색이 불가능하다. 본 논문은 실제 생물학 연구를 수행하는 사용자들이 Gene Ontology를 효과적이고 편리하게 사용할 수 있도록 하기 위해 다양한 온톨로지 검색 기법을 통합적으로 지원하는 방법을 제안하였다. 또한 질의어 입력대신 검색 중에 손쉽게 질의를 생성하는 기법과 생성된 질의를 SeRQL 질의로 변환하는 기법을 제안함으로써 온톨로지에서 지원하는 질의어에 독립적으로 손쉽게 질의를 생성하고 고급정보를 얻을 수 있도록 하였다. 그리고 이렇게 구축한 GO Guide 브라우저를 통해 Gene Ontology의 방대한 정보를 효과적으로 이용할 수 있음을 확인하였다.

Keywords

References

  1. Robert Stevens et al., 'Ontology based knowledge representation for bioinformatics,' Briefings in Bioinformatics, 1(4), pp.398-414, 2000 https://doi.org/10.1093/bib/1.4.398
  2. P.D. Karp et al., 'The EcoCyc and MetaCyc Databases,' Nucleic Acids Research, 28, pp.56-59, 2000 https://doi.org/10.1093/nar/28.1.56
  3. Deborah L. McGuinness, Frank van Harmelen, 'OWL Web Ontology Language Overview,' W3C Recommendation, http://www.w3c.org/TR/owl-features/, 2004
  4. The Gene Ontology Consortium, 'Creating the Gene Ontology Resource: Design and Implementation,' Genome Research, 11(8), pp.1425-33, 2001 https://doi.org/10.1101/gr.180801
  5. Jeen Broekstra, Arjohn Kampman, 'SeRQL: An RDF Query and Transformation Language,' open RDF.org, http://openrdf.org, 2004
  6. M. Uschold et al., 'The Enterprise Ontology,' The Knowledge Engineering Review, 13(1), 1998 https://doi.org/10.1017/S0269888998001088
  7. O. Lassila, R. Swick, 'Resource Description Framework(RDF) Model and Syntax Specification,' W3C Recommendation, World Wide Web Consortioum, 1999
  8. Open Biomedical Ontology, http://obo.sourceforge.net/, 2005
  9. Berkeley Drosophila Genome Project, 'AmiGO,' http://www.fruitfly.org/, 2005
  10. Eliazbeth Shoop et al., 'Data Exploration Tools for the Gene Ontology Database,' Bioinformatics, 20(18), pp.3442-3454, 2004 https://doi.org/10.1093/bioinformatics/bth425
  11. Jeen Broekstra et al. 'Sesame: A Generic Architecture for Storing and Querying RDF and RDF Schema,' ISWC, 2002
  12. RDQL - 'A Query Language for RDF,' http://www.w3.org/Submission/2004/SUBM-RDQL-20040109/, 2004
  13. G. Karvounarakis, S. Alexaki, V. Christophides, D. Plexousakis, M. Scholl, 'RQL: A Declarative Query Language for RDF,' WWWC, 2002
  14. Peter Haase, Jeen Broekstra, Andreas Eberhart, Raphael Volz, 'A Comparison of RDF Query Language,' ISWC 2004