DOI QR코드

DOI QR Code

A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구

  • Song, In-Seok (Korea Institute of Science and Technology Information)
  • Published : 2008.12.30

Abstract

In this paper, a ontology-based keyword structuring method is proposed to represent the knowledge structure of scholarly documents and to make inferences from the semantic relationships holding among them. The characteristics of thesaurus as a knowledge organization system(KOS) for subject heading is critically reviewed from the information retrieval point of view. The domain concepts are identified and classified by analysis of the information activities occurring in a general research process based on scholarly sensemaking model. The ontological structure of keyword set is defined in terms of the semantic relationship of the canonical concepts which constitute scholarly documents such as journal articles. As a result, each ontologically structured keyword set of a document represents the knowledge structure of the corresponding document as semantic index. By means of the axioms and inference rules defined for information needs, users can efficiently explore the scholarly communication network built on the semantic relationship among documents in an analytic way based on the scholarly sensemaking model in oder to efficiently retrieve the relevant information for problem solving.

본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

Keywords

References

  1. 고영만. 2006. 시소러스 기반 온톨로지에 관한 연구. 정보관리, 5: 5-22.
  2. 김원중, 양재동. 2007. 시각화된 환경에서 다차원 관점을 지원하는 객체기반 패싯 시소러스 관리 시스템 모델의 정형화 및 구현. 한국정보과학회논문지 : 소프트웨어 및 응용, 34(9): 828-847.
  3. 김이겸, 이재윤. 2007. 용어 데이터레지스트리 설계 및 구축지침. 서울: 한국학술진흥재단.
  4. 김지훈, 김태수. 2006. 용어정의와 관계추출을 통한 시소러스 확장에 관한 연구. 한국문헌정보학회지, 40(1): 293-314. https://doi.org/10.4275/KSLIS.2006.40.1.293
  5. 김태수. 2001. 용어정의를 도입한 시소러스 개발 연구. 정보관리학회지, 18(2): 231-254.
  6. 유영준. 2005. 온톨로지의 개념간 관계 설정을 위한 AGROVOC 시소러스의 분석에 관한 연구. 정보관리학회지, 22(1): 125-144. https://doi.org/10.3743/KOSIM.2005.22.1.125
  7. 이정연, 김정민, 최석두, 김이겸. 2007. 기초학문 자료 메타데이터 설계 분석 및 온톨로지 적용 방안 연구. 한국문헌정보학회지, 41(2): 291-316.
  8. 정한민, 성원경, 박동인, 황순희. 2005. 과학기술 분야 시소러스상에서의 패싯들. 한국정보과학회 가을학술발표문집(II), 32(2): 535-537.
  9. 조현양, 남영준. 2004. 시소러스와 온톨로지의 상호 호환성에 관한 연구. 정보관리학회지, 21(4): 27-47. https://doi.org/10.3743/KOSIM.2004.21.4.027
  10. 최석두, 이우범, 김이겸, 최상기, 한상길, 이정연. 2006. 대단위 우리말 온톨리지 구축을 위한 시소러스의 개발. 정보관리학회지, 12: 147-164.
  11. 최석두. 2007. 인문사회과학분야 용어데이터 레지스트리 설계 보완 및 활용연구. [서울]: 한국학술진흥재단. 정책연구-2007-025-지식확산.
  12. 한성국, 이현실. 2004. 시소러스를 활용한 온톨로지 구축방안 연구. 한국비블리아학회지, 17(1): 285-303.
  13. 한상길. 1999. 시소러스 용어관계의 확장에 관한 연구. 박사학위논문, 중앙대학교, 문헌정보학과.
  14. 황순희, 윤애선. 2005. 의미적 준거의 세목화를 고려한 과학기술분야 시소러스 구축. 한국어 의미학, 18: 99-124.
  15. Aitchison, J and Gilchrist, A., Bawden, D. 2000. Thesaurus Construction and Use: A Practical Manual. 4th ed. Europa publication.
  16. Bargmeyer, B. 2005. “Establishing Ties Between Metadata Registries and Terminology.” 8th Open forum on Metadata Registries.
  17. Beissel-Durrant, G. 2004. “A typology of research methods within the Social Sciences”. NCRM Working Paper, Southampton, UK, University of Southampton.
  18. Broughton, V. 2006. “The need for a faceted classification as the basis of all methods of information retrieval.” Aslib Proceedings: New Information Perspectives, 58(1/2). DOI 10.1108/00012530610648671.
  19. Buckingham S., Motta, E., and Dominique J. 1999. “Representing Scholoraly Claims in Internet Digital Libraries: A Knowledge Modelling Approach.” Proc. 3rd. European Conference on Research and Advanced Technology for Digital Libraries, Paris, 22-24, Sept. 1999.
  20. Buckingham, S. and Motta, E., Dominique, J. 2000. “Scholonto: An Ontology-Based Digital Library Server for Research Documents and Discourse.” International Journal on Digital Library, 3: 237-248. https://doi.org/10.1007/s007990000034
  21. Buckingham S. and Selvin A.M. 2000. “Stucturing Discourse for Collective Interpretation.” Proc. Conference on Collective Cognition and Memory Practice: Distributed Collective Pratices 2000, Paris, 19-20, Sept. 2000.
  22. Buckingham, S. 2006. “Sensemaking on the Pragmatic Web: A Hypermedia Discourse Perspective.” Proc. PragWeb '06: 1st International Conference on the Pragmatic Web, Stuttgart, 21-23 Sept. Springer-Verlag: Berlin. 2006.
  23. Ceusters, W. and Smith B., Goldberg L. 2005. “Terminological and Ontological Analysis of the NCI Thesaurus.” Methodes of Information in Medicine, 44: 498-507.
  24. Fischer, D. 1998. “From Tesauri towards Ontologies?” Proc. of 5th Int. ISKO-Conference, 18-30, Aug. Lille.
  25. Gruber, T. 1995. “Toward Principles for the Design of Ontologies Used for Knowledge Sharing.” International Journal of Human-Computer Studies, 43: 907-928. https://doi.org/10.1006/ijhc.1995.1081
  26. Hunter, J. 2001. “MataNet - A Metadata Term Thesaurus to Enable Semantic Interoperability Between Metadata Domains.” Journal of Digital Information, 1(8).
  27. Kando, N. 1997. “Text-level structure of research papers: Implications for text-based information processing systems.” In Proceedings of the British Computer Society Annual Colloquium of Information Retrieval Research. Oct. 1997 68-81. .
  28. Kirsz, J. 1991. “Rhetorical structure of scientific articles: the case for argumentational analysis in information retrieval.” Journal of Documentation, 47(4): 354-372. https://doi.org/10.1108/eb026884
  29. Kircz, J and F.A.P. Harmsze. Modular scenarios in the electronic age. Conferentie Informatiewetenschap 2000. Doelen, Rotterdam 5 april 2000. In: P. van der Vet en P. de Bra (eds.) CS-Report 00-20. Proceedings Conferentie Informatiewetenschap 2000. De Doelen Utrecht (sic), 5 april 2000. pp. 31-43.
  30. Liang, A., Lauser, B., Sini, M., Keizer, J., Katz, S. 2006. “From AGROVOC to the agricultural ontology service/concept server: An OWL model for managing ontologies in the agricultural domain.” Atlanta, in Proceedings of OWL: Experiences and Directions Workshop.
  31. Maple, A. 1993 “Faceted Access: A Review of Literature.” Feb. 1995 .
  32. Matthews, B. 2004. “CRISs, Thesauri and Semantic Web.” Proc. of the 7th International Conference on Current Research Information Systems, eds. Annemarie Nase, Geert Van Grootel, 113-124.
  33. Oddy, R, Liddy, E., Balakrishnan, B., Bishiop, A., Elewononi, J., Martin, E. 1992. “Towards the use of situational information in information retrieval.” Journal of Documentation, 48(2): 123-171. https://doi.org/10.1108/eb026894
  34. Sager, J.C. 1990. A Practical Course in Terminology Processing. Amsterdam, John Benjamins.
  35. Sager, J.C. and L'Homme M.C. 1994. “A Model for the Definition of Concepts: Rules for Analytical Definition in Terminological Databases.” Terminology, 1(2): 351-373. https://doi.org/10.1075/term.1.2.08sag
  36. Sager, J. C. and Ndi-Kimbi A. 1995. “The Conceptual Structure of Terminological Definitions and their Realizations.” Terminology, 2(1): 61-81. https://doi.org/10.1075/term.2.1.04sag
  37. Schamber, L. 1994. “Relevance and Information Behavior.” Annual Review of Information Science and Technology, 29: 3-48.
  38. Shimpan, F.M and McCall, R. 1994. “Supporting Knowledge-base Evolution with Incremental Formalization.” in Proc. ACM CHI '94 285-291, ACM Press.
  39. Soergel, D. 2004. “Building a rich ontology from AGROVOC.” FAO Agricultural Ontology Server Workshop, Beijing, Apr. 27-29.
  40. Tudhope, D., and Binding C. “Faceted Thesauri.” Axiomathes 18: 211-222, DOI 10.1007/s10516-0080-9031-6.
  41. Waard, A. de, Breure, L., Kircz, J.G., & Oostendorp, H. van. 2006. Modeling Rhetoric in Scientific Publications In Vicente P. Guerrero Bote (Editor) (Ed.), Current Research in Information Sciences and Technologies (pp. 352 356). International Conference on Multidisciplinary Information Sciences and Technologies InSciT2006 Badajoz, Spain: 25-28 October 2006.
  42. Wang, P. 1997. “Users' information needs at different stages of a research project: a cognitive view.” Proceedings of an international conference on Information seeking in context, 307-318, Tampere, Finland.
  43. Ziemski, S. 1975. “Typology of Scientific Research.” Journal of General Philosophy of Science, 6(2): 276-291.

Cited by

  1. A Study on Intellectual Structure of Records Management and Archives in Korea: Based on Syntactic and Semantic Structure of Article Titles vol.43, pp.3, 2009, https://doi.org/10.4275/KSLIS.2009.43.3.417