Medicine Ontology Building based on Semantic Relation and Its Application

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용

  • Published : 2005.05.01

Abstract

An ontology consists of a set and definition of concepts that represents the characteristics of a given domain and relationship between the elements. To reduce time-consuming and cost in building ontology, this paper proposes a semiautomatic method to build a domain ontology using the results of text analysis. To do this, we Propose a terminology processing method and use the extracted concepts and semantic relations between them to build ontology. An experiment domain is selected by the pharmacy field and the built ontology is applied to document retrieval. In order to represent usefulness for retrieving a document using the hierarchical relations in ontology, we compared a typical keyword based retrieval method with an ontology based retrieval method, which uses related information in an ontology for a related feedback. As a result, the latter shows the improvement of precision and recall by $4.97\%$ and $0.78\%$ respectively.

온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률이 $4.97\%$, 재현율이 $0.78\%$ 향상됨을 알 수 있었다.

Keywords

References

  1. Missikoff, M., Velardi, P. and Fabriani, P., 'Text Mining Techniques to Automatically Enrich a Domain Ontology,' Applied Intelligence, Vol. 18, pp. 322-340, 2003 https://doi.org/10.1023/A:1023254205945
  2. Kang, S. J. and Lee, J. H., 'Semi-Automatic Practical Ontology Construction by Using a Thesaurus, Computational Dictionaries, and Large Corpora,' ACL 2001 Workshop on Human Language Technology and Knowledge Management, pp. 45-52, 2001 https://doi.org/10.3115/1118220.1118226
  3. Lim, S. Y, Koo., S. O., Song, M. H. and Lee, S. J., 'Hub-word based on Ontology Construction for Document Retrieval,' Proceedings of IC-AI'03, pp. 549-552, 2003
  4. 임수연, 송무희, 이상조, '전문용어의 처리에 의한 도메인 온톨로지의 구축', 정보과학회 논문지(B), 제 31권 3호, pp. 353-360, 2004
  5. Mahesh, K., 'Ontology Development for Machine Translation: Ideology and Methodology,' Technical Report MCCS 96-292, Computer Research Laboratory, New Mexico State University, 1996
  6. Dong, Z. and Dong, Q., HowNet.http//www.keenage.com/zhwang/e_zhi wang.html, 1999
  7. Lenat, D. B., 'Cyc: A Large-Scale Investment in Knowledge Infrastructure,' Communications of the ACM, Vol. 38, No. 11, pp. 33-38, 1995 https://doi.org/10.1145/219717.219745
  8. Miller, George A., Martin Chodorow, Shari Landes, Claudia Leacock, and Robert G. Thomas, WordNet: An on-line Lexical database, International Journal of Lexicography, 3(4), pp. 235-244, 1990 https://doi.org/10.1093/ijl/3.4.235
  9. 강신재, '실용적인 온톨로지의 반자동 구축 및 어휘 의미 중의성 해소를 위한 응용', 포항공대 박사학위논문, 2002
  10. Ock, C. Y. and Choe, H. S., 'The Fundamental Construction Princi- pIes of UOU Ontology,' 1st International Workshop of The Korean Thesaurus Association, 2003
  11. 문유진, '한국어 명사를 위한 WordNet의 설계와 구현', 정보과학회 논문지, 제2권, 4호, , pp. 437-445, 1996
  12. 박정오, 황도삼, '전문용어 추출시스템', 정보과학회 봄 학술발표 논문집, 제27권, 1호, pp. 381-383, 2000
  13. 이경희, 이주호, 최명석, 김길창, '한국어 문서에서 개체명 인식에 관한 연구', 제12회 한글 및 한국어 정보처리 학술대회 학술발표논문집, pp. 292-299, 2000
  14. Klavans, J. and Muresan, S., 'DEFINDER:Rule-Based Methods for the Extraction of Medical Terminology and their Associated Definitions from On-line Text,' In Proceedings of AMIA Symposium, pp. 201-202, 2000
  15. 신효식, 김재호, 이해윤, 최기선, '텍스트로부터 용어정의문 자동 추출방법', 제14회 한글 및 한국어 정보처리 학술발표 논문집, pp. 292-299, 2002
  16. 오종훈, 이경순, 최기선, '분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출', 정보과학회 논문지, 제 29권 4호, pp. 258-269, 2002
  17. 황이규, 윤보현, 'HMM에 기반한 한국어 개체명 인식', 정보처리학회 논문지(B), 제10권, 2호, pp. 229-236, 2003 https://doi.org/10.3745/KIPSTB.2003.10B.2.229