Domain-specific Ontology Construction by Terminology Processing

전문용어의 처리에 의한 도메인 온톨로지의 구축

  • Published : 2004.03.01

Abstract

Ontology defines the terms used in a specific domain and the relationships between them and represents them as hierarchical taxonomy. The present paper proposes a semi-automatic domain-specific ontology construction method based on terminology Processing. For this purpose, it presents an algorithm to extract terminology according to the noun/suffix pattern of terminology in domain texts and find their hierarchical structure. The experiment was carried out using pharmacy-related documents. As singleton terminology with noun/suffix were identified, the average accuracy was 92.57%. In case of multi-word terminology, the average accuracy was 66.64%. The constructed ontology forms natural semantic clusters with based on suffices and semantic information, so can be utilized in approaches to specific knowledge such as information look-up or as the base of inference to improve searching abilities.

온톨로지는 특정 도메인에 사용되는 용어들과 그 용어들 간의 관계를 정의하고, 이를 계층구조로 표현한 것을 말한다. 본 논문에서는 전문용어의 처리에 기반 한 도메인 특정적인 온톨로지의 반자동 구축방안을 제안하고자 한다. 이를 위하여 도메인 텍스트 내에서 전문용어를 구성하고 있는 명사나 접미사의 패턴을 분류하고, 이에 따라 전문용어를 추출하고 계층구조를 구하는 알고리즘을 제안한다. 실험은 약학 관련 문서를 대상으로 하였으며, 단일어절 전문용어를 인식한 결과 평균 92.57%, 다중어절 전문용어의 경우 평균 66.64%의 정확도를 보였다. 구축된 온톨로지는 의미정보와 함께 전문용어를 구성하는 특정 명사나 접미사를 중심으로 자연스런 의미 군을 형성함으로써 정보검색 등의 전문적인 지식의 접근에 유용하게 쓰일 수 있으며, 검색의 성능을 향상시키기 위한 추론의 기반으로도 이용할 수 있다.

Keywords

References

  1. Guarino, N.: Formal Ontology and Information Systems. In Proceeding of the 1st International Conference, Trento, Italy, IOS Press, 1998
  2. Michele M., Paola V. and Paolo F., 'Text Mining Techniques to Automatically Enrich a Domain Ontology,' Applied Intelligence 18, 322-340, 2003 https://doi.org/10.1023/A:1023254205945
  3. Kang, S. J. and Lee, J. H.: Semi-Automatic Practical Ontology Construction by Using a Thesaurus, Computational Dictionaries, and Large Corpora. ACL 2001 Workshop on Human Language Technology and Knowledge Management, Toulouse, France, 2001 https://doi.org/10.3115/1118220.1118226
  4. Lim, S. Y, Koo, S. O., Song, M. H., Lee, S. J., 'Hub_word based on Ontology Construction for Document Retrieval,' IC-AI'03, Las Vegas, USA, 2003
  5. 이현민, 박혁로, '복합명사의 역방향 분해 알고리즘', 정보처리학회 논문지(B), 제8-B권 4호, pp. 357-364, 2003
  6. 오종훈, 이경순, 최기선, '분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출', 정보과학회지 논문지, 제29권 4호, pp. 258-269, 2002
  7. 이경희, 이주호, 최명석, 김길창, '한국어 문서에서 개체명 이식에 관한 연구', 제12회 한글 및 한국어 정보처리 학술대회 학술발표논문집, pp, 292-299, 2000
  8. 황이구, 윤보현, 'HMM에 기반한 한국어 개체명 인식', 정보처리학회 논문지(B), 제10권 2호, pp. 229-236, 2003 https://doi.org/10.3745/KIPSTB.2003.10B.2.229
  9. Vossen P., 'Extending, trimming and fusing WordNet for technical documents,' NAACL-2001 Workshop on WordNet and Other Lexical Resources : Applications, Extensions and Customizations, 2001
  10. Miller, G. A., Chodorow, M., Landes, S., Leacock, C. and Thomas, R.G.:WordNet: An On-line Lexical Database. International Journal of Lexicography, 1990
  11. Michael K. Smith, Chris Welty, Deborah L. McGuinness, 'OWL Web Ontology Language Guide,' World Wide Web Consortium,http://www.w3.org/TR/owl-guide, 2003
  12. Maedche, A.: Ontology Learning for the Semantic Web. Kluwer Academic Publishers, Boston, 2002
  13. Baeza-Yates, R. and Robeiro-Neto, B.: Modern Information Retrieval. ACM Press, New York, NY, USA, 1999
  14. Bettina, B., Andreas, H., Gerd, S.: Towards Semantic Web Mining. International Semantic Web Conference, 2002
  15. Internatioanl Semantic Web Conference Towards Semantic Web Mining Bettina,B.;Andreas,H.;Gerd,S.