Enriching Core Ontology with Domain Thesaurus

분야 시소러스를 이용한 코아 온톨로지 확장

  • Huang, Jin-Xia (Computer Science Division/Semantic Web Research Center, Korea Advanced Institute of Science and Technology) ;
  • Shin, Ji-Ae (Information and Communications University) ;
  • Choi, Key-Sun (Computer Science Division/Semantic Web Research Center, Korea Advanced Institute of Science and Technology)
  • 황금하 (한국과학기술원 전산학과/시맨틱웹첨단연구센터) ;
  • 신지애 (한국정보통신대학교) ;
  • 최기선 (한국과학기술원 전산학과/시맨틱웹첨단연구센터)
  • Published : 2007.10.12

Abstract

본 논문에서는 분야 시소러스의 개념과 관계를 이용하여 코아 온톨로지를 확장하는 방법을 제안한다. 분야 시소러스의 개념을 코아 온톨로지의 상위 개념으로 분류하고, 시소러스에서의 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT)들 사이의 관계는 코아 온톨로지에서 정의한 의미관계로 분류한다. 유사도와 빈도수 기반의 방법으로 개념 분류를 수행하였고, 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이터가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 isa와 기타 관계(non-isa관계)로 분류하고, 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이터를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 분류 방법을 사용하되, kNN방법으로 훈련데이터를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과, 시스템 성능이 사람에 의한 판단 결과와 비교 가능한 수준이었다.

Keywords