동사 정보를 활용한 의미 관계 추출을 위한패턴 구축

Pattern Construction for Semantic Relation Extraction using Verb Information

  • 김세종 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이용훈 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과)
  • Kim, Se-Jong (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering, POSTECH) ;
  • Lee, Yong-Hun (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering, POSTECH) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering, POSTECH)
  • 발행 : 2008.10.10

초록

온톨로지란 실세계에 존재하는 사물 및 개념, 그리고 용어들 간의 관계들을 컴퓨터가 이해할 수 있는 형태로 표현한 것이다. 온톨로지 구축에 있어서 대용량 코퍼스의 활용은 해당코퍼스에서 등장하는 용어들과 이들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어 쌍들을 해당 패턴이 대표하는 의미 관계로 설정하는 방식을 취한다. 그러나 기존의 방법은 주로 두 용어들 사이에서 나타나는 문자열만을 고려하여 패턴을 추출하기 때문에 해당 문장에 포함된 보다 다양한 문장 정보들을 활용할 수 없다. 본 논문은 이러한 한계점을 감안하여, 용어 쌍 사이에서 나타나는 문자열과 주변 동사 정보를 함께 고려함으로써 패턴의 정교성을 향상시키는 방법을 제안한다. 또한 동사들의 동의어를 활용하여 다양한 용어들을 포괄할 수 있는 일반화된 패턴을 구축한다. 본 방법론은 is-a 관계의 경우 64%, part-of 관계의 경우 83%, made-of 관계의 경우 73%, use 관계의 경우 72%의 정확률을 보였으며 모두 기존 방법보다 향상된 결과를 가져왔다.

키워드