Extraction and Ranking of Term Usages using Usage Vector and Web Resources

용례 벡터와 웹 자원을 이용한 전문용어 용례의 추출 및 순위화

  • Jung, Ha-Yong (Division of Computer Science, Dept. of Electrical Engineering and Computer Science, KAIST) ;
  • Choi, Key-Sun (Division of Computer Science, Dept. of Electrical Engineering and Computer Science, KAIST)
  • 정하용 (한국과학기술원 전자전산학과 전산학) ;
  • 최기선 (한국과학기술원 전자전산학과 전산학)
  • Published : 2006.06.02

Abstract

전문용어의 용례는 일반용어의 용례와 다르게 의미를 드러내는 것이 중요하다. 또한 사전 및 시소러스와 같은 자원이 부족하다는 특징이 있다. 본 논문에서 우리는 전문용어의 용례를 벡터를 이용한 표현을 통해 더 정량적으로 나타내는 방법을 제안했다. 또한 전문용어의 자료부족 문제를 극복하기 위해 대체적 자원으로 웹을 이용하는 것을 제안했다. 실험 결과, 제안한 시스템은 기존의 시스템에 비해 최대 30%의 성능 향상을 이룰 수 있었다. 게다가 제안한 시스템에의 추출된 전문용어의 용례는 다른 자연어 처리 응용을 위한 보완적 자원으로서의 가능성을 보여줬다.

Keywords