U-WIN을 이용한 의미 유사도 측정과 활용

A Measure of Semantic Similarity and its Application in User-Word Intelligent Network

  • 임지희 (울산대학교 컴퓨터정보통신공학과) ;
  • 배영준 (울산대학교 컴퓨터정보통신공학과) ;
  • 최호섭 (한국과학기술정보연구원 정보기술개발단 정보시스템개발팀) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학과)
  • Im, Ji-Hui (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Bae, Young-Jun (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Choe, Ho-Seop (Information System Development Team, Korean Institute of Science and Technology Information) ;
  • Ock, Cheol-Young (Dept. of Computer Engineering and Information Technology, University of Ulsan)
  • 발행 : 2007.06.25

초록

개념 간의 유사도 측정 방법은 의미망에서의 두 개념의 최단 경로의 수 노드의 깊이 관계의 종류 등의 정보를 이용하는 링크(Link) 기반 방법, 대용량의 말뭉치에서의 개념의 발생빈도를 확률로 계산한 정보량(Information Content) 기반 방법, 관련 단어들의 공기정보를 활용한 의미(Gloss) 기반 방법이 있으며, 이미 국외에서는 WordNet과 같은 의미적 언어자원을 활용하여 많은 연구가 진행되고 있다. 그러나 국내에서는 아직 한국어 의미망을 바탕으로 한 개념간의 유사성 측정 방법이나 이를 활용하는 방법에 대한 연구가 미흡하다. 본 논문에서는 이를 바탕으로 링크 타입 노드의 깊이 최단경로 정보량 등의 요소를 이용한 의미 유사도 측정방법을 제안하고 이를 활용하여 명사-용언간의 연계 정보를 확보함으로써, 효율적으로 명사-용언간의 네트워크를 구축하도록 한다.

키워드