Similar Verb Words Extraction based on their Case Frame Structure

격틀 구조에 기반한 유사 동사 추출

  • Cho, Junghyun (Dept. of Computer Engineering, Hallym University) ;
  • Jung, Hyunki (Dept. of Computer Engineering, Hallym University) ;
  • Kim, Yu-Seop (Dept. of Computer Engineering, Hallym University)
  • 조정현 (한림대학교 컴퓨터공학과) ;
  • 정현기 (한림대학교 컴퓨터공학과) ;
  • 김유섭 (한림대학교 컴퓨터공학과)
  • Published : 2009.10.09

Abstract

한국어 Propbank를 구축하기 위해서는 유사 동사를 군집화하고 군집에 포함되는 동사들의 구문 및 의미 특성을 모아놓은 정보가 필요하다. 본 연구에서는 이러한 군집화의 초기 단계로써 개별 동사들의 격틀 구조에 기반하여 동사간의 유사도를 추정하여 유사 동사를 추출하고자 하였다. 본 연구는 개별 동사의 격틀 정보를 추출하기 위하여 세종 계획의 용언 사전과 KAIST 언어자원의 동사 격틀 사전을 활용하였다. 또한 격틀을 세분화하여 보다 상세한 격틀 정보를 생성하기 위하여 격틀이 가지고 있는 논항의 특성을 활용하였다. 동사의 유사도를 측정하기 위하여 개별 동사들은 벡터로 표현하였고, 벡터의 원소는 해당 동사가 다른 동사와 세분화된 격틀을 공유하는 정도로 하였다. 실험에서는 두 용언 사전에서 개별적으로 위의 과정을 진행하여 각 동사와 유사한 동사들을 추출하였다.

Keywords