Automatic Construction of Syntactic Relation in U-WIN

U-WIN의 구문관계 자동구축 방법

  • Im, Jihui (Korean Language Processing Laboratory, Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Kim, Dongmyoung (Korean Language Processing Laboratory, Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Choe, Hoseop (Information System Development Team, Korean Institute of Science and Technology Information) ;
  • Yoon, Hwa-Mook (Information System Development Team, Korean Institute of Science and Technology Information) ;
  • Ock, Cheolyoung (Korean Language Processing Laboratory, Dept. of Computer Engineering and Information Technology, University of Ulsan)
  • 임지희 (울산대학교 컴퓨터정보통신공학과 한국어처리연구실) ;
  • 김동명 (울산대학교 컴퓨터정보통신공학과 한국어처리연구실) ;
  • 최호섭 (한국과학기술정보연구원 정보기술개발단 정보시스템개발팀) ;
  • 윤화묵 (한국과학기술정보연구원 정보기술개발단 정보시스템개발팀) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학과 한국어처리연구실)
  • Published : 2007.10.12

Abstract

일반적인 어휘망이 의미 관계에 의한 연결 구조를 중심으로 연구 개발된 것과는 달리, U-WIN은 의미관계를 비롯하여 개념 관계, 형태 관계, 구문 관계 등과 같이 의미 관계의 범위를 확장한 어휘 관계를 적용하여 구축하고 있다. 본 연구에서는 U-WIN의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 용언의 용례에서 문형정보를 기준으로 구문관계를 형성할 수 있는 후보명사를 추출하였으며, 추출한 후보명사는 용언의 세분화된 의미별로 정확하고 다양하게 추출할 수 있었다. 그러나 U-WIN은 다의어의 뜻풀이 하나하나를 개별적인 어휘로 구분하여 구축하였으므로, 어휘 간의 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 하나의 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문패턴, 의미 유사도 등을 차례로 적용하여 후보명사의 의미를 분별하였으며, 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미 분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

Keywords