Unsupervised Semantic Role Labeling for Korean Adverbial Case

비지도 학습을 기반으로 한 한국어 부사격의 의미역 결정

  • Kim, Byoung-Soo (Dept. of Graduate School of Information Technology, POSTECH) ;
  • Lee, Yong-Hun (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Na, Seung-Hoon (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Kim, Jun-Gi (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc))
  • 김병수 (포항공대 정보통신대학원 정보처리학과) ;
  • 이용훈 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 나승훈 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 김준기 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 이종혁 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터)
  • Published : 2006.10.13

Abstract

본 논문은 한국어정보처리 과정에서 구문 관계를 의미 관계로 사상하는 의미역 결정 문제에 대해 다루고 있다. 한국어의 경우 대량의 학습 말뭉치를 구하기 힘들며, 이를 구축하기 위해서는 많은 시간과 노력이 필요한 문제점이 있다. 따라서 본 논문에서는 학습 말뭉치를 직접 태깅하지 않고 격틀사전을 이용하여 자동으로 학습 말뭉치를 구축하고 간단한 확률모델을 적용하여 점진적으로 모델을 학습하는 수정된 self-training 알고리즘을 사용하였다. 실험 결과, 4개의 부사격 조사에 대해 평균적으로 81.81%의 정확률을 보였으며, 수정된 self-training 방법은 기존의 방법에 비해 성능 및 실행시간에서 개선된 결과를 보였다.

Keywords