Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2012.10a
- /
- Pages.99-103
- /
- 2012
- /
- 2005-3053(pISSN)
Korean Semantic Tagged Corpus Construction working
한국어 의미 표지 부착 말뭉치 구축 작업
- Lee, Min-Ji (Dept. of Ubiquitous Game Computing, Hallym Universitiy) ;
- Lee, Yoon-Jeong (Dept. of Ubiquitous Game Computing, Hallym Universitiy) ;
- Lee, Jung-Kuk (Dept. of Computer Engineering, Hallym Universitly) ;
- Kim, Jong-Dae (Dept. of Ubiquitous Computing, Hallym University) ;
- Park, Chan-Young (Dept. of Ubiquitous Computing, Hallym University) ;
- Song, Hae-Jung (Dept. of Ubiquitous Computing, Hallym University) ;
- Kim, Yu-Seop (Dept. of Ubiquitous Computing, Hallym University)
- 이민지 (한림대학교 유비쿼터스 게임공학과) ;
- 이윤정 (한림대학교 유비쿼터스 게임공학과) ;
- 이정국 (한림대학교 컴퓨터공학과) ;
- 김종대 (한림대학교 유비쿼터스 컴퓨팅학과) ;
- 박찬영 (한림대학교 유비쿼터스 컴퓨팅학과) ;
- 송혜정 (한림대학교 유비쿼터스 컴퓨팅학과) ;
- 김유섭 (한림대학교 유비쿼터스 컴퓨팅학과)
- Published : 2012.10.06
Abstract
의미 역 결정 (Semantic Role Labeling)은 문장 내의 술어-논항 요소들의 의미 관계를 결정하는 과정이다. 이를 위해서는 의미 표지 부착 말뭉치가 필요하지만 한국어의 경우 이 데이터가 매우 부족한 상황이다. 본 논문에서는 한국어 Proposition Bank(이하 PropBank) 말뭉치와 세종 용언 격틀 말뭉치 구축을 위한 의미 표지 부착 작업에 대해 설명한다. 표지 부착 작업은 말뭉치의 의존 관계를 사람이 파악하여 적절한 의미 역 태그를 다는 과정이고, 이 과정으로부터 얻은 말뭉치는 의미 역 결정을 위한 기계 학습 방법론의 훈련 자료로 이용된다. 이 과정에서 필요한 구문 표지 부착 밀뭉치로는 한국전자통신연구원의 구문표지 부착 말뭉치를, 그리고 언어자원으로는 한국어 PropBank의 frame file과 세종 용언 격틀 사전을 사용한다.