Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1997.10a
- /
- Pages.116-121
- /
- 1997
- /
- 2005-3053(pISSN)
The Construction of Predicate Subcategorization Using Tree Tagged Corpus
구문구조부착 말뭉치를 이용한 술어의 하위범주화 정보 구축
- Ryu, Pum-Mo (Dept. of Natural Language Information Processing, SERI) ;
- Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
- Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
- Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
- Park, Doing-In (Dept. of Natural Language Information Processing, SERI)
- 류법모 (시스템공학연구소 자연어정보처리연구부) ;
- 장명길 (시스템공학연구소 자연어정보처리연구부) ;
- 박수준 (시스템공학연구소 자연어정보처리연구부) ;
- 박재득 (시스템공학연구소 자연어정보처리연구부) ;
- 박동인 (시스템공학연구소 자연어정보처리연구부)
- Published : 1997.10.10
Abstract
한국어 문장에서 술어의 역할이 매우 중요하기 때문에 술어의 하위범주화 정보는 한국어 분석 및 생성에서 필수적이다. 그러나 기존의 한국어 술어의 하위범주화 사전은 전문가의 사전지식이나 직관에 의존하여 만들어졌기 때문에 주관적이고 오류의 가능성이 높으며 많은 수작업이 필요했다. 또 영역에 독립적인 하위범주화 정보를 구축하는 작업은 매우 어렵기 때문에 응용영역에 맞는 하위범주화 정보를 쉽게 구축하는 방법이 요구되었다. 본 논문에서는 구문구조부착 말뭉치를 이용하여 전문가의 제한된 개입만으로 통계정보와 명사의 의미정보를 포함하는 술어의 하위범주화 정보 구축 방법을 제안한다.
Keywords