Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2003.11a
- /
- Pages.481-484
- /
- 2003
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
Parts-Of-Speech Tagging System Using Grammar Rule and Eojeol Relativity
문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템
- Do, Mi-Sook (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
- Choe, Ho-Seop (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
- Ock, Cheol-Young (Dept. of Computer Engineering and Information Technology, University of Ulsan)
- Published : 2003.11.14
Abstract
본 논문에서는 문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템을 제안한다. 원시 말뭉치와 품사태그 부착 말뭉치에서 중의 어절(ambiguity eojeol)의 앞뒤 어휘와 품사 정보를 파악하여 문법 규칙을 마련하였으며, 한국어의 품사와 문장성분적 요소를 고려한 7개의 어절 태그를 설정하여 이 어절 태그간의 확률값을 이용해 어절간의 상관도를 구하였다. 이러한 방법들을 이용하여 품사 태깅을 실험한 결과, 150 만 어절의 학습 말뭉치와 3 만 어절의 실험 말뭉치에서 각각 평균 92%와 91%의 정확률을 보였다.
Keywords