Korean Part-of-Speech Tagging Error Correction Method Based on Statistical Decision Graph Learning

Ryu, Won-Ho;Lee, Sang-Zoo;Rim, Hae-Chang;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2001.10d
/
Pages.123-129
/
2001
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Korean Part-of-Speech Tagging Error Correction Method Based on Statistical Decision Graph Learning

통계적 결정 그래프 학습 방법을 이용한 한국어 품사 부착 오류 수정

Ryu, Won-Ho (Dept. of Computer Science and Engineering, Korea University) ;
Lee, Sang-Zoo (Dept. of Computer Science and Engineering, Korea University) ;
Rim, Hae-Chang (Dept. of Computer Science and Engineering, Korea University)

류원호 (고려대학교 컴퓨터학과) ;
이상주 (고려대학교 컴퓨터학과) ;
임해창 (고려대학교 컴퓨터학과)

Published : 2001.10.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

지금까지 한국어 품사 부착을 위해 다양한 모델이 제안되었고 95% 이상의 높은 정확도를 보여주고 있다. 그러나 4-5%의 오류는 실제 응용 분야에서 많은 문제를 야기시킬 수 있다. 이러한 오류를 최소화하기 위해서는 오류를 분석하고 이를 수정할 수 있는 규칙들을 학습하여 재사용하는 방범이 효과적이다. 오류 수정 규칙을 학습하기 위한 기존의 방법들은 수동학습 방법과 자동 학습 방법으로 나눌 수 있다 수동 학습 방법은 많은 비용이 요구되는 단점이 있다. 자동 학습 방법의 경우 모두 변형규칙 기반 접근 방법을 사용하였는데 어휘 정보를 고려할 경우 탐색 공간과 규칙 적용 시간이 매우 크다는 단점이 있다. 따라서 본 논문에서는 초기 모델에 대한 오류 수정 규칙을 효율적으로 학습하기 위한 새로운 방법으로 결정 트리 학습 방법을 확장한 통계적 결정 그래프 학습 방법을 제안한다. 제안된 방법으로 두 가지 실험을 수행하였다. 초기 모델의 정확도가 높고 말뭉치의 크기가 작은 첫 번째 실험의 경우 초기 모델의 정확도 95.48%를 97.37%까지 향상시킬 수 있었다. 초기 모델의 정확도가 낮고 말뭉치 크기가 큰 두 번째 실험의 경우 초기 모델의 정확도 87.22%를 95.59%로 향상시켰다. 또한 실험을 통해 결정 트리 학습 방법에 비해 통계적 결정 그래프 학습 방법이 더욱 효과적임을 알 수 있었다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Korean Part-of-Speech Tagging Error Correction Method Based on Statistical Decision Graph Learning

통계적 결정 그래프 학습 방법을 이용한 한국어 품사 부착 오류 수정

Abstract

Keywords