한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
- /
- Pages.439-444
- /
- 2001
- /
- 2005-3053(pISSN)
방향성을 이용한 한국어 비재귀 명사구 인식 모델
Korean BaseNP Identification Model using Forward and Backward Processing Characteristics
- Lee, Sheen-Mok (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
- Kang, In-Ho (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST) ;
- Kim, Gil-Chang (Department of Electrical Engineering & Computer Science, Division of Computer Science, KAIST)
- 발행 : 2001.10.12
초록
비재귀 명사구(baseNP)는 단순한 단어 패턴과 품사 패턴에 의하여 쉽게 인식되므로, 자연어처리의 다양한 분야에서 활용한다. 교착어의 지배 성분 후위 원칙에 의하여 한국어 비재귀 명사구 인식은 보다 많은 광역 정보를 필요로 하므로, 본 논문에서는 광역 정보의 활용이 쉬운 상태 기반 모델을 사용한다. 본 논문은 상태 기반의 한국어 비재귀 명사구 인식에서 방향성을 고려한다. 교착어의 특성상 한국어 비재귀 명사구는 처음 위치가 끝 위치에 비하여 인식이 어려운 특징을 가지므로 방향성을 고려하여 오른쪽 우선의 방범을 활용한 경우, 모델의 특성 및 성능이 변화한다. 본 논문에서는 기존의 왼쪽 우선 방법과 새로이 제안하는 오른쪽 우선 방법을 각각 적용하고, 양 방법을 통합하는 방법들을 제안한다. 통합 결과 92.55%의 정확률과 90.90%의 재현률을 얻었다.
키워드