Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2000.10d
- /
- Pages.56-59
- /
- 2000
- /
- 2005-3053(pISSN)
A Reverse Segmentation Algorithm of Compound Nouns
복합명사의 역방향 분해 알고리즘
- Lee, Hyun-Min (Dept. of Computer Science, Chonnam National University) ;
- Park, Hyuk-Ro (Dept. of Computer Science, Chonnam National University)
- Published : 2000.10.13
Abstract
한국어에서 복합명사는 명사간 결합이 자유롭고, 단위명사로 띄어쓰는 것을 원칙으로 하나 붙여써도 무방하다. 따라서, 정보검색분야, 기계번역분야에서 복합명사의 정확한 분해는 시스템의 성능에 많은 영향을 미치게 된다. 본 논문에서는 ETRI의 태깅된 코퍼스로부터 추출한 복합명사를 역방향 분해 알고리즘을 이용하여 단위명사로 분해한다. 분해되지 않은 3119개의 복합명사에 대해 실험한 결과 약 96.6%의 정확도를 얻었다. 또한, 미등록어나 접사에 대한 처리에도 비교적 정확한 결과를 얻을 수 있었다.
Keywords