Proceedings of the Korean Society for Cognitive Science Conference (한국인지과학회:학술대회논문집)
- 2000.06a
- /
- Pages.56-59
- /
- 2000
A Reverse Segmentation Algorithm of Compound Nouns
복합명사의 역방향 분해 알고리즘
Abstract
한국어에서 복합명사는 명사간 결합이 자유롭고, 단위명사로 띄어쓰는 것을 원칙으로 하나 붙여써도 무방하다. 따라서, 정보검색분야, 기계번역분야에서 복합명사의 정확한 분해는 시스템의 성능에 많은 영향을 미치게 된다. 본 논문에서는 ETRI의 태깅된 코퍼스로부터 추출한 복합명사를 역방향 분해 알고리즘을 이용하여 단위명사로 분해한다. 분해되지 않은 3119개의 복합명사에 대해 실험한 결과 약 96.6%의 정확도를 얻었다. 또한, 미등록이나 접사에 대한 처리에도 비교적 정확한 결과를 얻을 수 있었다.
Keywords