Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1996.10a
- /
- Pages.42-48
- /
- 1996
- /
- 2005-3053(pISSN)
Breaking Compound Nouns for Better Indexing
효율적인 색인을 위한 복합 명사의 분해
- Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
- Lee, Hyun-A (Dept. of Natural Language Information Processing, SERI) ;
- Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
- Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
- Park, Dong-In (Dept. of Natural Language Information Processing, SERI)
- 박수준 (시스템공학연구소 자연어정보처리연구부) ;
- 이현아 (시스템공학연구소 자연어정보처리연구부) ;
- 장명길 (시스템공학연구소 자연어정보처리연구부) ;
- 박재득 (시스템공학연구소 자연어정보처리연구부) ;
- 박동인 (시스템공학연구소 자연어정보처리연구부)
- Published : 1996.10.11
Abstract
정보검색에서의 효율적인 복합명사의 분석은 정확도와 재현율의 향상을 통해 색인의 질을 높여준다. 복합명사의 분석은 많은 노력이 요구되는 작업이다. 본 논문은 간단한 분해규칙을 이용하여 복합명사의 의미해석을 대신하였다. 실험을 위해 동아일보 사설을 대상으로 복합명사를 추출하고 이를 도출된 분해규칙을 이용하여 분해하였다. 실험을 통해 평균 96.2%의 분해 성공률을 보였다.
Keywords