Breaking Compound Nouns for Better Indexing

효율적인 색인을 위한 복합 명사의 분해

  • Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
  • Lee, Hyun-A (Dept. of Natural Language Information Processing, SERI) ;
  • Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Dong-In (Dept. of Natural Language Information Processing, SERI)
  • 박수준 (시스템공학연구소 자연어정보처리연구부) ;
  • 이현아 (시스템공학연구소 자연어정보처리연구부) ;
  • 장명길 (시스템공학연구소 자연어정보처리연구부) ;
  • 박재득 (시스템공학연구소 자연어정보처리연구부) ;
  • 박동인 (시스템공학연구소 자연어정보처리연구부)
  • Published : 1996.10.11

Abstract

정보검색에서의 효율적인 복합명사의 분석은 정확도와 재현율의 향상을 통해 색인의 질을 높여준다. 복합명사의 분석은 많은 노력이 요구되는 작업이다. 본 논문은 간단한 분해규칙을 이용하여 복합명사의 의미해석을 대신하였다. 실험을 위해 동아일보 사설을 대상으로 복합명사를 추출하고 이를 도출된 분해규칙을 이용하여 분해하였다. 실험을 통해 평균 96.2%의 분해 성공률을 보였다.

Keywords