A Study on Word Concept-based Compound Keyword Extraction

단어개념에 기반 한 한국어 복합키워드의 추출

  • Kim, Yang-Seon (Graduate School of Computer Education, Jeonju University) ;
  • Lee, Sang-Kon (Graduate School of Computer Education, Jeonju University)
  • 김양선 (전주대학교 교육대학원 컴퓨터교육학과) ;
  • 이상곤 (전주대학교 교육대학원 컴퓨터교육학과)
  • Published : 2003.11.14

Abstract

문서를 읽고 그 내용을 개념상으로 정리해 보면, 그 문서를 대표할 수 있는 적은 수의 복합단어로 이루어진 키워드를 찾을 수 있다. 그러나, 문서 내에 키워드가 존재할 경우는 별 문제가 없지만, 존재하지 않을 때는 적당한 키워드 추출이 불가능해진다. 따라서, 본 논문에서는 문서 본문의 출현단어의 개념정보를 기초로 복합어 생성 규칙을 구축하고, 나아가 문서의미와 관련 있는 요소만을 정제하는 중요도 결정법을 사용하여 이에 대한 유용성을 확인하였다.

Keywords