DOI QR코드

DOI QR Code

An Expansion of Vector Space for Document Classifications

문서 분류에 이용 가능한 벡터 공간의 확장 방법

  • Lee, Samuel Sangkon (Dept. of Computer Engineering and Engineering, Jeonju University) ;
  • Yoo, Kyungseok (Dept. of Computer Engineering and Engineering, Jeonju University)
  • 이상곤 (전주대학교 컴퓨터공학과 언어과학실) ;
  • 유경석 (전주대학교 컴퓨터공학과 언어과학실)
  • Published : 2015.04.22

Abstract

본 논문에서는 한국어 문서의 분류 정밀도 향상을 위해 애매어와 해소어 정보를 이용한 확장된 벡터 공간 모델을 제안하였다. 벡터 공간 모델에 사용된 벡터는 같은 정도의 가중치를 갖는 축이 하나 더 존재하지만, 기존의 방법은 그 축에 아무런 처리가 이루어지지 않았기 때문에 벡터끼리의 비교를 할 때 문제가 발생한다. 같은 가중치를 갖는 축이 되는 단어를 애매어라 정의하고, 단어와 분야 사이의 상호정보량을 계산하여 애매어를 결정하였다. 애매어에 의해 애매성을 해소하는 단어를 해소어라 정의하고, 애매어와 동일한 문서에서 출현하는 단어 중에서 상호정보량을 계산하여 해소어의 세기를 결정하였다. 본 논문에서는 애매어와 해소어를 이용하여 벡터의 차원을 확장하여 문서 분류의 정밀도를 향상시키는 방법을 제안하였다.

Keywords