Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2004.05a
- /
- Pages.669-672
- /
- 2004
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
A Study on Cluster Topic Selection in Hierarchical Clustering
계층적 클러스터링에서 분류 대표어 선정에 관한 연구
- Yi, Sang-Seon (Dept. of Computer Engineering, Chonbuk National University) ;
- Lee, Shin-Won (Dept. of Computer Engineering, Chonbuk National University) ;
- An, Dong-Un (Dept. of Computer Engineering, Chonbuk National University) ;
- Chung, Sung-Jong (Dept. of Computer Engineering, Chonbuk National University)
- Published : 2004.05.14
Abstract
정보의 양이 많아지면서 정보 검색 시스템에 검색 결과를 자동으로 구조화하는 계층적 클러스터링을 적용하는 시도가 늘고 있다. 계층적 클러스터링은 문서 간의 유사도를 통해 클러스터를 계층 구조로 만들어 검색 성능을 높이고 결과를 사용자에게 이해하기 쉽게 보여준다. 계층 구조는 검색 결과를 요약하는 것이기 때문에 클러스터의 내용을 효과적으로 함축할 수 있는 대표어의 선정이 중요하다. 각 클러스터의 대표어를 선정하기 위해 대표어에 명사인 단어만 추출하고 상위 클러스터 대표어에 사용된 단어는 하위 클러스터에 사용하지 않는 방법을 적용하여 대표어의 질을 높였다.
Keywords