How to Generate Term Vectors to Support the Automatic Generation of Taxonomy

Su-Jin Seong;Jeong-Won Cha;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2022.10a
/
Pages.600-603
/
2022
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

How to Generate Term Vectors to Support the Automatic Generation of Taxonomy

분류체계 자동 생성 지원을 위한 용어 벡터 생성 방법 탐색

Su-Jin Seong (Changwon National University) ;
Jeong-Won Cha (Changwon National University)

성수진 (창원대학교) ;
차정원 (창원대학교)

Published : 2022.10.18

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

분류체계를 결정하는 일은 매우 중요하지만 어려운 일이다. 우리는 수집된 용어 목록에 클러스터링을 적용하여 상위 범주의 범위를 자동으로 설정하고자 하였다. 용어 클러스터링은 용어를 나타내는 벡터에 큰 의존성을 갖는다. 이에 클러스터링의 성능 향상을 위해 다양한 용어 임베딩 방법을 비교하였으며 용어에 대한 정의문의 벡터를 용어 벡터로 사용하여 가장 우수한 클러스터링 결과를 얻었다. 또한 실험을 통해 클러스터링 알고리즘 중 k-means clustering이 고차원의 벡터에 대해 좋은 성능의 군집을 생성함을 확인하였다.

Keywords

fasttext

Acknowledgement

본 연구는 한국과학기술정보연구원(KISTI)의 위탁연구 과제(P22032)로 수행한 것입니다.