A Word Semantic Similarity Measure Model using Korean Open Dictionary

Kim, Hoyong;Lee, Min-Ho;Seo, Dongmin;

Proceedings of the Korea Contents Association Conference (한국콘텐츠학회:학술대회논문집)

2018.05a
/
Pages.3-4
/
2018

The Korea Contents Association (한국콘텐츠학회)

A Word Semantic Similarity Measure Model using Korean Open Dictionary

우리말샘 사전을 이용한 단어 의미 유사도 측정 모델 개발

Kim, Hoyong (Korea Institute of Science and Technology Information) ;
Lee, Min-Ho (Korea Institute of Science and Technology Information) ;
Seo, Dongmin (Korea Institute of Science and Technology Information)

김호용 (한국과학기술정보연구원) ;
이민호 (한국과학기술정보연구원) ;
서동민 (한국과학기술정보연구원)

Published : 2018.05.11

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

단어 의미 유사도 측정은 정보 검색이나 문서 분류와 같이 자연어 처리 분야 문제를 해결하는 데 큰 도움을 준다. 이러한 의미 유사도 측정 문제를 해결하기 위하여 단어의 계층 구조를 사용한 기존 연구들이 있지만 이는 단어의 의미를 고려하고 있지 않아 만족스럽지 못한 결과를 보여주고 있다. 본 논문에서는 국립국어원에서 간행한 표준국어대사전에 50만 어휘가 추가된 우리말샘 사전을 기반으로 하여 한국어 단어에 대한 계층 구조를 파악했다. 그리고 단어의 용례를 word2vec 모델에 학습하여 단어의 문맥적 의미를 파악하고, 단어의 정의문을 sent2vec 모델에 학습하여 단어의 사전적 의미를 파악했다. 또한, 구축된 계층 구조와 학습된 word2vec, sent2vec 모델을 이용하여 한국어 단어 의미 유사도를 측정하는 모델을 제안했다. 마지막으로 성능 평가를 통해 제안하는 모델이 기존 모델보다 향상된 성능을 보임을 입증했다.

Proceedings of the Korea Contents Association Conference (한국콘텐츠학회:학술대회논문집)

A Word Semantic Similarity Measure Model using Korean Open Dictionary

우리말샘 사전을 이용한 단어 의미 유사도 측정 모델 개발

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)