Implementation of Korean Sentence Similarity using Sent2Vec Sentence Embedding

Park, Sang-Kil;Shin, MyeongCheol;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2018.10a
/
Pages.541-545
/
2018
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Implementation of Korean Sentence Similarity using Sent2Vec Sentence Embedding

Sent2Vec 문장 임베딩을 통한 한국어 유사 문장 판별 구현

Park, Sang-Kil (Kakao) ;
Shin, MyeongCheol (Kakao)

박상길 (카카오) ;
신명철 (카카오)

Published : 2018.10.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 Sent2Vec을 이용한 문장 임베딩으로 구현한 유사 문장 판별 시스템을 제안한다. 또한 한국어 특성에 맞게 모델을 개선하여 성능을 향상시키는 방법을 소개한다. 고성능 라이브러리 구현과 제품화 가능한 수준의 완성도 높은 구현을 보였으며, 자체 구축한 평가셋으로 한국어 특성을 반영한 모델에 대한 P@1 평가 결과 Word2Vec CBOW에 비해 9.25%, Sent2Vec에 비해 1.93% 더 높은 성능을 보였다.

Keywords

sent2vec;
word2vec