Comparison of Homograph Meaning Representation according to BERT's layers

Kang, Il Min;Choi, Yong-Seok;Lee, Kong Joo;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2019.10a
/
Pages.161-164
/
2019
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Comparison of Homograph Meaning Representation according to BERT's layers

BERT 레이어에 따른 동형이의어 의미 표현 비교

Kang, Il Min (Chungnam National University) ;
Choi, Yong-Seok (Chungnam National University) ;
Lee, Kong Joo (Chungnam National University)

강일민 (충남대학교) ;
최용석 (충남대학교) ;
이공주 (충남대학교)

Published : 2019.10.10

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문은 BERT 모델을 이용하여 동형이의어의 단어 표현(Word Representation) 차이에 대한 실험을 한다. BERT 모델은 Transformer 모델의 인코더 부분을 사용하여 양방향을 고려한 단어 예측과 문장 수준의 이해를 얻을 수 있는 모델이다. 실험은 동형이의어에 해당되는 단어의 임베딩으로 군집화를 수행하고 이를 Purity와 NMI 점수로 계산하였다. 또한 각 단어 임베딩 사이를 코사인거리(Cosine Distance)로 계산하고 t-SNE를 통해 계층에 따른 변화를 시각화하였다. 군집된 결과는 모델의 중간 계층에서 점수가 가장 높았으며, 코사인거리는 8계층까지는 증가하고 11계층에서 급격히 값이 변하는 것을 확인할 수 있었다.

Keywords

Acknowledgement

이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2019R1F1A1053136)