Document Embedding for Entity Linking in Social Media

문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결

  • Park, Youngmin (Department of Computer Science and Engineering, Sogang University) ;
  • Jeong, Soyun (LG Electronics Software Center) ;
  • Lee, Jeong-Eom (Convergence Technology Development Team, Hyundai Motor Company) ;
  • Shin, Dongsoo (Convergence Technology Development Team, Hyundai Motor Company) ;
  • Kim, Seona (Convergence Technology Development Team, Hyundai Motor Company) ;
  • Seo, Junyun (Department of Computer Science and Engineering, Sogang University)
  • 박영민 (서강대학교 컴퓨터공학과) ;
  • 정소윤 (LG전자 소프트웨어센터) ;
  • 이정엄 (현대자동차 융합기술개발팀) ;
  • 신동수 (현대자동차 융합기술개발팀) ;
  • 김선아 (현대자동차 융합기술개발팀) ;
  • 서정연 (서강대학교 컴퓨터공학과)
  • Published : 2017.10.13

Abstract

기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.

Keywords