Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2017.10a
- /
- Pages.194-196
- /
- 2017
- /
- 2005-3053(pISSN)
Document Embedding for Entity Linking in Social Media
문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결
- Park, Youngmin (Department of Computer Science and Engineering, Sogang University) ;
- Jeong, Soyun (LG Electronics Software Center) ;
- Lee, Jeong-Eom (Convergence Technology Development Team, Hyundai Motor Company) ;
- Shin, Dongsoo (Convergence Technology Development Team, Hyundai Motor Company) ;
- Kim, Seona (Convergence Technology Development Team, Hyundai Motor Company) ;
- Seo, Junyun (Department of Computer Science and Engineering, Sogang University)
- 박영민 (서강대학교 컴퓨터공학과) ;
- 정소윤 (LG전자 소프트웨어센터) ;
- 이정엄 (현대자동차 융합기술개발팀) ;
- 신동수 (현대자동차 융합기술개발팀) ;
- 김선아 (현대자동차 융합기술개발팀) ;
- 서정연 (서강대학교 컴퓨터공학과)
- Published : 2017.10.13
Abstract
기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.