Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization

Lee, Changsu;Cheon, Juryong;Kim, Joogeun;Kim, Taeil;Kang, Inho;

한국어정보학회:학술대회논문집

2017.10a
/
Pages.76-81
/
2017

Korean Language Information Science Society (한국어정보학회)

Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별

Lee, Changsu (Naver Corporation) ;
Cheon, Juryong (Naver Corporation) ;
Kim, Joogeun (Naver Corporation) ;
Kim, Taeil (Naver Corporation) ;
Kang, Inho (Naver Corporation)

이창수 (네이버 검색) ;
천주룡 (네이버 검색) ;
김주근 (네이버 검색) ;
김태일 (네이버 검색) ;
강인호 (네이버 검색)

Published : 2017.10.13

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

한국어정보학회:학술대회논문집

Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)