A Comparative Study on Building Korean & Chinese Music Request Sentence Patterns for AI Assistant Platforms

AI 어시스턴트 플랫폼의 한국어와 중국어 음악청취 요청문 패턴구축 비교 연구

  • Yun, Soeun (DICORA/Dept. of LCS, Hankuk University of Foreign Studies) ;
  • Li, Jiabin (DICORA/Dept. of LCS, Hankuk University of Foreign Studies) ;
  • Nam, Jeesun (DICORA/Dept. of LCS, Hankuk University of Foreign Studies)
  • 윤소은 (한국외국어대학교, DICORA 연구센터/언어인지과학과) ;
  • 이가빈 (한국외국어대학교, DICORA 연구센터/언어인지과학과) ;
  • 남지순 (한국외국어대학교, DICORA 연구센터/언어인지과학과)
  • Published : 2020.10.14

Abstract

본 연구에서는 AI 어시스턴트의 음악청취 도메인 내 요청문을 인식 및 처리하기 위해 한국어와 중국어를 중심으로 도메인 사전 및 패턴문법 언어자원을 구축하고 그 결과를 비교분석 하였다. 이를 통해 향후 다국어 언어자원 구축의 접근 방법을 모색할 수 있으며, 궁극적으로 패턴 기반 문법으로 기술한 언어자원을 요청문 인식에 직접 활용하고 또한 주석코퍼스 생성을 통해 기계학습 성능 향상에 도움을 줄 수 있을 것으로 기대된다. 본 연구에서는 우선 패턴문법의 구체적인 양상을 살펴보기에 앞서, 해당 도메인의 요청문 유형의 카테고리를 결정하는 과정을 거쳤다. 이를 기반으로 한국어와 중국어 요청문의 실현 양상과 패턴유형을 LGG 프레임으로 구조화한 후, 한국어와 중국어 패턴문법 간의 통사적, 형태적, 어휘적 차이점을 비교분석 하여 음악청취 도메인 요청문의 언어별 생성 구조 차이점을 관찰할 수 있었다. 구축한 패턴문법은 개체명을 변수(X)로 설정하는 경우, 한국어에서는 약 2,600,600개, 중국어에서는 약 11,195,600개의 표현을 인식할 수 있었다. 결과적으로 본 연구에서 제안한 언어자원의 언어별 차이에 대한 통찰을 통해 다국어 차원의 요청문 인식 자원과 기계학습 데이터로서의 효용을 확인하였다.

Keywords