Automatic Data Augmentation for Korean AMR Sembanking & Parsing

Choe, Hyonsu;Min, Jinwoo;Na, Seung-Hoon;Kim, Hansaem;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2020.10a
/
Pages.287-291
/
2020
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Automatic Data Augmentation for Korean AMR Sembanking & Parsing

한국어 의미 자원 구축 및 의미 파싱을 위한 Korean AMR 데이터 자동 증강

Choe, Hyonsu (NCSOFT Corp.) ;
Min, Jinwoo (Jeonbuk National University) ;
Na, Seung-Hoon (Jeonbuk National University) ;
Kim, Hansaem (Yonsei University)

최현수 ((주)엔씨소프트 Language AI Lab) ;
민진우 (전북대학교) ;
나승훈 (전북대학교) ;
김한샘 (연세대학교)

Published : 2020.10.14

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 연구에서는 한국어 의미 표상 자원 구축과 의미 파싱 성능 향상을 위한 데이터 자동 증강 방법을 제안하고 수동 구축 결과 대비 자동 변환 정확도를 보인다. 지도 학습 기반의 AMR 파싱 모델이 유의미한 성능에 도달하려면 대량의 주석 데이터가 반드시 필요하다. 본 연구에서는 기성 언어 분석 기술 또는 기존에 구축된 말뭉치의 주석 정보를 바탕으로 Semi-AMR 데이터를 변환해내는 알고리즘을 제시하며, 자동 변환 결과는 Gold-standard 데이터에 대해 Smatch F1 0.46의 일치도를 보였다. 일정 수준 이상의 정확도를 보이는 자동 증강 데이터는 주석 프로젝트에 소요되는 비용을 경감시키는 데에 활용될 수 있다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Automatic Data Augmentation for Korean AMR Sembanking & Parsing

한국어 의미 자원 구축 및 의미 파싱을 위한 Korean AMR 데이터 자동 증강

Abstract

Keywords