A Study for Sequence-to-sequence based Korean Abstract Meaning Representation (AMR) Parsing

Seq2seq 기반 한국어 추상 의미 표상(AMR) 파싱 연구

  • Hao Huang (Institute of Language and Information Studies) ;
  • Hyejin Park (Yonsei University) ;
  • Hansaem Kim (Institute of Language and Information Studies)
  • ;
  • 박혜진 (연세대학교 국어국문학과) ;
  • 김한샘 (연세대학교 언어정보학협동과정)
  • Published : 2022.10.18

Abstract

본 연구에서는 한국어 AMR 자동 파싱을 하기 위해 seq2seq 방법론을 적용하였다. Seq2seq 방법론은 AMR 파싱 태스크를 자연어 문장을 바탕으로 선형화된(linearization) 그래프의 문자열을 번역해내는 과정을 거친다. 본고는 Transformer 모델을 파싱 모델로 적용하여 2020년 공개된 한국어 AMR와 자체적으로 구축된 한국어 <어린 왕자> AMR 데이터에서 실험을 진행하였다. 이 연구에서 seq2seq 방법론 기반 한국어 AMR 파싱의 성능은 Smatch F1-Score 0.30으로 나타났다.

Keywords