Fusion-in-Decoder for Open Domain Multi-Modal Question Answering

FiD를 이용한 멀티 모달 오픈 도메인 질의 응답

  • Eunhwan Park (Division of Computer Science and Engineering, Jeonbuk National University) ;
  • Sung-Min Lee (Division of Computer Science and Engineering, Jeonbuk National University) ;
  • Daeryong Seo (NAVER Corporation) ;
  • Donghyeon Jeon (NAVER Corporation) ;
  • Inho Kang (NAVER Corporation) ;
  • Seung-Hoon Na (Division of Computer Science and Engineering, Jeonbuk National University)
  • Published : 2022.10.18

Abstract

오픈 도메인 질의 응답 (ODQA, Open-Domain Question Answering)은 주어진 질문에 대한 답을 찾는 과업으로서 질문과 관련있는 지식을 찾는 "검색" 단계를 필요로 한다. 최근 이미지, 테이블 등의 검색을 요구하는 멀티 모달 ODQA에 대한 연구가 많이 진행되었을 뿐만 아니라 산업에서의 중요도 또한 높아지고 있다. 본 논문은 여러 종류의 멀티 모달 ODQA 중에서도 테이블 - 텍스트 기반 멀티 모달 ODQA 데이터 집합으로 Fusion-in-Decoder (FiD)를 이용한 멀티 모달 오픈 도메인 질의 응답 연구를 제안하며 베이스라인 대비 최대 EM 20.5, F1 23.2 향상을 보였다.

Keywords