Fusion-in-Decoder for Open Domain Multi-Modal Question Answering

Eunhwan Park;Sung-Min Lee;Daeryong Seo;Donghyeon Jeon;Inho Kang;Seung-Hoon Na;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2022.10a
/
Pages.95-99
/
2022
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Fusion-in-Decoder for Open Domain Multi-Modal Question Answering

FiD를 이용한 멀티 모달 오픈 도메인 질의 응답

Eunhwan Park (Division of Computer Science and Engineering, Jeonbuk National University) ;
Sung-Min Lee (Division of Computer Science and Engineering, Jeonbuk National University) ;
Daeryong Seo (NAVER Corporation) ;
Donghyeon Jeon (NAVER Corporation) ;
Inho Kang (NAVER Corporation) ;
Seung-Hoon Na (Division of Computer Science and Engineering, Jeonbuk National University)

박은환 (전북대학교 컴퓨터공학부) ;
이성민 (전북대학교 컴퓨터공학부) ;
서대룡 (네이버 주식회사) ;
전동현 (네이버 주식회사) ;
강인호 (네이버 주식회사) ;
나승훈 (전북대학교 컴퓨터공학부)

Published : 2022.10.18

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

오픈 도메인 질의 응답 (ODQA, Open-Domain Question Answering)은 주어진 질문에 대한 답을 찾는 과업으로서 질문과 관련있는 지식을 찾는 "검색" 단계를 필요로 한다. 최근 이미지, 테이블 등의 검색을 요구하는 멀티 모달 ODQA에 대한 연구가 많이 진행되었을 뿐만 아니라 산업에서의 중요도 또한 높아지고 있다. 본 논문은 여러 종류의 멀티 모달 ODQA 중에서도 테이블 - 텍스트 기반 멀티 모달 ODQA 데이터 집합으로 Fusion-in-Decoder (FiD)를 이용한 멀티 모달 오픈 도메인 질의 응답 연구를 제안하며 베이스라인 대비 최대 EM 20.5, F1 23.2 향상을 보였다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Fusion-in-Decoder for Open Domain Multi-Modal Question Answering

FiD를 이용한 멀티 모달 오픈 도메인 질의 응답

Abstract

Keywords