Korean Question Generation using BERT-based Sequence-to-Sequence Model

Lee, Dong-Heon;Hwang, Hyeon-Seon;Lee, Chang-Gi;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
/
Pages.60-63
/
2020
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

BERT 기반 Sequence-to-Sequence 모델을 이용한 한국어 질문 생성

Korean Question Generation using BERT-based Sequence-to-Sequence Model

이동헌 (강원대학교) ;
황현선 (강원대학교) ;
이창기 (강원대학교)

발행 : 2020.10.14

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

기계 독해는 입력 받은 질문과 문단의 관계를 파악하여 알맞은 정답을 예측하는 자연어처리 태스크로 양질의 많은 데이터 셋을 필요로 한다. 기계 독해 학습 데이터 구축은 어려운 작업으로, 문서에서 등장하는 정답과 정답을 도출할 수 있는 질문을 수작업으로 만들어야 한다. 이러한 문제를 해결하기 위하여, 본 논문에서는 정답이 속한 문서로부터 질문을 자동으로 생성해주는 BERT 기반의 Sequence-to-sequence 모델을 이용한 한국어 질문 생성 모델을 제안한다. 또한 정답이 속한 문서와 질문의 언어가 같고 정답이 속한 문장의 주변 단어가 질문에 등장할 확률이 크다는 특성에 따라 BERT 기반의 Sequence-to-sequence 모델에 복사 메카니즘을 추가한다. 실험 결과, BERT + Transformer 디코더 모델의 성능이 기존 모델과 BERT + GRU 디코더 모델보다 좋았다.

키워드

BERT;
transformer;

과제정보

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2013-2-00131, 휴먼 지식증강 서비스를 위한 지능진화형 Wise QA 플랫폼 기술 개발)

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

BERT 기반 Sequence-to-Sequence 모델을 이용한 한국어 질문 생성

Korean Question Generation using BERT-based Sequence-to-Sequence Model

초록

키워드

과제정보

자세히 찾기