기계 독해를 이용한 COVID-19 뉴스 도메인의 한국어 질의응답 챗봇

Korean Q&A Chatbot for COVID-19 News Domains Using Machine Reading Comprehension

  • 이태민 (고려대학교 Human-Inspired AI 연구소) ;
  • 박기남 (고려대학교 Human-Inspired AI 연구소) ;
  • 박정배 (고려대학교 Human-Inspired AI 연구소) ;
  • 정영희 (버시스트) ;
  • 채정민 (버시스트) ;
  • 임희석 (고려대학교 Human-Inspired AI 연구소)
  • 발행 : 2020.10.14

초록

코로나 19와 관련한 다양한 정보 확인 욕구를 충족하기 위해 한국어 뉴스 데이터 기반의 질의응답 챗봇을 설계하고 구현하였다. BM25 기반의 문서 검색기, 사전 언어 모형인 KoBERT 기반의 문서 독해기, 정답 생성기의 세 가지 모듈을 중심으로 시스템을 설계하였다. 뉴스, 위키, 통계 정보를 수집하여 웹 기반의 챗봇 인터페이스로 질의응답이 가능하도록 구현하였다. 구현 결과는 http://demo.tmkor.com:36200/mrcv2 페이지에서 접근 및 사용을 할 수 있다.

키워드

과제정보

본 연구는 과학기술정보통신부 및 정보통신기술기획평가원의 대학ICT연구센터지원사업의 연구결과(IITP-2020-2018-0-01405) 및 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기술기획평가원의 지원을 받아 수행된 연구임 (No. 2020-0-00368, 뉴럴-심볼릭(neural-symbolic) 모델의 지식 학습 및 추론 기술 개발)