Building a multimodal task-oriented dialogue task for panic disorder counseling

공황장애 상담을 위한 멀티모달 과제 지향 대화 태스크 구축

  • Subin Kim (Pohang University of Science and Technology, Graduated School of Artificial Intelligence) ;
  • Gary Geunbae Lee (Pohang University of Science and Technology, Graduated School of Artificial Intelligence)
  • 김수빈 (포항공과대학교 인공지능대학원) ;
  • 이근배 (포항공과대학교 인공지능대학원)
  • Published : 2023.10.12

Abstract

과제 지향 대화 시스템은 발화 의도 및 요구사항을 파악하여 사용자가 원하는 과제를 달성한다는 점에서 유용하다. 대화 상태 추적은 과제 지향 대화 시스템의 핵심 모듈이며, 최근에는 텍스트뿐만 아니라 시각 정보까지 활용하여 대화 상태를 추적하는 멀티모달 대화 상태 추적 연구가 활발히 진행되는 중이다. 본 논문에서는 멀티모달 공황장애 상담 대화 속 내담자의 상태를 추적하는 과제를 제안하였다. ChatGPT를 통한 멀티모달 공황장애 상담 과제 지향 대화 데이터셋 구축 프레임워크와, 구축한 데이터셋의 품질을 증명하기 위한 분석도 함께 제시하였다. 사전학습 언어 모델인 GPT-2를 벤치마크 데이터셋에 대해 학습한 성능을 측정함으로써 향후 멀티모달 대화 추적 성능이 능가해야 할 베이스라인 성능을 제시하였다.

Keywords

Acknowledgement

이 논문은 경찰청이 지원한 '스마트 건강관리(www.kipot.or.kr)'의 지원을 받아 수행된 연구결과입니다. [과제명: 경찰관 맞춤형 건강관리 서비스를 위한 지능형 빅데이터 통합플랫폼 개발 / 과제번호: 220222M01] 또한 이 연구는 2021년도 산업통상자원부 및 산업기술평가관리원(KEIT) 연구비 지원에 의한 연구임(20015007)