Empirical Study on the Hallucination of Large Language Models Derived by the Sentence-Closing Ending

Hyeonseok Moon;Sugyeong Eo;Jaehyung Seo;Chanjun Park;Yuna Hur;Heuiseok Lim;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2023.10a
/
Pages.677-682
/
2023
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Empirical Study on the Hallucination of Large Language Models Derived by the Sentence-Closing Ending

어체에 따른 초거대언어모델의 한국어 환각 현상 분석

Hyeonseok Moon (Department of Computer Science and Engineering, Korea University) ;
Sugyeong Eo (Department of Computer Science and Engineering, Korea University) ;
Jaehyung Seo (Department of Computer Science and Engineering, Korea University) ;
Chanjun Park (Upstage) ;
Yuna Hur (Human-inspired AI Research) ;
Heuiseok Lim (Department of Computer Science and Engineering, Korea University)

문현석 (고려대학교 컴퓨터학과) ;
어수경 (고려대학교 컴퓨터학과) ;
서재형 (고려대학교 컴퓨터학과) ;
박찬준 ;
허윤아 (Human-inspired AI 연구소) ;
임희석 (고려대학교 컴퓨터학과)

Published : 2023.10.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

초거대 언어모델은 모델의 학습 없이 학습 예시만을 입력에 추가함으로써 목표하는 작업을 수행한다. 이런 방식은 상황 내 학습 (In-Context Learning, ICL)이라 불리며, 초거대 언어모델 활용의 사실상의 표준으로 사용되고 있다. 하지만 이러한 모델은, 환각현상 등 사용상의 한계가 발생하는 상황이 다수 발생한다는 연구 결과가 나오고 있다. 본 연구에서는 초거대언어모델을 한국어 작업에서 사용하는 경우, 매우 간단한 수준의 종결어미 변환만으로도 성능 편차가 매우 크게 발생함을 확인하였다. 우리는 이에 대한 분석을 통해, 학습 예시의 어체와 추론 대상의 어체의 변환에 따라 초거대언어모델의 효용성이 크게 변함을 발견하고 이에 대해 분석한다. 나아가 우리는 본 실험 결과를 바탕으로, 어체에 대한 일관성이 유지된 형태의 한국어 데이터 구축이 이루어져야 함을 제안한다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부 및 정보통신기술기획평가원의 대학ICT연구센터지원사업의 연구결과로 수행되었음(IITP-2023-2018-0-01405). 이 논문은 2023년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(NRF-2021R1A6A1A03045425). 이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. 2022R1A5A7026673)