Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2023.10a
- /
- Pages.289-294
- /
- 2023
- /
- 2005-3053(pISSN)
Instruction Tuning for Controlled Text Generation in Korean Language Model
Instruction Tuning을 통한 한국어 언어 모델 문장 생성 제어
- Jinhee Jang (Jeonbuk National University) ;
- Daeryong Seo (NAVER Corporation) ;
- Donghyeon Jeon (NAVER Corporation) ;
- Inho Kang (NAVER Corporation) ;
- Seung-Hoon Na (Jeonbuk National University)
- Published : 2023.10.12
Abstract
대형 언어 모델(Large Language Model)은 방대한 데이터와 파라미터를 기반으로 문맥 이해에서 높은 성능을 달성하였지만, Human Alignment를 위한 문장 생성 제어 연구는 아직 활발한 도전 과제로 남아있다. 본 논문에서는 Instruction Tuning을 통한 문장 생성 제어 실험을 진행한다. 자연어 처리 도구를 사용하여 단일 혹은 다중 제약 조건을 포함하는 Instruction 데이터 셋을 자동으로 구축하고 한국어 언어 모델인 Polyglot-Ko 모델에 fine-tuning 하여 모델 생성이 제약 조건을 만족하는지 검증하였다. 실험 결과 4개의 제약 조건에 대해 평균 0.88의 accuracy를 보이며 효과적인 문장 생성 제어가 가능함을 확인하였다.