Evaluation of Large Language Models' Korean-Text to SQL Capability

Jooyoung Choi;Kyungkoo Min;Myoseop Sim;Haemin Jung;Minjun Park;Stanley Jungkyu Choi;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2023.10a
/
Pages.171-176
/
2023
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Evaluation of Large Language Models' Korean-Text to SQL Capability

대형 언어 모델의 한국어 Text-to-SQL 변환 능력 평가

Jooyoung Choi (LG AI Research) ;
Kyungkoo Min (LG AI Research) ;
Myoseop Sim (LG AI Research) ;
Haemin Jung (LG AI Research) ;
Minjun Park (LG AI Research) ;
Stanley Jungkyu Choi (LG AI Research)

Published : 2023.10.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

최근 등장한 대규모 데이터로 사전학습된 자연어 생성 모델들은 대화 능력 및 코드 생성 태스크등에서 인상적인 성능을 보여주고 있어, 본 논문에서는 대형 언어 모델 (LLM)의 한국어 질문을 SQL 쿼리 (Text-to-SQL) 변환하는 성능을 평가하고자 한다. 먼저, 영어 Text-to-SQL 벤치마크 데이터셋을 활용하여 영어 질의문을 한국어 질의문으로 번역하여 한국어 Text-to-SQL 데이터셋으로 만들었다. 대형 생성형 모델 (GPT-3 davinci, GPT-3 turbo) 의 few-shot 세팅에서 성능 평가를 진행하며, fine-tuning 없이도 대형 언어 모델들의 경쟁력있는 한국어 Text-to-SQL 변환 성능을 확인한다. 또한, 에러 분석을 수행하여 한국어 문장을 데이터베이스 쿼리문으로 변환하는 과정에서 발생하는 다양한 문제와 프롬프트 기법을 활용한 가능한 해결책을 제시한다.

Keywords

Text-to-SQL;
Prompt