DOI QR코드

DOI QR Code

조선시대 배경의 게임에서 Chat-GPT API를 사용한 NPC 대화체 표현 연구

A Study on Expression of NPC Colloquial Speech using Chat-GPT API in Games against Joseon Dynasty Settings

  • 이진석 (성결대학교 미디어소프트웨어학과) ;
  • 최인철 (성결대학교 미디어소프트웨어학과) ;
  • 김정이 (성결대학교 미디어소프트웨어학과)
  • Jin-Seok Lee (Dept of Media Software, Sungkyul University) ;
  • In-Chal Choi ;
  • Jung-Yi Kim
  • 투고 : 2024.04.30
  • 심사 : 2024.06.07
  • 발행 : 2024.06.30

초록

본 연구는 조선시대 게임의 몰입감을 향상시키기 위해 ChatGPT API를 활용한 조선시대 대화체 구현을 위해 진행되었다. 연구는 중인계급 플레이어와 다른 계급과의 대화에 중점을 둔다. 조선시대 배경의 드라마 대사를 학습시키는 방법과 대화체의 종결어미를 학습시키는 두 방법으로 연구를 진행하였다. 종결어미를 학습시키는 방법이 자체 평가 기준에서 더 높이 평가되었다. 이를 반영하여 프롬프트를 구성해서 조선시대 게임에서의 설정을 반영한 NPC 프롬프트를 구상하였고, 추가적으로 프롬프트 조합 방식을 활용하여 다양한 NPC의 프롬프트를 구성하는 방법을 제안하였다. 본 연구는 조선시대 게임 제작 시 NPC 대화체의 참고 자료로 활용될 수 있다.

This study was conducted to implement Joseon Dynasty conversational style using the ChatGPT API to enhance the immersion of games set in the Joseon era. The research focuses on interactions between middle-class players and other classes. Two methods were employed: learning the dialogues from historical dramas set in the Joseon Dynasty and learning the sentence endings typical of the period. The method of learning sentence endings was rated higher based on self-evaluation criteria. Reflecting this, prompts were constructed to represent NPC dialogues in the game settings of the Joseon era. Additionally, a method was proposed for creating various NPC prompts using prompt combination techniques. This study can serve as a reference for NPC dialogue creation in games set in the Joseon Dynasty.

키워드

Ⅰ. 서론

AI 기술의 발전과 일상생활 통합은 지속적으로 가속화되고 있다. 은행 어플리케이션의 챗봇, 작곡과 그림을 그리기 위해 AI를 활용하는 등 우리 생활에 많은 부분이 AI로 대체되어 가고 있다[1,2,3]. 게임 역시 인공지능을 NPC에 적용하여 유저와 즉각적으로 상호작용함으로써 게임의 현실감을 더욱 높일 수 있다.

조선시대 등 과거를 배경으로 하는 NPC의 경우 대화체가 현재와 상이할 것으로 기대되는데 현재 상용화되어 있는 게임들을 살펴보면 시대적 배경을 잘 반영하고 있지 않음을 발견할 수 있다. 관련 연구 자료를 검토해 보았을 때 이러한 연구결과나 당시의 대화체에 대해 상세하게 고증할 개발의 지침이 부재하였다.

조선시대의 대화체는 크게는 계급, 성별, 연령에 따라 대화체가 다르고, 작게는 친분, 학력, 직업에 의해서도 다르다[4]. 그러나 당시의 대화체에 대한 상세한 고증된 자료는 없으며, 2000년대 이후로 드라마나 다른 다양한 문화 콘텐츠는 언어 복원의 노력이 점점 적어지고 있다. 역으로 시대 언어를 사용하지 않고 동시대의 사용자들이 사용하는 현대 국어를 사용하는 것이 추세이다[5]. 이러한 사실을 통해 대화체의 차이에 대한 선입견이 형성되어 있는 것을 알 수 있다. 그리고 해당 문화 콘텐츠의 시대적 몰입감을 살려주고 있는 것으로 보인다. 그러므로 게임에서 시대적 현실감을 높이기 위해서는 이를 적절히 반영할 필요가 있다.

따라서 본 연구에서는 조선시대를 배경으로 한 게임에서 NPC의 시대적 배경과 계급에 맞는 적절한 대화체 구현을 연구하고자 한다.

연구 방법은 두 가지 방법으로 접근한다. 첫 번째로는 조선시대를 배경으로 하는 TV 드라마 사극의 대본집을 통해 해당 계급이 사용할 대화체의 예시를 학습시키는 방식이고, 두 번째는 중인계급과의 대화 시 사용될 계급별 대화체의 종결어미를 Fine-tunning하여 정하는 방식이다.

Ⅱ. 이론적 배경

1. 생성형 인공지능 모델

가. ChatGPT 생성형 인공지능 모델

ChatGPT는 OpenAI가 개발한 인공지능 모델로 트랜스포머 아키텍쳐를 기반으로 만들어진 모델이다. 대화를 이해하며 사용자와 자연스럽게 상호작용이 가능하다. 현재 ChatGPT는 여러 프롬프트 엔지니어링 기법을 통하여 추론 성능이 점차 발전하고 있다[6]. GPT의 특성에는 정확성, 오락성, 시스템 접근성이 있으며 본 연구에서는 본 연구의 사용 의도가 사용자에게 흥미를 유발할 수 있는 오락성이 나타난다는 특성을 적용할 수 있다[7].

나. Gemini 생성형 인공지능 모델

Gemini는 구글 딥마인드에서 개발한 인공지능 모델로 다양한 유형의 데이터를 바탕으로 학습하고 처리하는 멀티 모듈형 모델이다. AI의 주제가 점점 더 다양하게 확장되고 있는 만큼 구글의 Gemini는 다양한 데이터를 입력받을 수 있도록 지원한다. ultra, pro, nano의 총 3가지 버전이 있으며, 그 중 ultra 모델은 벤치마크 32개 중 30개에서 최고 기록을 달성하였다. 텍스트 추론 벤치마크에서 12개 중 10개, 이미지 9개 중 9개, 비디오 이해 벤치마크 중 6개 중 6개, 음성인식 벤치마크 5개 중 5개를 최초로 달성하였다[8].

2. 게임 NPC에 인공지능이 활용된 사례

가상현실, 게임 등에서 주변 환경과의 상호작용을 통해 사람과 비슷한 역할을 하는 인공지능을 개발하는 연구가 활발하게 진행되는 중이다[9].

인공지능 연동 NPC를 사용한 게임으로는 호주의 REPLICA STUDIO라는 개발회사에서 개발한 Smart NPCs for Unreal Engine은 언리얼 엔진 플랫폼용 AI를 NPC에 연동시켜 실시간으로 스마트 NPC와 대화를 나눌 수 있게 하였다. 현재 다양한 업데이트를 통하여 스마트 NPC들이 다양한 감정을 가지게 하였고 이러한 스마트 NPC들에 제공되는 데이터를 각자 다르게 하여 각각의 NPC들이 서로 다른 개성을 가지게 되었다.

그림 1. Replica Studio의 Smart NPCs for Unreal Engine

Fig. 1. Replica Studio's Smart NPCs for Unreal Engine

3. 조선시대의 대화체

기존에 우리가 접할 수 있는 콘텐츠에서 가장 큰 문제점은 바로 억양이다. 극 중 대사가 진중할 경우 고양된 언어를 사용하게 되는데 배우가 연기할 때 일상적이지 않은 조선 시대의 대화체를 구사하려니 배우 본인의 자연스러운 언어 능력이 나오지 않는 상황이 된다[10]. 실제 조선 시대의 대화체는 유교적인 사상에 따라 남녀노소의 구별이 뚜렷했으며, 그에 따라 사용되는 경어법도 달랐다. 양반을 상위계층, 중인과 상민을 중간계층 천민을 하위계층이라 할 때 주로 가장 상위 계급인 양반에게는 매우 공손한 대화체인 합쇼체를 사용하였고. 성별, 나이에 따라 해요체 혹은 하소서체를 사용하였다. 그러나 친분에 따라서 같은 계급 간에서도 해라체, 해체를 사용하기도 했다[5]. 자신의 계층과 하나의 계층이 차이 나는 경우 하게체를 사용하였고, 두 개의 계층이 차이 나는 경우 상대를 하대하는 해라체를 사용하였다. 이처럼 계급에 따라 대화체가 차이 나듯 성별과 연령을 고려하게 되면 경어법은 더욱 복잡한 구조를 갖는다[4].

아래의 그림 2는 선행연구 3을 바탕으로 계층 간 대화체 관계를 도식화한 것이다. 양반, 중인, 상민, 천민을 중인과 상민을 결합하여 중위계층으로 봄으로서 3계층으로 나누어 도식화하였다. 괄호 안에 적힌 대화체는 부가적으로 사용된 대화체를 사용 빈도순으로 적었다.

그림 2. 계층 간 사용되는 대화체 관계 도식화

Fig. 2. Hierarchy of Conversational Relationships

Ⅲ. 조선시대에 적합한 대화체 개발

1. 연구 범위 제한

본 연구에서 고려해야 할 조선 시대의 대화체는 크게는 계급, 성별, 연령. 작게는 친분, 학력, 직업에 따라 달라진다[11]. 조선 시대의 신분을 4계급, 연령을 3계층으로 나누고 성별이 2가지임을 고려하면 24가지 유형이 정의된다. 이때 고려해야 할 대화 유형은 무려 576가지가 된다. 이 모든 것을 반영한 설계가 되어야 했으나, 첫 번째 단계로 본 연구에서는 NPC의 대화체 결정 시 계급 차이를 중심으로 하고, 플레이어를 중인계급으로 설정하였다. 중인계급 플레이어의 상호작용을 중점적으로 4가지 대화체로 한정하여 양반계급은 플레이어에게 하게체를, 같은 중인계급은 하오체를, 상민과 천민계급은 합쇼체를 사용한다.

표 1. 본 연구에 적용된 GPT 학습 기준 질문

Table 1. evaluation criteria for trained GPT models

2. ChatGPT의 학습 결과 기준표

본 연구에서 ChatGPT에 학습을 시킨 결과가 우리가 고려하는 바에 맞게 되었는지를 검사하기 위한 다음과 같은 다섯 가지의 기준표를 설정하고 게임 개발 전공 학부생 4학년 5명과 교수 1인으로 구성된 연구원이 평가하고 차이가 있는 경우 토의를 통해 결정하였다.

표 2. 학습된 GPT 모델 평가 기준

Table 2. evaluation criteria for trained GPT models

위 다섯 가지 항목에 1점씩 부여하고 ChatGPT의 답변을 각 판단하여 점수를 적용해 각 총합 0~5점의 점수로 ChatGPT의 학습 결과를 확인하였다.

3. 본 프로젝트에 사용할 인공지능 프로그램 분석

본 프로젝트에 사용할 인공지능 언어 프로그램을 선택하기 위해 GPT와 Gemini를 각각 비교, 분석해 보았다. 우선 불친절한 자기소개를 각각의 프로그램에 적용해 보았다. 먼저 불친절한 어투로 자기소개를 해달라는 입력을 했을 때 Gemini의 경우 하나의 인격체로 느껴지는 답변도 아닐뿐더러 대화체가 자연스럽지 못하여 게임의 NPC에 적용하기에 적절하지 않았다. 이에 반하여 ChatGPT의 경우 바로 자연스러운 답변을 하였다. Gemini도 ChatGPT와 같이 자연스러운 답변을 받을 수는 있으나, 앞에 세세한 상황 설정을 해주면, 설정을 해주지 않았을 때보다는 자연스러운 결과를 얻을 수 있지만 ChatGPT에 비하여 여전히 어색하다. 특히 Gemini는 구글로 인한 번역 데이터 및 다양한 언어작업에서의 번역 능력을 보여주고 있다. 하지만 사용자와의 상호작용 소통에서는 ChatGPT 보다 낮은 효율을 보이고 있다.

따라서 두 개의 인공지능 모델을 비교해본 결과 ChatGPT가 문맥과 상황을 빠르게 이해하고 자연스럽게 대화를 할 수 있는 모델이며 또한 프로그램 연동 등에 있어 인공지능 모델 선발 주자라고 할 수 있는 ChatGPT가 접근성이 좋다고 판단이 되어 본 연구에서는 ChatGPT모델을 사용하기로 하였다[12].

4. GPT API를 사용한 조선시대 대화체 학습

가. 드라마 대본을 학습시키는 방법

본 연구에서는 드라마 <대장금>의 대본을 기반으로 천민계급의 대화체를 Fine-tunning 하였다. 프롬프트는 NPC의 이름이나 성별, 직업, 신분 등과 같은 인물에 대한 기본적인 정보와 일상설명, 소지품, 통행 목적과 같이 게임에 직접 연관된 내용과 대화의 예시로 구성하였다. 다음은 ChatGPT에게 드라마 대사를 학습시켜 받은 답변 결과물과 그에 대한 연구자들의 평가 결과이다.

표 3에 나타난 바와 같이 인물의 설명에 대해서는 잘 반영하고 있으나, 예시로 준 해요체를 사용하는 드라마 대사를 전혀 활용하지 않고 하오체로 답변을 하고 있다. 조선시대와 전혀 맞지 않는 대화라고는 할 수 없으나, 프롬프트가 성공적으로 적용됐다고 보기는 어렵다는 한계가 나타났다. 이 문제를 해결하기 위해서 대본을 하나 더 입력하여 학습량을 늘려본 결과 조금 더 개선되었다.

표 3. 드라마 대사를 학습한 GPT 답변의 평가 예시

Table 3. An evaluation example of GPT responses trained on drama dialogues

따라서 이 문제는 향후 학습 데이터의 분량을 충분하게 늘려 제공하면 해결할 수 있을 것으로 보인다.

나. 종결어미를 학습시키는 방법

프롬프트는 앞서 소개한 방법과 동일하게 인물에 대한 설명을 먼저 입력하고, 동일한 조건에서 대화체 예시를 종결어미 표로 대체 하였다. 중인 플레이어와 천민의 대화를 기준으로 하여 천민 NPC 역할인 GPT는 합쇼체를 사용하도록 종결어미를 설정하였다. 다음은 NPC GPT에게 합쇼체의 종결어미를 학습시켜 받은 답변이다.

표 4. 종결어미를 학습한 GPT 답변의 평가 예시

Table 4. An evaluation example of GPT responses trained on sentence terminations:

종결어미를 학습시키는 경우 GPT4 모델이 학습시킨 종결어미 표를 기준으로 잘 적용하여 문장을 생성하는 것을 볼 수 있다. -올시다 와 같은 경우 사용하는 자의 나이가 많아야 한다는 제한 조건이 있으나, 특정한 범위의 나이를 종결어미에서 제외하면 해결할 수 있다.

위의 평가 예시 표와 같이 하십시오체 종결어미를 학습한 답변 20문장을 연구원 5명이 자체적으로 세운 평가 기준대로 평가한 결과, 종결어미를 학습한 GPT의 답변은 5점 중 4.65점을 받았다.

5. 다양한 설정을 가진 NPC 생성 방안 제안

본 연구에서는 게임에서 다양한 NPC가 고유의 설정값을 가지고 자연스러운 대화로 플레이어와 상호작용하기 위해 종결어미와 더불어 사용될 프롬프트를 생성하는 방법을 제안한다.

먼저, 그림 3과 같이 상관관계가 없는 변수들을 조합하여 NPC의 1차 정보를 생성한다. 이후 상관관계가 있는 변수를 기준으로 2차 정보를 생성한다. 1차 정보 조합에서는 상관관계가 없는 변수로 직업을 설정하고 2차 프롬프트 조합에서는 그림 4와 같이 상관관계가 있는 직업을 기준으로 설정하여 소지 품목, NPC 일상, 통행 목적 등을 해당 직업에 맞게 선택할 수 있게 한다.

그림 3. 1차 프롬프트 변수 조합

Fig. 3. First-level Prompt Combinations

그림 4. 직업과 상관관계가 있는 변수 프롬프트 변수 조합

Fig. 4. Variable Prompt Combinations Related to Professions

다음과 같이 수정된 프롬프트를 적용하면 설정이 서로 충돌되지 않는 다양한 NPC 설정 프롬프트를 생성할 수 있다.

IⅤ. 결론

본 연구에서는 조선시대 배경 게임에서 NPC의 자연스러운 대화체 사용을 위한 연구를 진행하였다. 실제 조선시대의 대화체를 고증할 수는 없지만, 대중매체로 형성된 조선시대 대화체를 반영하여 연구를 진행하였다. ChatGPT에게 학습시킬 대상을 천민이 중인에게 사용하는 대화체로 제한하였고 두 가지 방법으로 진행하였다.

본 연구에서는 ChatGPT API를 사용하여 조선시대 대화체를 구현하기 위해 드라마 <대장금>의 대사를 학습하는 방법과 대화체의 종결어미를 학습시키는 방법을 제시하였다. 이를 평가하기 위해 자체 평가 기준을 세워 연구원 5명에게 평가했다. 이를 통해 드라마 대본을 학습한 답변보다 종결어미를 학습하는 방법이 더 적합한 방법임을 알아내었다. 자원의 한계를 고려하지 않고 더 많은 드라마 대사를 학습시켰을 때 더 향상된 답변을 얻을 수 있을 것으로 예상한다. 그러나 드라마 대본을 학습시키는 것은 작가의 상상력에 의존하므로 일관성이 떨어질 가능성이 있고, 프롬프트의 길이가 길어짐으로서 답변 속도의 저하라는 문제가 있다. 추가적으로 진행한 연구에서 프롬프트 조합식을 통해 각각의 프롬프트 핵심 정보를 조합하여 새로운 설정의 NPC를 간단하게 생성하는 방안을 제안하였다.

비록 본 연구가 한정된 범위에서 진행된 연구라는 한계점이 있지만, 조선시대 대화체를 구현하기 위한 NPC의 개발 방법을 제시하였음에 의의가 있다.

참고문헌

  1. Seong-Mu Ryu, Tae-Won Song, Min-Jeong Lee, Yoon-Ju Choi, Soon-Uk Seol, "Analysis of Generative AI Technology Trends Based on Patent Data", Journal of Korea Institute of Information, Electronics, and Communication Technology, Vol. 17, No. 1, p. 6, Feb 2024. DOI: http://doi.org/10.17661/jkiiect.2024.17.1.1
  2. Zhi-Qian Zhang, "Effect Influencing the Labor Market by Evolution of the ChatGPT as a Large-Scale Language Model", Journal of the Korea Academia-Industrial cooperation Society(JKAIS), Vol. 25, No. 4, pp. 227-235, Apr 2024. DOI: http://doi.org/10.5762/KAIS.2024.25.4.227
  3. Hye-In Na, "Exploring PEST Issues in ChatGPT News Articles for the Application to the National R&D Information Service", The Journal of KIIT, Vol.21, No. 10, pp. 171-184, Oct 2023. DOI: http://doi.org/10.14801/jkiit.2023.21.10.171
  4. Ji-Yong Kang, "A Study on the Grade and Use of the Korean Honorification System in the early 20th century", Ulsan National University Graduate School of Education, Korean Language Education, pp. 2-3, Aug 2007.
  5. Won-Soub Pyo, Yoon-Hee Park, "A Study on the Restoration of the Language of the Time for a Historical Drama", Korea Entertainment Industry Association, Journal of the Korea Entertainment Industry Association, Vol. 13, No. 2, pp. 134-136, Feb 2019. DOI: https://doi.org/10.21184/jkeia.2019.2.13.2.133
  6. Sang-Eon park, Joo-Young Kang, "Analysis of Prompt Engineering Methodologies and Research Status to Improve Inference Capability of ChatGPT and Other Large Language Models", Korea Intelligent Information Systems Society, Intelligent Information Research, Vol. 29, No. 4, pp. 294-302, Dec 2023. DOI: http://dx.doi.org/10.13088/jiis.2023.29.4.287
  7. Hyo-Jung Kim, "A Study on the Influence of ChatGPT Characteristics on Acceptance Intention: Focusing on the Moderating Effect of Teachers' Digital Technology", The Journal of the Digital Industry Information Society, Vol. 19, No. 2, pp. 3-7, Jun 2023. DOI: http://doi.org/10.17662/ksdim2023.19.2.135
  8. Gemini Team, Google, "Gemini: A Family of Highly CapableMultimodal Models", Daily papers, p. 2, Dec 2023. DOI: https://doi.org/10.48550/arXiv.2312.11805
  9. Se-Hyeon Jang, Jung-Gi Lee, Jun Lee, "Researchon Interactions of NPC based on LLM", Journal of Korea Game Society, Vol. 24, No. 1, pp. 100-101, Feb 2024. DOI:http://doi.org/10.7583/JKGS.2024.24.1.99
  10. Sun-Young Kim, Se-Gon Oh, "A Study on Problems of Lines in Broadcasting Plays -Focusing on TV Series-", The Journal of Image and Cultural Contents, Vol. 22, p. 106, Feb, 2021. DOI: https://doi.org/10.24174/jicc.2021.02.22.91
  11. Cheong Jing, "A study on the relative honorification of 「dok-seub-il-han-cheok-dok」", Korean Language and Literature Society, Vol. No. 153, pp. 5-34, Sep 2021. DOI: https://doi.org/10.37967/emh.2021.9.153.5
  12. Syeda-Nahida Akter, Zichun Yu, Aashiq Muhamed, ianyue Ou, Alex Bauerle, Angel-Alexander Cabrera, Krish Dholakia, Chenyan Xiong, Graham Neubig, "An In-depth Look at Gemini's Language Abilities", p. 17, Dec 2023 DOI: https://doi.org/10.48550/arXiv.2312.11444