DOI QR코드

DOI QR Code

생성 AI 모델을 위한 텍스트 프롬프트 추정 기반 한국화 재생성에 대한 연구

A Study on the Reproduction of Korean Painting through Text Prompt Estimation for Generative AI Models

  • 문성원 (한국전자통신연구원 콘텐츠연구본부) ;
  • 이지원 (한국전자통신연구원 콘텐츠연구본부) ;
  • 남도원 (한국전자통신연구원 콘텐츠연구본부)
  • Sung-Won Moon (Content Research Division, Electronics and Telecommunications Research Institute(ETRI)) ;
  • Jiwon Lee (Content Research Division, Electronics and Telecommunications Research Institute(ETRI)) ;
  • Dowon Nam (Content Research Division, Electronics and Telecommunications Research Institute(ETRI))
  • 발행 : 2023.11.02

초록

스테이블 디퓨전(Stable diffusion)과 같은 텍스트 프롬프트 입력 기반 이미지 생성 AI 기술의 발전으로 원하는 형태의 고품질 이미지를 누구나 손쉽게 생성가능할 것으로 기대하였으나 대부분의 경우 원하는 이미지를 얻기 위해서는 텍스트 프롬프트를 정교하게 조정해가며 많은 실패를 겪어야만 한다. 이러한 한계를 극복하기 위해 클립 인터로게이터(CLIP Interrogator)와 같은 유사 이미지를 재생성하기 위한 텍스트 프롬프트 추정 기술이 개발되었으며 몇몇 이미지에 대해 뛰어난 결과를 보였다. 본 논문에서는 이러한 텍스트 프롬프트 추정 기술의 활용이 한국화를 재생성할 수 있는지 실험을 통해 가능성을 확인하고 향후 한국화 재생성을 위한 연구 방향을 제안하고자 한다.

키워드

과제정보

본 연구는 문화체육관광부 및 한국콘텐츠진흥원의 2023년도 문화체육관광연구개발사업으로 수행되었음(과제명: 사용자들의 다양한 관심사 맞춤형 문화유산 스토리텔링 AI 기술 개발, 과제번호: RS-2023-00220195, 기여율: 100%)