DOI QR코드

DOI QR Code

GAN을 이용한 동영상 스타일 생성 및 합성 네트워크 구축

A Video Style Generation and Synthesis Network using GAN

  • 최희조 (서울과학기술대학교 일반대학원 IT미디어공학과) ;
  • 박구만 (서울과학기술대학교 전자IT미디어공학과) ;
  • 김상준 (서울과학기술대학교 일반대학원 IT미디어공학과) ;
  • 이유진 (서울과학기술대학교 일반대학원 IT미디어공학과) ;
  • 상혜준 (서울과학기술대학교 전자IT미디어공학과)
  • Choi, Heejo (Dept. of IT Media Engineering, Seoul National University of Science and Tech.) ;
  • Park, Gooman (Dept. of Electronic and IT Media Engineering, Seoul National University of Science and Tech.) ;
  • Kim, Sang-Jun (Dept. of IT Media Engineering, Seoul National University of Science and Tech.) ;
  • Lee, Yu-Jin (Dept. of IT Media Engineering, Seoul National University of Science and Tech.) ;
  • Sang, Hye-Jun (Dept. of Electronic and IT Media Engineering, Seoul National University of Science and Tech.)
  • 발행 : 2021.11.04

초록

이미지와 비디오 합성 기술에 대한 수요가 늘어남에 따라, 인간의 손에만 의존하여 이미지나 비디오를 합성하는데에는 시간과 자원이 한정적이며, 전문적인 지식을 요한다. 이러한 문제를 해결하기 위해 최근에는 스타일 변환 네트워크를 통해 이미지를 변환하고, 믹싱하여 생성하는 알고리즘이 등장하고 있다. 이에 본 논문에서는 GAN을 이용한 스타일 변환 네트워크를 통한 자연스러운 스타일 믹싱에 대해 연구했다. 먼저 애니메이션 토이 스토리의 등장인물에 대한 데이터를 구축하고, 모델을 학습하고 두 개의 모델을 블렌딩하는 일련의 과정을 거쳐 모델을 준비한다. 그 다음에 블렌딩된 모델을 통해 타겟 이미지에 대하여 스타일 믹싱을 진행하며, 이 때 이미지 해상도와 projection 반복 값으로 스타일 변환 정도를 조절한다. 최종적으로 스타일 믹싱한 결과 이미지들을 바탕으로 하여 스타일 변형, 스타일 합성이 된 인물에 대한 동영상을 생성한다.

키워드