• 제목/요약/키워드: 동영상 합성 네트워크

검색결과 9건 처리시간 0.027초

적대적 생성 신경망을 통한 얼굴 비디오 스타일 합성 연구 (Style Synthesis of Speech Videos Through Generative Adversarial Neural Networks)

  • 최희조;박구만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.465-472
    • /
    • 2022
  • 본 연구에서는 기존의 동영상 합성 네트워크에 스타일 합성 네트워크를 접목시켜 동영상에 대한 스타일 합성의 한계점을 극복하고자 한다. 본 논문의 네트워크에서는 동영상 합성을 위해 스타일갠 학습을 통한 스타일 합성과 동영상 합성 네트워크를 통해 스타일 합성된 비디오를 생성하기 위해 네트워크를 학습시킨다. 인물의 시선이나 표정 등이 안정적으로 전이되기 어려운 점을 개선하기 위해 3차원 얼굴 복원기술을 적용하여 3차원 얼굴 정보를 이용하여 머리의 포즈와 시선, 표정 등의 중요한 특징을 제어한다. 더불어, 헤드투헤드++ 네트워크의 역동성, 입 모양, 이미지, 시선 처리에 대한 판별기를 각각 학습시켜 개연성과 일관성이 더욱 유지되는 안정적인 스타일 합성 비디오를 생성할 수 있다. 페이스 포렌식 데이터셋과 메트로폴리탄 얼굴 데이터셋을 이용하여 대상 얼굴의 일관된 움직임을 유지하면서 대상 비디오로 변환하여, 자기 얼굴에 대한 3차원 얼굴 정보를 이용한 비디오 합성을 통해 자연스러운 데이터를 생성하여 성능을 증가시킴을 확인했다.

동영상 객체 기반의 양방향 멀티미디어 서버 시스템 설계 및 구현 (Development of Direction Multimedia Server System Based on Moving Picture Object.)

  • 김경훈;이민홍;유홍연;홍성훈;남지승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.959-962
    • /
    • 2003
  • 멀티미디어 서비스 수요의 증가는 네트워크 상에서 기존의 문자기반의 컨텐츠 제공 서비스의 수요를 이미 앞질렀으며 네트워크와 시스템 자원의 발전에 따라 사용자 요구는 그에 따라 더욱 폭 넓게 증가하고 있다. 우수한 품질의 동영상 데이터를 온라인 상에서 품질 저하 없이 서비스 받을 수 있는 것을 넘어 사용자는 컨텐츠에 파생되는 부가의 서비스를 요구하게 되었고 이는 기존의 텍스트 정보에 의한 양방향 서비스가 아닌 사용자의 요구에 따른 멀티미디어 컨텐츠 자체에 대한 서비스를 위한 정보시스템이 필요하게 되었음을 의미한다. 본 논문에서는 객체 단위의 동영상을 실시간으로 합성하여 이를 사용자에게 즉시 서비스하는 양방향 멀티미디어 서버 시스템의 설계와 구현에 대해 기술하였다. 구현된 시스템은 사용자에게 일방적인 데이터를 전송하는 기존의 시스템과 달리 적용 가능한 객체 단위 동영상을 합성 전송하고 자동 추출된 실시간 오브젝트를 다양한 배경화면과 함께 합성하여 서비스 할 수 있는 기능 구조를 가진다. 또한 멀티미디어 서버의 주요 목표를 반영하여 확장과 성능을 고려한 클러스터 On-Demand 서버를 구성하였으며 서버와 서비스 관리를 위한 모든 구성요소를 포함하여 실제 서비스가 가능한 완전한 미디어 시스템을 설계 구현하였다.

  • PDF

GAN을 이용한 동영상 스타일 생성 및 합성 네트워크 구축 (A Video Style Generation and Synthesis Network using GAN)

  • 최희조;박구만;김상준;이유진;상혜준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.727-730
    • /
    • 2021
  • 이미지와 비디오 합성 기술에 대한 수요가 늘어남에 따라, 인간의 손에만 의존하여 이미지나 비디오를 합성하는데에는 시간과 자원이 한정적이며, 전문적인 지식을 요한다. 이러한 문제를 해결하기 위해 최근에는 스타일 변환 네트워크를 통해 이미지를 변환하고, 믹싱하여 생성하는 알고리즘이 등장하고 있다. 이에 본 논문에서는 GAN을 이용한 스타일 변환 네트워크를 통한 자연스러운 스타일 믹싱에 대해 연구했다. 먼저 애니메이션 토이 스토리의 등장인물에 대한 데이터를 구축하고, 모델을 학습하고 두 개의 모델을 블렌딩하는 일련의 과정을 거쳐 모델을 준비한다. 그 다음에 블렌딩된 모델을 통해 타겟 이미지에 대하여 스타일 믹싱을 진행하며, 이 때 이미지 해상도와 projection 반복 값으로 스타일 변환 정도를 조절한다. 최종적으로 스타일 믹싱한 결과 이미지들을 바탕으로 하여 스타일 변형, 스타일 합성이 된 인물에 대한 동영상을 생성한다.

GAN 을 이용한 압축된 동영상 품질 향상 (GAN-based Quality Enhancement of Compressed Video)

  • 김용성;이유진;김범윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.191-192
    • /
    • 2022
  • 본 논문에서는 딥러닝의 주요 기법 중 하나인 GAN 을 활용하여 압축된 영상의 품질을 개선하는 방법을 제안한다. 제안하는 GAN 의 생성자는 U-Net 과 ResNet 을 기반으로 구성되었으며, 판별자는 합성곱층과 전연결층으로 구성하였다. 네트워크의 학습은 HEVC (High Efficiency Video Coding)의 테스트 모델인 HM16.25 를 사용하여 RA (Random Access) 구성하에 양자화 계수 37 로 압축된 영상을 입력으로 하여 수행되었다. 제안하는 네트워크의 성능 확인을 위해 학습 시와 동일한 조건으로 압축된 다른 영상을 입력으로 하여 실험하였다. 실험 결과 영상의 평균 PSNR 은 34.20dB 에서 34.24dB 로 0.04dB 의 품질 향상이 이루어진 것을 확인할 수 있었다.

  • PDF

동영상합성시스템을 이용한 개선된 외국인고용관리시스템(EPS) 구현 (The embodiment of the advanced EPS with the synthesis system of moving picture)

  • 김록환;정병수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권9호
    • /
    • pp.105-113
    • /
    • 2009
  • 본 논문은 외국인 110만명 시대에 양질의 외국인력을 도입하기 위하여 국가의 외국인력수급에 최적의 시스템으로 노동생산성을 높이면서, 사회비용을 감소시키는 개선된 외국인고용관리시스템(EPS) 구현에 목적이 있다. 외국인력에 대한 구직자 상세정보가 부족함으로 인하여 양질의 외국인근로자 채용에 어려움을 주고 있고, 외국인력 선발시 참고자료인 구직자명부의 신뢰성을 떨어뜨리고 있어 이를 해소하기 위하여 현행 시스템에 구직자정보동영상관리시스템을 구현할 필요가 있다. 이를 위하여 본 논문에서는 기존 시스템에 동영상 합성기능을 추가함에 있어 멀티미디어기술과 네트워크 전송 고압축코덱 데이터베이스 기술을 접목한 동영상 임베디드 시스템등을 도입하여, 기업의 수요에 부합하고 사업주가 필요로 하는 외국인근로자를 채용하는 진보된 외국인고용관리시스템에 대하여 제시하였다.

Java3D를 이용한 실영상 기반 분산가상환경 구축 (Development of Real-Image-Based Distributed Virtual Reality System)

  • 금승우;박종일;원유집;박용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.259-261
    • /
    • 2001
  • 본 논문에서는 네트워크를 통해 공유되는 가상공간에 참가자가 분신(아바타) 또는 실물 동영상의 형태로 자유로이 참가하여 가상세계를 현실감 있게 공유할 수 있는 시스템을 제안한다. Java3D를 이용하여 컴퓨터그래픽과 실영상을 실시간에 합성 렌더링함으로써 3차원 가상공간을 구현하고 있다. 분산환경에서의 실험을 통해 기술적 가능성을 제시한다.

  • PDF

관련 동영상 정보를 활용한 YouTube 가짜뉴스 탐지 기법 (Fake News Detection on YouTube Using Related Video Information)

  • 김준호;신용준;안현철
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.19-36
    • /
    • 2023
  • 정보통신기술의 발전으로 인해 누구나 쉽게 정보를 생산, 유포할 수 있게 되면서, 이를 악용하여 의도적으로 유포하는 거짓 정보인 가짜뉴스가 새로운 문제로 대두되기 시작하였다. 초기에 텍스트 방식으로 주로 전파되던 가짜뉴스는 점차 진화하여 이제는 멀티미디어 형식으로 퍼지고 있다. 유튜브는 2005년에 설립된 이후 세계 최고의 동영상 플랫폼으로 성장하면서 전 세계 사람들이 대부분 이용하고 있다. 하지만 유튜브는 가짜뉴스가 퍼지는 주요 창구가 되며 사회적인 문제를 일으키고 있다. 유튜브의 가짜뉴스를 탐지하기 위하여 다양한 학자들이 연구를 진행해 왔다. 가짜뉴스 탐지 연구에는 콘텐츠 기반의 접근과 배경정보 기반의 접근이 존재하는데 기존 가짜뉴스 연구와 유튜브의 가짜뉴스 탐지 연구를 살펴보면 콘텐츠 기반의 접근이 다수를 차지하고 있다. 본 연구에서는 콘텐츠 기반의 가짜뉴스 탐지가 아닌 배경정보 기반의 가짜뉴스 탐지기법을 제안하는데, 그 중에서도 유튜브에서 제공하는 관련 동영상 정보를 활용하여 가짜뉴스를 탐지하는 방법을 제안하고자 한다. 구체적으로 관련 동영상에서 얻은 정보와 원본 동영상에서 얻은 정보를 임베딩 기술인 Doc2vec을 이용하여 벡터화 한 후, 딥러닝 네트워크인 합성곱 신경망(CNN)을 통하여 가짜뉴스를 판별하고자 하였다. 실증분석 결과 제안 기법은 기존의 콘텐츠 기반으로 유튜브 가짜뉴스를 탐지하는 접근에 비해 보다 우수한 예측 성능을 보임을 확인하였다. 이러한 본 연구의 제안 기법은 파급력이 높은 유튜브 상에서 유포되는 가짜뉴스의 전파를 사전에 예방함으로써, 우리사회를 보다 안전하고 신뢰할 수 있도록 만드는데 기여할 수 있을 것으로 기대한다.

비디오 캡션 생성을 위한 의미 특징 학습과 선택적 주의집중 (Semantic Feature Learning and Selective Attention for Video Captioning)

  • 이수진;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.865-868
    • /
    • 2017
  • 일반적으로 비디오로부터 캡션을 생성하는 작업은 입력 비디오로부터 특징을 추출해내는 과정과 추출한 특징을 이용하여 캡션을 생성해내는 과정을 포함한다. 본 논문에서는 효과적인 비디오 캡션 생성을 위한 심층 신경망 모델과 그 학습 방법을 소개한다. 본 논문에서는 입력 비디오를 표현하는 시각 특징 외에, 비디오를 효과적으로 표현하는 동적 의미 특징과 정적 의미 특징을 입력 특징으로 이용한다. 본 논문에서 입력 비디오의 시각 특징들은 C3D, ResNet과 같은 합성곱 신경망을 이용하여 추출하지만, 의미 특징은 본 논문에서 제안하는 의미 특징 추출 네트워크를 활용하여 추출한다. 그리고 이러한 특징들을 기반으로 비디오 캡션을 효과적으로 생성하기 위하여 선택적 주의집중 캡션 생성 네트워크를 제안한다. Youtube 동영상으로부터 수집된 MSVD 데이터 집합을 이용한 다양한 실험을 통해, 본 논문에서 제안한 모델의 성능과 효과를 확인할 수 있었다.

계층적 깊이 영상 기반의 3DVC에서 윤곽 부분 화질 개선 기법 (Improved Contour Region Coding Method based on Scalable Depth Map for 3DVC)

  • 강진미;정혜정;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제15권4호
    • /
    • pp.492-500
    • /
    • 2012
  • 본 논문에서는 깊이 영상의 부호화 효율을 높이기 위한 기법을 제안한다. 깊이 영상의 부호화 과정에서 색상 영상과의 연관성을 이용하기 위해 SVC 부호화 구조를 기반으로 계층적으로 부호화한다. 깊이 영상을 향상 계층으로 부호화하여 기본 계층으로 부호화된 색상 영상의 움직임 정보를 이용한다. SVC 부호화 구조를 이용함으로써 다양한 네트워크에 적응적이면서 깊이 영상의 부호화 효율을 높일 수 있다. 또한, 깊이 영상은 다른 시점의 영상을 합성하는 데 이용되기 때문에 부호화 과정에서 객체의 윤곽 부분이 손상되었을 때 전체 영상의 화질을 크게 떨어뜨린다. 윤곽 부분의 이러한 특징을 이용하여 비 윤곽 부분인 평편한 부분과 구분한 후, 부호화 과정의 비트량을 조절하여 깊이 영상 전체의 화질을 개선하는 기술을 제안한다. 실험 결과 제안한 기법은 PSNR 값이 0.06-0.5dB 증가하고 비트량을 0.1-1.15% 감소하여 깊이 영상의 화질이 개선됨을 알 수 있었다.