• 제목/요약/키워드: 영상 텍스처

검색결과 188건 처리시간 0.026초

3차원 모델을 사용한 애니메이션 캐릭터 얼굴의 합성 (Synthesizing Faces of Animation Characters Using a 3D Model)

  • 장석우;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권8호
    • /
    • pp.31-40
    • /
    • 2012
  • 본 논문에서는 3차원의 얼굴모델을 생성하여 사용자의 얼굴을 애니메이션 캐릭터의 얼굴에 자연스럽게 합성하는 새로운 방법을 제안한다. 제안된 방법에서는 먼저 정면과 측면의 직교하는 2장의 2차원 얼굴영상을 입력 받아 얼굴의 주요 특징을 템플릿 스테이크를 이용하여 추출하고, 추출된 특징점에 맞게 일반적인 3차원 얼굴 모델을 변형시킴으로써 사용자의 얼굴 형태에 적합한 얼굴 모델을 생성한다. 그리고 2장의 얼굴 영상으로부터 얻어지는 텍스처 맵을 3차원의 얼굴 모델에 매핑하여 현실감 있는 개인화된 얼굴 모델을 생성한다. 그런 다음, 개인화된 3차원의 얼굴모델을 애니메이션 캐릭터 얼굴의 위치, 크기, 표정, 회전 정보를 반영하여 캐릭터 얼굴에 자연스럽게 합성함으로써 현실감 있는 사용자 맞춤형 애니메이션을 제작한다. 실험에서는 제안된 캐릭터 얼굴 합성 방법의 성능을 검증하기 위해서 수행한 여러 가지 실험결과를 보인다. 본 논문에서 제안된 방법은 애니메이션 영화, 게임, 캐릭터를 이용한 여러 가지 응용 분야에서 유용하게 활용될 것으로 기대된다.

HEVC 쿼드트리 부호화를 위한 율-왜곡 모델 (Rate-Distortion Model for HEVC Quadtree Coding)

  • 이범식;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.169-172
    • /
    • 2011
  • 최근 ISO/IEC의 MPEG과 ITU-T의 VCEG이 JCT-VC (Joint Collaborative Team for Video Coding)를 구성하여 HEVC (High Efficiency Video Coding) 차세대 비디오 압축 표준 제정을 위한 작업을 진행 중이다. 과거 압축률이 가장 좋은 것으로 알려진 H.264/AVC 보다 최대 50%까지 부호화 효율 향상을 목표로 하고 있다. HEVC는 H.264/AVC와는 상이한 부호화 구조를 채택하고 있고 작은 크기의 영상뿐만 아니라 크기가 큰 영상까지도 효율적으로 부호화할 수 있도록 설계되고 있다. 예측 및 변환 부호화 과정이 계층적 쿼드트리 구조를 가지며, 특히 변환 부호화는 작은 크기의 변환 블록으로부터 $32{\times}32$ 크기의 변환 블록까지 크게 확장되어 계층적 변환 구조를 이루며 부호화하도록 되어 있다. 본 논문에서는 기존 코덱과는 상이한 부호화 구조를 갖는 쿼드트리 부호화 기반 HEVC 코덱 표준을 위한 율-왜곡 (Rate-Distortion) 모델을 제안한다. 기존의 코덱에서는 부호화되는 기본 단위가 $16{\times}16$로 일정하고, 변환 및 양자화되는 블록의 크기 역시 $4{\times}4$또는 $8{\times}8$ 크기 단위로 그 블록의 크기가 작을 뿐만 아니라 고정된 크기를 사용한다. 따라서 단일 확률 모형을 사용하여 율-왜곡 모델을 만들었으며, 그 정확도 역시 비교적 정확한 결과를 얻었다. 그러나 HEVC에서는 계층적 가변 블록 크기를 갖는 기본 부호화, 예측 및 변환/양자화 기법을 사용하기 때문에 기존의 단일 모델로는 정확한 율-왜곡 모델을 만들어 내기 어렵다. 제안하는 방법은 HEVC의 기본 단위인 CU (Coding Unit)별로 독립적인 확률 모형을 사용하여 율-왜곡모델을 사용하는 것으로 CU의 크기가 가변적이고 CU 내의 텍스처 역시 크기에 따라 매우 다른 특성을 가지고 있기 때문에 단일 모델을 사용하는 것보다 매우 효율적인 것을 실험을 통하여 확인하였다.

  • PDF

Android Platform에서의 확장된 TIP 기술 (An Extended TIP Technique for Android Platform)

  • 김영자;이연식
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.57-63
    • /
    • 2012
  • TIP기술은 2차원 그림 또는 한 장의 사진으로부터 기하정보를 추출하여 3차원 입체 효과를 만들어 영상 내부를 내비게이션 할 수 있는 기술로써, 게임, 엔터테인먼트, 교육, 홍보 등 다양한 응용분야에서 활용 가능한 기술이다. 본 논문에서는 android platform상에서의 OpenGL ES Library를 이용하여 확장된 TIP기술 적용 및 구현 방법을 제안한다. 제안 방법은 전경객체의 추출이 어려운 상황을 감안하여 보다 사실적 장면 구성이 용이하도록 사용자의 선택에 의한 소실점을 이용하고, OpenGL ES Library 를 이용하여 3차원 배경 모델을 획득한 후 이미지를 텍스처 매핑하여 3차원 가상공간을 완성한 후 카메라의 시점변환을 통해 이미지 내부를 내비게이션이 가능하도록 한다. 실험영상은 android platform상의 device에서 촬영한 이미지를 사용하여 android 2.1 및 OpenGL ES 1.0기반으로 구축된 제안 기술로 android platform의 스마트 device에서 적은 비용과 시간으로 다양한 응용개발에 적용 가능하도록 구현하였다.

비디오 상의 얼굴에 대한 3차원 변형 시스템 (A System for 3D Face Manipulation in Video)

  • 박정식;서병국;박종일
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.440-451
    • /
    • 2019
  • 본 논문에서는 비디오 상의 얼굴을 사용자가 원하는 대로 3차원적으로 변형시켜볼 수 있도록 하는 시스템을 제안한다. 제안된 시스템의 3차원 얼굴 변형은 비디오 프레임의 얼굴 영역에 사용자가 변형을 가한 3차원 얼굴 모델을 덮어 씌우는 방식으로서, 기존의 애플리케이션이나 방법과 달리 비디오 상에서 3차원 변형을 실시간으로 가할 수 있도록 한다. 이를 위해 변형 가능한 3차원 얼굴 모델을 영상과 정합하고, 동시에 사용자가 가한 변형을 정합된 모델에 적용, 프레임 영상을 텍스처 매핑하여 렌더링한다. 이러한 과정은 많은 연산을 요하기 때문에 기능별로 소프트웨어 모듈을 나눠 각각의 쓰레드에서 병렬적으로 처리하도록 구현함으로써 실시간 처리가 가능하도록 하였다. 실험 결과를 통해 비디오 상의 얼굴의 눈 주변, 코, 턱, 볼 등 부위들에 대해, 기존 애플리케이션에 비해 자연스러운 변형을 실시간으로 가할 수 있음을 확인할 수 있다.

Pavement Crack Detection and Segmentation Based on Deep Neural Network

  • Nguyen, Huy Toan;Yu, Gwang Hyun;Na, Seung You;Kim, Jin Young;Seo, Kyung Sik
    • 한국정보기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.99-112
    • /
    • 2019
  • 도로 포장면의 크랙(crack)은 도로포장 구조의 열화를 입증하는 중요한 신호와 증상이다. 카메라 영상기반 도로포장 크랙 탐지는 강도 비균질성, 위상 복잡성, 낮은 대조도 및 노이즈성의 텍스처 배경 때문에 어려운 문제이다. 본 논문은 흑백영상에 대하여 깊은 신경망(DNN)에 기반하여 픽셀수준의 도로 크랙 탐지 및 분할 문제에 대해 다룬다. 변형된 U-net 네트워크와 고수준 특징 네트워크를 포함하는 새로운 DNN 구조를 제안한다. 본 연구의 중요 기여는 융합 층을 통해 공급되는 이들 네트워크의 결합 방법이다. 우리가 아는 한, 본 연구는 보도블럭 크랙 분할 및 탐지 문제를 결합을 소개한 최초의 논문이다. 크랙 탐지 및 분할의 시스템 성능은 새로운 구조를 사용하여 급격히 향상되었다. 제안된 시스템을 2개의 공개 데이터셋­크랙 포레스트 데이터셋(CFD)와 AigleRN 데이터셋­에 대하여 구현하고 평가하였다. 본 논문의 시스템은 여덟 가지의 최신 알고리즘과 같은 데이터셋으로 실험을 하였을 때, 가장 뛰어난 결과를 보여주었다.

깊이변화지도를 이용한 DIBR 공격의 강인성 블라인드 워터마킹 (Robust and Blind Watermarking for DIBR Using a Depth Variation Map)

  • 이용석;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.845-860
    • /
    • 2016
  • 본 논문에서는 시청자측에서 수신한 텍스처 영상과 그 깊이영상으로 임의의 시점 영상을 렌더링하여 시청하는 자유시점 2D 또는 3D 영상의 지적재산권 보호를 위한 디지털 워터마킹 기술을 제안한다. 이 경우 악의적이지는 않지만 시점이동공격이 필연적으로 발생되며, 여기에 삽입된 워터마크 정보를 제거하기 위한 악의적인 공격을 추가로 고려하여야 한다. 본 논문에서는 시점이동에 덜 민감한 부분을 찾기 위해 깊이영상을 이용하여 깊이변화지도를 생성하고, 원 영상을 3 레벨 2DDWT를 수행하여 각 레벨의 LH 부대역에서 깊이변화지도를 참조하여 워터마킹할 위치를 결정한다. 각 화소에 한 워터마크 비트를 삽입하는 방법은 선형 양자화기를 사용하는데, 양자화 스텝은 각 부대역의 에너지 값에 따라 결정한다. 워터마크 추출방법은 공격된 영상에서 원 워터마크 정보와의 상관도를 이용하여 가능한 후보들을 추출하고, 각 위치의 추출된 값들은 통계적인 방법으로 최종 추출된 워터마크로 결정한다. 제안한 방법을 다양한 영상으로 다양한 공격에 대해 실험하고 기존의 방법들과 비교하여 이 방법이 우수한 성능을 가졌음을 보인다.

피라미드 구조와 베이지안 접근법을 이용한 Markove Random Field의 효율적 모델링 (Efficient Methodology in Markov Random Field Modeling : Multiresolution Structure and Bayesian Approach in Parameter Estimation)

  • 정명희;홍의석
    • 대한원격탐사학회지
    • /
    • 제15권2호
    • /
    • pp.147-158
    • /
    • 1999
  • 지표면에 대한 다양한 정보를 제공해 주는 원격탐사기법은 수 십년 동안 우리의 환경을 관찰하고 이해하는데 중요한 역할을 해왔다. 이러한 원격탐사 자료를 이용하는데 다양한 디지털 영상처리기법이 도입되어 자료에서 관찰되는 여러 가지 특성을 모형화하고 처리하는데 매우 유용하게 활용되어져 왔다. 화소들 간의 공간적 관계를 고려하는 Markov Random Field (MRF) 모형은 텍스처 모델링이나 영상분할 및 분류와 같은 여러 분야에서 많이 이용되는 모형으로 이것에 기초한 다양한 알고리즘이 발표되었다. 보통 원격탐사 자료는 그 크기가 매우 크고 시간적 간격을 두고 변화를 관측해 가는 경우에는 분석해야할 자료의 양이 매우 방대하다. 이러한 자료를 처리하는데 걸리는 시간은 처리해야할 자료의 양과는 비선형적 관계에 있다. 본 논문에서는 MRF를 이용하여 원격탐사 자료를 처리할 때 걸리는 시간을 단축하기 위한 방법론이 연구되었다. 이를 위해 논리적 구조로 영상을 피라미드형태로 감소하는 크기로 분석하는 multiresolution 구조가 고려되었는데 이는 연상의 거시적 특징과 미세한 특징을 효율적으로 분석할 수 있는 방법을 제공해 준다. 영상의 크기가 커질수록 파라미터 추정 또한 복잡하고 많은 시간을 요하게 된다. 본 논문에서는 이를 위해 Bayesian 방법을 이용하여 원격탐사 영상과 같은 크기가 큰 영상의 MRF 모형의 파라미터를 효율적으로 추정할 수 있는 방법에 제안되어 있다.

$CAVE^{TM}$-like 시스템에서 시각 커뮤니케이션 지원을 위한 스테레오 비디오 아바타 (A Stereo Video Avatar for Supporting Visual Communication in a $CAVE^{TM}$-like System)

  • 이선민;박지영;김명희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권6호
    • /
    • pp.354-362
    • /
    • 2006
  • 본 논문에서는 CAVE$^{TM}$-like 시스템에서 시각 커뮤니케이션 지원을 위한 고화질 스테레오 비디오 아바타 생성 기법을 제안한다. CAVE$^{TM}$-like 시스템에서는 사용자를 둘러싸고 있는 스크린으로 투사되는 빛의 잦은 변화 때문에 비디오 아바타 생성에 필수적인 사용자 추출이 쉽지 않다. 본 연구에서는 가시광선 차단 필터를 부착한 흑백 카메라로 획득된 적외선 반사 영상을 이용함으로써 스크린 상 빛의 변화를 차단하여 강건하게 사용자를 추출할 수 있도록 하였다. 또한, 사람의 양안차 간격으로 배치한 두 대의 컬러 카메라를 사용하여 삼차원 기하 정보의 재구성 없이 고화질 비디오 아바타를 빠르게 생성하고 입체 디스플레이 하기 위한 양안용 사용자 영상을 획득하였다. 획득된 영상에서 배경을 제거하기 위하여 적외선 반사 영상으로 정의된 실루엣 마스크와의 피팅 알고리즘을 제안한다. 생성된 비디오 아바타 스테레오 영상은 가상공간 내 평면 상에 텍스처 매핑하여 프레임 순차 스테레오 방식를 이용하여 입체 디스플레이할 수 있도록 하였다. 제안된 방식은 기존의 3D 비디오 아바타보다 고화질의 결과를 빠르게 생성할 수 있으며, 2D 기반 방식에서 제공해주지 못하던 입체감을 제공해준다.

새로운 비디오 자막 영역 검출 기법 (A new approach for overlay text detection from complex video scene)

  • 김원준;김창익
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.544-553
    • /
    • 2008
  • 최근 영상 편집 기술의 발달과 더불어 시청자의 이해를 돕기 위해 인위적으로 자막을 삽입하는 경우가 늘고 있다. 인위적으로 삽입된 자막은 해당 장면의 내용이나 편집자의 의도를 잘 표현하고 있기 때문에 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에 유용하다. 기존의 자막 영역 추출 방법은 에지(edge), 색상(color), 텍스처(texture) 정보와 같은 하위 계층(low-level) 특징을 기반으로 하기 때문에 다양한 필체나 밝기 대비를 가진 자막이 동시에 나타나거나 복잡한 배경에 포함된 자막 영역의 경우 잘 검출하지 못한다. 이에 본 논문은 기존의 방법과는 전혀 다른 천이 영역 기반의 새로운 영상 내 자막 영역 검출 기법을 제안하고자 한다. 먼저, 영상 내 삽입된 글자 주변은 시청자에게 영상으로부터의 높이 감을 주기 위해 해당 글자와 다른 색으로 표현된다는 관찰 결과를 바탕으로 천이 지도를 생성한다. 생성된 천이 지도를 이용하여 후보 영역을 추출하고 상태 밀도 개념을 바탕으로 후보 영역 중에서 삽입된 자막 영역을 추출한다. 제안하는 알고리즘은 글자 색, 크기, 위치, 필체, 밝기 대비에 관계없이 적용이 가능하며, 다양한 언어에 관계없이 뛰어난 성능을 보인다. 또한, 프레임 간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

중첩 자유 영역과 배경 분석을 이용한 효율적인 라벨 배치 (Efficient Label Placement using Overlap-free Region and Background Analysis)

  • 이상원;정승도;최병욱
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.85-96
    • /
    • 2006
  • 본 논문은 2차원 형태의 가상 라벨을 시계 평면(view plane)상에 효율적으로 배치하기 위한 방법에 대해 다룬다. 제안하는 방식은 실시간 처리에 적합한 연산량을 가지면서, 기존의 자동 라벨 배치 알고리즘들이 완전하게 해결하지 못했던 국부 최소문제를 중첩 자유 영역을 이용해 극복하였다. 또한, 시계 평면에서 혼잡이 적은 영역에 라벨을 배치함으로써 배치된 라벨의 가독력을 향상 시켰다. 라벨의 배치에 있어서 배경 성분의 고려는 필수적이다. 하지만 기존의 논문들은 이러한 문제에 큰 관심을 기울이지 않았고, 자동 라벨 배치 알고리즘과 배경 분석 알고리즘은 개별적으로 연구가 진행되어왔다 본 논문은 가독력의 향상을 위해서 배경의 컬러와 텍스처 성분을 이용한 배경 분석 방식을 제안하였으며, 컬러 영상의 배경을 분석하여 자동 라벨배치 분야에 처음으로 적용하였다. 본 논문은 자동 라벨 배치 알고리즘과 배경 분석 알고리즘이 유기적으로 결합함으로써 이전의 논문에서 볼 수 없었던 배치 성능을 보여주며, 다양한 실험을 통해 이를 검증하였다.