• Title/Summary/Keyword: 비디오 합성

Search Result 172, Processing Time 0.04 seconds

Construction of facial database for a facial expression-inner states correlation model (표정-내적상태 상관모형을 위한 얼굴 DB 구축)

  • 반세범;한재현;정찬섭
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1997.11a
    • /
    • pp.215-219
    • /
    • 1997
  • 내적 감성상태와 표정을 연결하는 상관모형을 개발하기 위\ulcorner 기초자료로서 광범위한 얼굴표정자료를 수집하였다. 다양한 얼굴유형의 표정자료를 DB화하기 위해서는 궁극적으로 50명 이상의 인물표정 자료수집이 필요하다고 보고, 우선 영화배우 10면분의 표정자료를 수집하였다. 이를 위해 표정연기가 자연스럽다고 평가된 영화배우 10명을 선정하고, 이들이 출연한 50여편의 영화비디오에서 표정자료를 수집하였다. 한사람의 인물당 50개의 표정을 한세트로 하여 총 10명분 500가지의 표정자료수집을 완료하였다. 한사람의 인물당 50개의 표정을 한 세트로 하여 총 10명분 500가지의 표정자료수집을 완료하였다. 각각의 표정은 시작-상승-절정-하강-종료의 연속 5단계를 비율적으로 표집하여 동적정보를 포함하고 있다. 이들 자료들은 등자인물의 출연맥락이나 상황별로 분류하여 표정관련 맥락단서를 기록하였고, 후속연구를 통해 각 표정에 대응되는 내적상태를 기록할 수 있도록 DB화 하였다. 이와같이 구조화된 자료들은 표정인식과 합성의 입출력모형을 위한 기초자료로 활용될 뿐 아니라, 한국인의 얼굴 프로토타입 DB구축 및 향후 표정관련 연구의 타당성을 검증할 수 있는 Benchmarking 정보를 제공할 수 있다.

  • PDF

Analysis of Depth Map Resolution for Coding Performance in 3D Video System (깊이영상 해상도 조절에 따른 3 차원 비디오 부호화 성능 분석)

  • Lee, Do Hoon;Yang, Yun mo;Oh, Byung Tae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.452-454
    • /
    • 2015
  • This paper provides the coding performance comparisons of depth map resolution in 3D video system. In multiview plus depth map system, depth map is used for synthesis view rendering, and affects to synthesis views quality. In the paper, we show the experimental results as depth map resolution in 3D video system, and show performance variation as dilation filter.

  • PDF

A Study on the Development of Super-Impose ID System (Super-Impose 개인식별 영상시스템 개발 및 감정연구)

  • 송현교;이진행;이양원;강민구
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1998.05a
    • /
    • pp.216-221
    • /
    • 1998
  • 슈퍼임포즈는 개인식별 방법으로 신원 미상의 두개골의 발견 시, 두개골의 사진과 용의자 생전 사진의 동일 비율로 확대, 축소 후 두 영상을 중첩하므로서 동일인 여부를 비교, 판별하는 기법이다. 삼풍백화점 붕괴사고와 Guam KAL기 추락사고와 같이 대형사건에서의 개인식별에 매우 중요한 문제이다. 본 연구는 비디오 카메라로 입력한 두개골 영상과 스캐너로 입력한 생전 사진의 중첩을 위한 H/W 시스템의 구축과 영상처리 기법을 응용한 응용 프로그램을 개발하였다 슈퍼임포즈의 영상처리 기법으로는 두개골 및 생전 사진의 윤곽선 추출, 중첩점 조정, 상,하,좌,우 각도조정, 윤곽선보정, Hue 조정, 히스토그램 조정 등 다양한 영상처리 기법을 응용하였다. 또한, 이들 영상처리기법은 법의학 체제에 입각한 슈퍼임포즈 영상합성이 개인식별 감정시 필요한 최적의 영상 비교가 가능하도록 DB 시스템 구축과 분석시스템을 개발하였다. 그리고, 실제 감정시 본 영상시스템으로 감정해 본 결과로 보다 정확하고 실시간으로 감정이 가능하다. 본 슈퍼 임포즈 영상시스템은 슈퍼 임포즈 영상자료의 처리와 축적 기술의 발전으로, 두개골 영상과 생전 사진을 이용한 생전의 3차원 실 영상의 복원연구가 가능하리라 사료된다.

  • PDF

Word-balloon effects on Video (비디오에 대한 말풍선 효과 합성)

  • Lee, Sun-Young;Lee, In-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.332-334
    • /
    • 2012
  • 최근 영화나 드라마 같은 미디어 데어터가 폭발적으로 증가하면서, 다양한 언어로 번역된 자막 데이터도 증가하고 있다. 이러한 자막은 대부분 화면 하단이나 우측에 위치가 고정되어 나타내는 방식을 취하고 있다. 그러나 이 방식에는 몇 가지 한계점을 가지고 있다. 자막과 등장인물의 얼굴이 거리가 먼 경우, 시청자의 시선이 분산되어 영상에 집중하기 어렵다는 점과 청각장애를 가진 사람의 경우 자막만으로는 누가 말하고 있는 대사인지 혼동이 온다는 점이다. 본 논문에서는 만화에서 대사를 전달하기 위해 사용하던 말풍선을 동영상의 자막을 나타내는데 사용하는 새로운 자막 시스템을 제안한다. 말풍선을 사용하면 말꼬리로 화자의 위치를 가리키고, 시청자의 시선을 화자의 얼굴 근처에 집중시킴으로써 기존 자막이 갖는 한계점을 개선시킬 수 있다. 본 연구의 결과물을 검증하기 위해 사용자 평가를 실시했고, 기존의 자막 방식에 비해 시선의 안정성과 흥미성, 정확도에서 더 낫다는 결과를 얻을 수 있었다.

A Special MPEG-4 Authoring Tool for PDA (PDA환경에서의 MPEG-4 컨텐츠 저작도구)

  • 이송록;임영순;김상욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.517-519
    • /
    • 2004
  • MPEG-4는 이미지, 비디오. 오디오와 다양한 기하객체 및 텍스트객체 등 설러 가지 멀티미디어 데이터를 각 객체 단위로 합성하여 멀티미디어 컨텐츠를 구성함으로써 멀티미디어 데이터에 대한 재사용성과 효율성을 높이며, 사용자와의 상호작용이 가능한 시청각 장면을 생성하고 전송을 가능하게 한다. 유비쿼터스 컴퓨팅에 대한 연구가 개발하게 전개되고 있는 이때, PC에서뿐만 아니라 언제 어디서나 가능한 모바일 환경에서 다양한 사용자 인터랙션에 중점을 두고 카드메일, 간단 게임 저작 등을 가능하게 함으로써 poA환경에서 전문적인 저작도구를 개발하는 것이 필요하다. 본 논문은 poA환경에서 기하객체와 텍스트, 이미지 등의 객체들을 이용하여 MPEG-4 컨텐츠 저작을 위한 씬 트리를 생성하고 이에 대한 인코딩을 통하여 BIFS 파일 포맷을 형성하고 멀티플렉서를 통하여 MPEG-4 파일을 생성함으로써 PDA환경에서 직접적이고도 시각적인 저작이 가능한 MPEG-4 건텐츠 저작시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

Weight-based Motion Vector Composition using Activity Information and Overlapped Area (움직임 정보 및 중첩 영역을 이용한 가중치 기반의 움직임 벡터 합성 기법)

  • Kim, Hyun-Hee;Kim, Sung-Min;Lee, Seung-Won;Jung, Ki-Dong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.1573-1576
    • /
    • 2004
  • 멀티미디어 압축 및 이동 통신 기술의 발전으로 다양한 형태의 멀티미디어 서비스가 이슈화되고 있다. 비디오를 전송하기 위해서는 많은 대역폭을 필요로 하지만, 모든 네트워크가 높은 수준의 대역 및 처리 능력을 가지는 것은 아니다. 이질적인 네트워크간의 멀티미디어를 서비스하기 위해서는 네트워크 상황 또는 수신자의 처리 능력에 맞도록 재 부호화해야 하지만 그 처리비용이 높다. 트랜스코딩 기법 중에서 시간당 요구된 프레임의 개수를 조절하면 제거된 프레임의 움직임 벡터를 재 사용하여 비트율을 감소시킬 수 있다. 본 논문에서는 기존의 기법보다 향상된 움직임과 중첩 영역의 정보를 적용한 WBVC(Weight-Based Vector Composition) 기법을 제안한다. 실험을 통한 기존의 기법과의 비교 분석 결과, 비슷한 계산 복잡도에서 제안한 WBVC 기법이 높은 성능을 보였다.

  • PDF

Multi-View Wyner-Ziv Video Coding Based on Spatio-temporal Adaptive Estimation (시공간 적응적인 예측에 기초한 다시점 위너-지브 비디오 부호화 기법)

  • Lee, Beom-yong;Kim, Jin-soo
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.6
    • /
    • pp.9-18
    • /
    • 2016
  • This paper proposes a multi-view Wyner-Ziv Video coding scheme based on spatio-temporal adaptive estimation. The proposed algorithm is designed to search for a better estimated block with joint bi-directional motion estimation by introducing weights between temporal and spatial directions, and by classifying effectively the region of interest blocks, which is based on the edge detection and the synthesis, and by selecting the reference estimation block from the effective motion vector analysis. The proposed algorithm exploits the information of a single frame viewpoint and adjacent frame viewpoints, simultaneously and then generates adaptively side information in a variety of closure, and reflection regions to have a better performance. Through several simulations with multi-view video sequences, it is shown that the proposed algorithm performs visual quality improvement as well as bit-rate reduction, compared to the conventional methods.

Flame Detection Using Haar Wavelet and Moving Average in Infrared Video (적외선 비디오에서 Haar 웨이블릿과 이동평균을 이용한 화염검출)

  • Kim, Dong-Keun
    • The KIPS Transactions:PartB
    • /
    • v.16B no.5
    • /
    • pp.367-376
    • /
    • 2009
  • In this paper, we propose a flame detection method using Haar wavelet and moving averages in outdoor infrared video sequences. Our proposed method is composed of three steps which are Haar wavelet decomposition, flame candidates detection, and their tracking and flame classification. In Haar wavelet decomposition, each frame is decomposed into 4 sub- images(LL, LH, HL, HH), and also computed high frequency energy components using LH, HL, and HH. In flame candidates detection, we compute a binary image by thresholding in LL sub-image and apply morphology operations to the binary image to remove noises. After finding initial boundaries, final candidate regions are extracted using expanding initial boundary regions to their neighborhoods. In tracking and flame classification, features of region size and high frequency energy are calculated from candidate regions and tracked using queues, and we classify whether the tracked regions are flames by temporal changes of moving averages.

Efficient Motion Estimation Algorithm and Circuit Architecture for H.264 Video CODEC (H.264 비디오 코덱을 위한 효율적인 움직임 추정 알고리즘과 회로 구조)

  • Lee, Seon-Young;Cho, Kyeong-Soon
    • Journal of the Institute of Electronics Engineers of Korea SD
    • /
    • v.47 no.12
    • /
    • pp.48-54
    • /
    • 2010
  • This paper presents a high-performance architecture of integer-pel motion estimation circuit for H.264 video CODEC. Full search algorithm guarantees the best results by examining all candidate blocks. However, the full search algorithm requires a huge amount of computation and data. Many fast search algorithms have been proposed to reduce the computational efforts. The disadvantage of these algorithms is that data access from or to memory is very irregular and data reuse is difficult. In this paper, we propose an efficient integer-pixel motion estimation algorithm and the circuit architecture to improve the processing speed and reduce the external memory bandwidth. The proposed circuit supports seven kinds of variable block sizes and generates 41 motion vectors. We described the proposed high-performance motion estimation circuit at R1L and verified its operation on FPGA board. The circuit synthesized by using l30nm CMOS standard cell library processes 139.8 1080HD ($1,920{\times}1,088$) image frames per second and supports up to H.264 level 5.1.

Reliable Camera Pose Estimation from a Single Frame with Applications for Virtual Object Insertion (가상 객체 합성을 위한 단일 프레임에서의 안정된 카메라 자세 추정)

  • Park, Jong-Seung;Lee, Bum-Jong
    • The KIPS Transactions:PartB
    • /
    • v.13B no.5 s.108
    • /
    • pp.499-506
    • /
    • 2006
  • This Paper describes a fast and stable camera pose estimation method for real-time augmented reality systems. From the feature tracking results of a marker on a single frame, we estimate the camera rotation matrix and the translation vector. For the camera pose estimation, we use the shape factorization method based on the scaled orthographic Projection model. In the scaled orthographic factorization method, all feature points of an object are assumed roughly at the same distance from the camera, which means the selected reference point and the object shape affect the accuracy of the estimation. This paper proposes a flexible and stable selection method for the reference point. Based on the proposed method, we implemented a video augmentation system that inserts virtual 3D objects into the input video frames. Experimental results showed that the proposed camera pose estimation method is fast and robust relative to the previous methods and it is applicable to various augmented reality applications.