• 제목/요약/키워드: 3D video

검색결과 1,152건 처리시간 0.029초

3차원 기반의 모니터링 시스템과 클라우드 컴퓨팅을 이용한 파노라믹 비디오 서비스 (3D-Based Monitoring System and Cloud Computing for Panoramic Video Service)

  • 조용우;석주명;서덕영
    • 한국통신학회논문지
    • /
    • 제39B권9호
    • /
    • pp.590-597
    • /
    • 2014
  • 본 논문은 고품질 파노라마 영상 획득을 위하여 대상 공간을 여러 대의 카메라로 촬영 시, 촬영 정보를 제공하는 모니터링 시스템과 클라우드 컴퓨팅을 이용한 생성 과정 분산 처리에 관한 것이다. 파노라믹 비디오의 특성상 이웃 카메라 간 일정한 중복영역을 가져야 하지만 이로 인하여 동일한 촬영 대상에 대해 촬영 화각이 다르고, 카메라의 물리적인 크기로 인하여 촬영 중심점을 동일하게 맞추기 어려운 상황에서 2D 입력 영상기반으로 모니터링 하여 카메라를 보정하는 경우 시차원인으로 오보정이 발생하는 문제가 있다. 이를 해결하기 위하여 카메라별 촬영 화각에 따라 3차원으로 투영하여 모니터링 함으로써 카메라 오보정 문제를 최소화하고 획득 영상의 품질을 높이는 3차원 기반 모니터링 시스템을 제안한다. 또한 여러 영상을 하나의 영상으로 합성하는 파노라믹 비디오 생성알고리즘은 합성 정보추출과 합성, 두 부분으로 나눌 수 있는데 이를 클라우드와 클라이언트에 적절히 분산하여 고화질의 파노라믹 비디오를 효율적으로 서비스 하는 방법에 대해 제안한다.

x264와 GPU를 이용한 고속 양안식 3차원 방송 시스템 (Fast Stereoscopic 3D Broadcasting System using x264 and GPU)

  • 최정아;신인용;호요성
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.540-546
    • /
    • 2010
  • 사용자에게 보다 실감나는 입체감을 제공하는 양안식 3차원 영상을 위해서는 기존 2차원 영상의 두 배에 해당하는 데이터가 필요하므로 이를 고속으로 처리하는데 어려움이 따른다. 본 논문에서는 2차원 영상과 깊이 영상을 입력 영상으로 한 고속 양안식 3차원 방송 시스템을 제안한다. 제안하는 시스템은 전송해야 할 데이터의 양을 줄이기 위해 전송 전에 H.264/AVC 오픈 소스 고속 부호화기인 x264를 이용하여 부호화를 수행한다. 수신단에서는 수신한 비트스트림을GPU(Graphics Processing Unit)에 내장된 CUDA 비디오 복호기 API를 이용해 설계된 복호기로 고속으로 복호하고, GPU를 이용해 고속으로 가상시점의 영상을 생성하여 양안식 3차원 영상을 재현한다. 제안한 시스템을 이용하면 수신단의 환경에 따라 2차원 디스플레이와 3차원 디스플레이에서 모두 영상을 출력할 수 있다. 컴퓨터 모의 실험을 통해 제안한 시스템이 3차원 양안식 콘텐츠를 초당 최대 24 프레임까지 서비스할 수 있음을 확인했다.

편안한 3차원 비디오 시스템을 위한 영상 합성 오류 제거 (View Synthesis Error Removal for Comfortable 3D Video Systems)

  • 이천;호요성
    • 스마트미디어저널
    • /
    • 제1권3호
    • /
    • pp.36-42
    • /
    • 2012
  • 요즘 스마트폰과 스마트 TV와 같은 스마트 기기에 대한 관심이 높아짐에 따라 보다 다양한 기능을 포함하는 영상장치가 주목받고 있다. 특히, 스마트 TV는 3차원 영상을 서비스함에 따라 보다 고화질의 3차원 영상을 효율적으로 부호화하는 것이 중요하다. 최근 MPEG(moving picture experts group) 그룹에서는 다시점 영상과 깊이 영상을 동시에 압축하여 부호화하는 표준화 작업이 진행되고 있다. 제한된 수의 시점을 이용하여 편안한 3차원 입체 영상을 재현하기 위해서는, 충분한 수의 중간시점의 영상을 생성해야 한다. 깊이정보를 이용하여 3차원 워핑을 수행하면 가상시점의 영상을 합성할 수 있는데, 깊이값의 정확도에 따라 화질이 달라진다. 스테레오 정합 기술을 이용하여 깊이맵을 획득할 때 객체의 경계와 같은 깊이값 불연속 영역에서 깊이값 오류가 발생할 수 있다. 이러한 오류는 생성한 중간영상의 배경에 원치 않는 잡음을 생성한다. 본 논문에서는 편안한 3차원 비디오 재현을 위하여 깊이맵을 기반으로 중간시점의 영상을 생성할 때 발생하는 경계 잡음을 제거하는 방법을 제안한다. 중간시점의 영상을 합성할 때 비폐색 영역을 합성한 후 경계 잡음이 발생할 수 있는 영역을 구별한 다음, 잡음이 없는 참조영상으로 대체함으로써 경계 잡음을 제거할 수 있다. 실험 결과를 통해 배경 잡음이 사라진 자연스러운 합성영상을 생성했다.

  • PDF

Effective Hand Gesture Recognition by Key Frame Selection and 3D Neural Network

  • Hoang, Nguyen Ngoc;Lee, Guee-Sang;Kim, Soo-Hyung;Yang, Hyung-Jeong
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.23-29
    • /
    • 2020
  • This paper presents an approach for dynamic hand gesture recognition by using algorithm based on 3D Convolutional Neural Network (3D_CNN), which is later extended to 3D Residual Networks (3D_ResNet), and the neural network based key frame selection. Typically, 3D deep neural network is used to classify gestures from the input of image frames, randomly sampled from a video data. In this work, to improve the classification performance, we employ key frames which represent the overall video, as the input of the classification network. The key frames are extracted by SegNet instead of conventional clustering algorithms for video summarization (VSUMM) which require heavy computation. By using a deep neural network, key frame selection can be performed in a real-time system. Experiments are conducted using 3D convolutional kernels such as 3D_CNN, Inflated 3D_CNN (I3D) and 3D_ResNet for gesture classification. Our algorithm achieved up to 97.8% of classification accuracy on the Cambridge gesture dataset. The experimental results show that the proposed approach is efficient and outperforms existing methods.

3 차원 영상 시스템의 깊이영상 후처리 필터 성능 비교 (Performance Comparisons of Depth Map Post Processing for 3D Video System)

  • 이도훈;윤은지;오병태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.81-83
    • /
    • 2014
  • 본 논문에서는 3 차원 영상시스템의 성능향상을 위한 깊이영상의 여러 후처리 필터들의 성능을 비교 실험한다. 성능비교를 위해 현재 3D-ATM 에 쓰이고 있는 dilation 필터와, 경계값 보존에 탁월한 성능을 보이는 bilateral 필터, 그리고 깊이영상의 특성을 이용한 depth boundary reconstruction 필터를 선정하였다. 본 논문에서는 위 제시한 필터들의 특징에 대하여 소개하고, 이들 필터들이 3 차원 영상 시스템의 깊이영상에 적용되었을 때 어느정도 성능향상을 보이는지 비교 분석한다.

  • PDF

실감미디어 동영상정보를 이용한 실내 공간 정보 제공 시스템 구현 (The Implementation of Information Providing Method System for Indoor Area by using the Immersive Media's Video Information)

  • 이상윤;안희학
    • 디지털산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.157-166
    • /
    • 2016
  • This paper presents the interior space information using 6D-360 degree immersive media video information. And we implement the augmented reality, which includes a variety of information such as position information, movement information of the specific location in the interior space GPS signal does not reach the position information. Augmented reality containing the 6D-360 degree immersive media video information provides the position information and the three dimensional space image information to identify the exact location of a user in an interior space of a moving object as well as a fixed interior space. This paper constitutes a three dimensional image database based on the 6D-360 degree immersive media video information and provides augmented reality service. Therefore, to map the various information to 6D-360 degree immersive media video information, the user can check the plant in the same environment as the actual. It suggests the augmented reality service for the emergency escape and repair to the passengers and employees.

MPEG DASH 기반 service-compatible 3D 콘텐츠 대상 HTTP adaptive streaming 적용방안 (HTTP Adaptive Streaming Method for Service-compatible 3D Contents Based on MPEG DASH)

  • 박기준;이길복;이장원;김규헌
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.207-222
    • /
    • 2012
  • 최근 3D 입체영상에 대한 소비자들의 관심 증대로 가전 업체들은 3D TV, 3D Monitor등의 제품들을 출시하고 있고, 이에 따라 3D 콘텐츠 시장도 급격히 성장할 것으로 예상된다. 그러나 이러한 3D 콘텐츠를 서비스함에 있어서 보다 높은 대역폭이 요구되어지므로 QoS(Quality of Service)를 보장하지 않는 IP 기반 전송환경에서의 고화질 3D 스트리밍 서비스는 소비자에게 끊김 없는 영상서비스를 제공하는데 제약이 있다. 이러한 문제를 해결하기 위해서, IP 망 네트워크 환경을 고려하여 사용자들이 원하는 콘텐츠를 네트워크 환경에 따라 적절한 품질로 제공 할 수 있는 적응적 스트리밍 서비스 기술이 현재 국제 표준화 기구인 MPEG(Moving Picture experts Group)에서 DASH(Dynamic Adaptive Streaming over HTTP)라는 이름으로 표준화가 진행 중에 있다. 그러나 DASH에서는 독립된 좌, 우 영상이 단일 segment안에 2개의 Elementary Stream(ES)으로 구성되어 있는 service- compatible 기반의 스테레오스코픽 콘텐츠에 대한 명확한 scheme이 나타나지 않는다. 따라서 본 논문에서는 DASH를 이용한 service-compatible 기반의 효율적인 적응적 3D 스트리밍 서비스 제공 방안을 제안한다. DASH를 이용한 3D 서비스는 사용자들에게 IP 망을 통한 다양한 품질의 3D 콘텐츠를 제공함으로써 끊김 없는 3D 스트리밍 서비스가 가능하고, 또한 하나의 3D 콘텐츠로 다양한 디바이스에 적용 가능하다는 이점이 있다.

적대적 생성 신경망을 통한 얼굴 비디오 스타일 합성 연구 (Style Synthesis of Speech Videos Through Generative Adversarial Neural Networks)

  • 최희조;박구만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.465-472
    • /
    • 2022
  • 본 연구에서는 기존의 동영상 합성 네트워크에 스타일 합성 네트워크를 접목시켜 동영상에 대한 스타일 합성의 한계점을 극복하고자 한다. 본 논문의 네트워크에서는 동영상 합성을 위해 스타일갠 학습을 통한 스타일 합성과 동영상 합성 네트워크를 통해 스타일 합성된 비디오를 생성하기 위해 네트워크를 학습시킨다. 인물의 시선이나 표정 등이 안정적으로 전이되기 어려운 점을 개선하기 위해 3차원 얼굴 복원기술을 적용하여 3차원 얼굴 정보를 이용하여 머리의 포즈와 시선, 표정 등의 중요한 특징을 제어한다. 더불어, 헤드투헤드++ 네트워크의 역동성, 입 모양, 이미지, 시선 처리에 대한 판별기를 각각 학습시켜 개연성과 일관성이 더욱 유지되는 안정적인 스타일 합성 비디오를 생성할 수 있다. 페이스 포렌식 데이터셋과 메트로폴리탄 얼굴 데이터셋을 이용하여 대상 얼굴의 일관된 움직임을 유지하면서 대상 비디오로 변환하여, 자기 얼굴에 대한 3차원 얼굴 정보를 이용한 비디오 합성을 통해 자연스러운 데이터를 생성하여 성능을 증가시킴을 확인했다.

e-AG를 위한 시공간적 계위를 이용한 3차원 비디오 압축 (3D video coding for e-AG using spatio-temporal scalability)

  • 오세찬;이영호;우운택
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.199-202
    • /
    • 2003
  • In this paper, we propose a new 3D coding method for heterogeneous systems over enhanced Access Grid (e-AG) with 3D display using spatio-temporal scalability. The proposed encoder produces four bit-streams: one base layer and enhancement layer l, 2 and 3. The base layer represents a video sequence for left eye with lower spatial resolution. An enhancement layer l provides additional bit-stream needed for reproduction of frames produced in base layer with full resolution. Similarly, the enhancement layer 2 represents a video sequence for right eye with lower spatial resolution and an enhancement layer 3 provides additional bit-stream needed for reproduction of its reference pictures with full resolution. In this system, temporal resolution reduction is obtained by dropping B-frames in the receiver according to network condition. The receiver system can select the spatial and temporal resolution of video sequence with its display condition by properly combining bit-streams.

  • PDF

프레임 분할과 3D 웨이블릿 변환을 이용한 비디오 워터마킹 (Digital Video Watermarking Using Frame Division And 3D Wavelet Transform)

  • 김광일;최기철;김종원;최종욱
    • 정보보호학회논문지
    • /
    • 제18권3호
    • /
    • pp.155-162
    • /
    • 2008
  • 본 논문에서는 동영상 콘텐츠의 저작권 보호를 위해 3D 웨이블릿 변환과 대역확산방법(direct spread spectrum)을 이용한 비디오 워터마킹 알고리즘을 제안하였다. 제안한 방법은 동기 워터마크를 삽입한 다음 사용자 정보를 갖는 워터마크를 삽입하게 된다. 입력된 프레임을 분할하고, 다시 홀수행과 짝수행으로 정렬하여 각각 3D 웨이블릿 변환을 수행한 다음 대역확산 방법으로 워터마크를 삽입한다. 기존의 3D 웨이블릿을 이용한 비디오 워터마킹 알고리즘과는 달리 제안한 방법은 blind 방식으로써 원본 영상 없이 워터마크 검출이 가능하다. 실험결과 PSNR은 평균 40 dB 이상으로써 높은 비가시성을 만족하는 동시에 프레임 절삭, 잡음 첨가, 압축 등의 공격에서도 10% 이하의 BER을 기록하여 공격에 강인한 것으로 확인되었다.