• Title/Summary/Keyword: 다중시점영상

Search Result 74, Processing Time 0.026 seconds

Implementing Multiple-tile Extractor for Viewport-dependent 360 Video Streaming (사용자 시점 기반 360 도 영상 스트리밍을 위한 다중 타일 추출기 구현)

  • Jeong, Jong-Beom;Lee, Soonbin;Kim, Inae;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.53-56
    • /
    • 2020
  • 몰입감 있는 가상 현실 영상을 제공하기 위한 360 도 영상 부호화 및 전송 기술이 활발히 연구되고 있으나, 현재 가상현실 장비가 사용가능한 연산 능력 및 대역폭으로는 몰입감 있는 영상을 전송 및 재생하기에 한계가 있다. 따라서 본 논문은 고화질 360 도 사용자 시점 영상 제공을 위해 사용자 시점 타일을 추출하는 움직임 제한 타일 셋 기반 타일 추출기를 구현한다. 기존의 high-efficiency video coding (HEVC) 에서 구현되었던 타일 추출기와 달리 제안하는 추출기는 360 도 영상에 대한 비트스트림에서 여러 개의 타일을 추출한다. 이후 추출된 타일들은 전체 360 도 영상에 대한 저화질 비트스트림과 동시 전송되어 예상치 못한 사용자 시점 변경에 대응한다.

  • PDF

Adaptive Multiview Subpixel Interlacing for Autostereoscopic Display (무안경 입체 디스플레이를 위한 적응적 다시점 서브 픽셀 재배치 기법)

  • Hong, Jong-Ui;Shim, Hyun-Bo;Choi, Yoo-Joo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.450-451
    • /
    • 2015
  • 본 논문에서는 렌티큘러 렌즈를 이용한 무안경 입체 디스플레이 환경에서 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성의 변화에 따라 다중 시점에서 촬영한 영상으로부터 적응적으로 하나의 다시점 입체 합성 영상을 생성하는 방법을 제안한다. 제안 방법에서는 렌티큘러 렌즈의 기본 속성과 디스플레이 장치의 기본 속성값을 고려하여 다중 시점에서 획득된 영상의 서브픽셀들의 가중 평균을 구하고 이를 다시점 입체 합성 영상의 서브 픽셀의 값으로 사용하도록 하였다. 여러 다시점 영상을 이용한 실험을 통하여, 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성이 정확히 하드웨어적으로 일치 하지 않은 상황에서도 본 논문에서 제안하는 적응적 다시점 서브 픽셀 재배치 기법을 통하여 3D 입체감이 안정적으로 제공됨을 확인하였다.

  • PDF

Depth Map Correction Algorithm based on Segmentation in Multi-view Systems (다중시점 환경에서의 슈퍼픽셀 세그먼테이션 기반 깊이 영상 개선 알고리즘)

  • Jung, Woo-Kyung;Han, Jong-Ki
    • Journal of Broadcast Engineering
    • /
    • v.25 no.6
    • /
    • pp.954-964
    • /
    • 2020
  • In immersive media, the most important factor that provides immersion is depth information. Therefore, it is essential to obtain high quality depth information in order to produce high quality immersive media. In this paper we propose an algorithm to improve depth map, considering the segmentation of images and the relationship between multiple views in multi-view systems. The proposed algorithm uses a super-pixel segmentation technique to divide the depth map of the reference view into several segments, and project each segment into adjacent view. Subsequently, the depth map of the adjacent view is improved using plane estimation using the information of the projected segment, and then reversed to the reference view. This process is repeated for several adjacent views to improve the reference depth map by updating the values of the improved adjacent views and the initial depth map of the reference view. Through simulation, the proposed algorithm is shown to surpass the conventional algorithm subjectively and objectively.

Virtual Control of Optical Axis of Stereo TV (양안 입체 TV를 위한 가상 광축 조절)

  • 한상효;박종일;엄기문;안충현
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.1895-1898
    • /
    • 2003
  • 양안 입체 TV 에서는 3 차원 카메라의 시점거리에 따라 눈의 편안함과 3 차원 효과 사이에 대차 관계가 존재한다. 일반적으로 카메라 사이의 거리가 인간의 동공 사이의 거리인 65㎜ 일 때 최적의 효과를 낸다고 한다. 그러나 일반적인 방송용 화질의 상용 카메라는 렌즈 크기가 크기 때문에 이 거리를 맞춘 3 차원 카메라를 제작하기는 매우 어렵다. 그래서 보기 편한 양안입체 영상을 제공하기 위해서는 스테레오 카메라에서 얻은 영상을 조작하여 원하는 가상 시점에서의 영상으로 만들어 줄 필요가 있다. 본 논문에서는 먼저 적응적 다중 창틀 정합을 이용한 계층적 변이 추정을 사용하여 변이 지도를 추출하고, 이것을 이용하여 가상 시점에서의 영상을 합성했다. 다양한 스테레오 영상을 이용한 실험을 통해 제안된 기법의 타당성을 확인하였다.

  • PDF

Multi-View 3D Human Pose Estimation Based on Transformer (트랜스포머 기반의 다중 시점 3차원 인체자세추정)

  • Seoung Wook Choi;Jin Young Lee;Gye Young Kim
    • Smart Media Journal
    • /
    • v.12 no.11
    • /
    • pp.48-56
    • /
    • 2023
  • The technology of Three-dimensional human posture estimation is used in sports, motion recognition, and special effects of video media. Among various methods for this, multi-view 3D human pose estimation is essential for precise estimation even in complex real-world environments. But Existing models for multi-view 3D human posture estimation have the disadvantage of high order of time complexity as they use 3D feature maps. This paper proposes a method to extend an existing monocular viewpoint multi-frame model based on Transformer with lower time complexity to 3D human posture estimation for multi-viewpoints. To expand to multi-viewpoints our proposed method first generates an 8-dimensional joint coordinate that connects 2-dimensional joint coordinates for 17 joints at 4-vieiwpoints acquired using the 2-dimensional human posture detector, CPN(Cascaded Pyramid Network). This paper then converts them into 17×32 data with patch embedding, and enters the data into a transformer model, finally. Consequently, the MLP(Multi-Layer Perceptron) block that outputs the 3D-human posture simultaneously updates the 3D human posture estimation for 4-viewpoints at every iteration. Compared to Zheng[5]'s method the number of model parameters of the proposed method was 48.9%, MPJPE(Mean Per Joint Position Error) was reduced by 20.6 mm (43.8%) and the average learning time per epoch was more than 20 times faster.

  • PDF

Cluster-based MV-HEVC Coding Mode Decision for MPEG Immersive Video (MPEG 몰입형 비디오를 위한 클러스터 기반 MV-HEVC 부호화 모드 결정)

  • Han, Chang-Hee;Jeong, Jong-Beom;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.189-192
    • /
    • 2021
  • three degree of freedom (3DoF), three degree of freedom plus (3DoF+), six degree of freedom(6DoF) 등 몰입형 비디오의 높은 몰입감을 제공하기 위해 다중 비디오 영상을 효율적으로 처리하는 기법이 활발히 연구되고 있다. 이를 위해 원본의 몰입형 비디오가 입력되면 기본 시점 영상과 추가 시점 영상에서의 중복을 제거하고 기본 시점(basic view)에서는 보이지 않지만 추가 시점(additional view)에서는 보이는 영역을 추출하는 프루닝 과정이 이뤄지는 부호기에서의 부호화 모드 결정은 매우 중요하다. 본 논문은 test model for immersive video (TMIV)의 모드 중 하나인 MPEG immersive video (MIV) view mode 를 통해 만들어진 프루닝 (pruning) 그래프에서 선택된 시점들을 활용하여 뷰 간 중복성을 제거할 수 있는 효율적인 부호화 구조로 클러스터를 기반으로 병렬적으로 부호화하는 클러스터 기반 정렬 기법을 제안한다. 선택된 시점들을 인덱스 순서에 따라 부호화하는 기존 방법에 비해 제안하는 방법은 peak signal-to-noise ratio (Y-PSNR)에서 평균 3.9%의 BD-rate 절감을 보여주었다. 본 연구는 또한 더 객관적인 품질 측정을 위해 immersive video peak signal-to-noise ratio (IV-PSNR)에 의한 비교 결과도 함께 제공하며, 참조 순서에 맞게 정렬한 프루닝 기반 정렬 기법과의 비교도 함께 제공한다.

  • PDF

Multi-Depth Map Fusion Technique from Depth Camera and Multi-View Images (깊이정보 카메라 및 다시점 영상으로부터의 다중깊이맵 융합기법)

  • 엄기문;안충현;이수인;김강연;이관행
    • Journal of Broadcast Engineering
    • /
    • v.9 no.3
    • /
    • pp.185-195
    • /
    • 2004
  • This paper presents a multi-depth map fusion method for the 3D scene reconstruction. It fuses depth maps obtained from the stereo matching technique and the depth camera. Traditional stereo matching techniques that estimate disparities between two images often produce inaccurate depth map because of occlusion and homogeneous area. Depth map obtained from the depth camera is globally accurate but noisy and provide a limited depth range. In order to get better depth estimates than these two conventional techniques, we propose a depth map fusion method that fuses the multi-depth maps from stereo matching and the depth camera. We first obtain two depth maps generated from the stereo matching of 3-view images. Moreover, a depth map is obtained from the depth camera for the center-view image. After preprocessing each depth map, we select a depth value for each pixel among them. Simulation results showed a few improvements in some background legions by proposed fusion technique.

Fast Multiple Reference Frame Selection Method for Motion Estimation in H.264/AVC (H.264 동영상 표준 부호화 방식을 위한 고속 다중 참조 프레임 선택 기법)

  • Jeon, Yeong-Gyoo;Seo, Woo-Seok;Hong, Min-Cheol
    • Proceedings of the IEEK Conference
    • /
    • 2007.07a
    • /
    • pp.325-326
    • /
    • 2007
  • 본 논문에서는 H.264 동영상 표준 부호화 방식의 움직임 추정을 위한 고속 다중 참조 프레임 선택 기법에 대해 제안한다. 다중 참조 프레임에 대한 움직임 추정 수행 시 참조 프레임 수에 비례하여 계산량이 증가하는 반면에 동영상의 특성에 따라 부호화 효율의 이득없이 계산량만을 소비하는 경우가 발생된다. 따라서 본 논문에서는 각 참조 프레임에서의 움직임 추정에 대한 SAD값의 비교를 통해 다중 참조 프레임 움직임 추정의 종료 시점을 적응적으로 결정한다 실험 결과를 통해 5개의 참조프레임 사용을 기준으로 제안된 기법을 사용하였을 때 움직임 추정에 소요되는 시간은 가용한 모든 참조 프레임에 대해 움직임 추정을 수행하는 방식 대비 평균 50%정도 감소하였으며, PSNR 및 발생 비트율 측면에서 거의 동일한 성능을 유지함을 확인할 수 있었다.

  • PDF

View Interpolation Algorithm for Continuously Changing Viewpoints in the Multi-panorama Based Navigatio (다중 파노라마 영상기반 네비게이션에서 연속적인 시점이동을 위한 장면보간 방법)

  • 김대현;최종수
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.40 no.6
    • /
    • pp.141-148
    • /
    • 2003
  • This paper proposes a new algorithm that generates the smooth and realistic transition views from one viewpoint to another on the multi-panorama based navigation system. The proposed algorithm is composed of two steps. One is prewarping that aligns the viewing directions of two panoramic images, and the other is the bidirectional disparity morphing(BDM) that generates the intermediate scene from the aligned panoramic images. For prewarping, we compute the phase correlation between two images in order to obtain the information, such as translation, rotation, and scaling. Then we align the viewing directions of two original images using these information. Afterprewarping, we compute the block based disparity vector(DV) and smooth them using two occluding patterns. As we apply these DVs to the BDM, we can generate the elaborate intermediate scene. We make an experiment on the proposed algorithm with some real panoramic images and obtain good quality intermediate scenes.

High-resolution 3D Object Reconstruction using Multiple Cameras (다수의 카메라를 활용한 고해상도 3차원 객체 복원 시스템)

  • Hwang, Sung Soo;Yoo, Jisung;Kim, Hee-Dong;Kim, Sujung;Paeng, Kyunghyun;Kim, Seong Dae
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.50 no.10
    • /
    • pp.150-161
    • /
    • 2013
  • This paper presents a new system which produces high resolution 3D contents by capturing multiview images of an object using multiple cameras, and estimating geometric and texture information of the object from the captured images. Even though a variety of multiview image-based 3D reconstruction systems have been proposed, it was difficult to generate high resolution 3D contents because multiview image-based 3D reconstruction requires a large amount of memory and computation. In order to reduce computational complexity and memory size for 3D reconstruction, the proposed system predetermines the regions in input images where an object can exist to extract object boundaries fast. And for fast computation of a visual hull, the system represents silhouettes and 3D-2D projection/back-projection relations by chain codes and 1D homographies, respectively. The geometric data of the reconstructed object is compactly represented by a 3D segment-based data format which is called DoCube, and the 3D object is finally reconstructed after 3D mesh generation and texture mapping are performed. Experimental results show that the proposed system produces 3D object contents of $800{\times}800{\times}800$ resolution with a rate of 2.2 seconds per frame.