• 제목/요약/키워드: multi-View

검색결과 1,262건 처리시간 0.022초

구조적인 유사성에 기반한 다중 뷰 비디오의 효율적인 키프레임 추출 (Structural similarity based efficient keyframes extraction from multi-view videos)

  • 후세인 탄베르;칸 살만;무함마드 칸;이미영;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.7-14
    • /
    • 2018
  • 다중 뷰 비디오로부터 두드러진 정보 추출은 인터뷰, 인트라 뷰간 상관관계와 계산 비용 때문에 매우 어려운 영역입니다. 매우 높은 계산 복잡성을 지닌 멀티 뷰 비디오에서 키프레임을 추출하기 위해 개발된 몇 가지 기술이 있습니다. 이 논문에서, 우리는 내부에 존재하는 엔트로피와 복잡한 정보를 사용하여 멀티 뷰 비디오의 키프레임 추출 접근 방식을 제시합니다. 첫 번째 단계에서는 프레임 사이의 SSIM값을 기반으로 각 보기에서 전체 비디오의 대표 샷을 추출합니다. 두 번째 단계에서는 서로 다른 보기의 모든 샷 프레임에 대한 엔트로피와 복잡성 점수가 계산됩니다. 마지막으로 엔트로피와 복잡성 점수가 가장 높은 프레임은 키 프레임으로 간주됩니다. 제안된 시스템은 사용 가능한 Office벤치마크 데이터 세에서 주관적으로 평가되며, 정확성과 시간 복잡성의 측면에서 결과는 편리합니다.

실감영상 구현을 위한 다면영상 정합보정 및 화면구성에 대한 연구 (A Study on Registration Correction and Layout for Multi-view Videos Implementation)

  • 문대혁
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.531-541
    • /
    • 2017
  • 다면영상을 이용한 실감영상은 스크린이나 다면으로 구성된 디스플레이에서 펼쳐지는 내용이 사실적으로 보여지게 제작되어지고 있다. 이러한 다면영상은 전시를 위한 기획영상에서 주로 사용되었으나 Screen X와 같은 시스템을 통해 영화와 같은 스토리를 전달할 수 있는 포맷으로 재조명 되고 있다. 이번 연구는 3대의 줌렌즈가 장착된 HD급 방송용 디지털 비디오를 이용해 Screen X와 같은 방법으로 인물을 중심으로 한 전경 장면부터 클로즈업 장면까지 촬영한 후 다면 영상 정합보정을 통해 발생되는 문제점을 분석 파악하였다. 촬영 방법과 장비를 보완하면 다면영상이란 포맷이 스토리와 정보 전달이 가능한 매체임을 제시하였고 향후 방송용 줌렌즈를 이용한 촬영보다 표준렌즈 기반의 시네마급 카메라를 이용한 양질의 다면영상 콘텐츠를 제작할 수 있도록 기술적 연구와 보완이 필요하다.

다시점 비디오 부호화를 위한 시간적 예측 구조 (Temporal Prediction Structure for Multi-view Video Coding)

  • 윤효순;김미영
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1093-1101
    • /
    • 2012
  • 다시점 비디오는 3차원 정보를 표현하기 위한 영상으로 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상이다. 영상들 사이에 존재하는 시간적 상관성과 화면간 상관성을 이용하는 다시점 비디오 부호화는 카메라의 수에 비례하여 데이터의 양이 늘어나기 때문에 계산량을 줄일 수 있는 다시점 비디오 부호화 기술이 필요하다. 본 논문에서는 다시점 비디오의 부호화 성능을 향상시키기 위한 효율적인 예측구조를 제안한다. 제안한 예측 구조는 다시점 비디오의 부호화 효율을 높이기 위하여 부호화되는 현재 화면과 현재 화면이 참조하는 참조 화면들과의 평균 거리, B계층 최대 인덱스 그리고 각 Bi 계층의 화면 수를 고려하였다. 제안한 예측 구조의 성능을 참조 예측 구조의 성능과 비교하였을 때 영상 화질 면에 있어서 제안한 예측 구조가 Fraunhofer-HHI의 계층적 B화면 구조보다 약 0.07~0.13 (dB) 성능 향상을 보였다. 발생되는 평균 초당 비트량에 있어서 제안한 예측 구조가 Fraunhofer-HHI의 계층적 B화면 구조보다 최대 6.5(Kbps) 감소하였다.

다시점 비디오 부호화를 위한 움직임벡터 예측값 선택 방법 (Motion Vector Predictor selection method for multi-view video coding)

  • 최원준;서덕영;김규헌;박광훈
    • 방송공학회논문지
    • /
    • 제12권6호
    • /
    • pp.565-573
    • /
    • 2007
  • 본 논문에서는 JVT에서 표준화가 진행 중인 다시점 비디오 부호화의 부호화 효율을 높이기 위해 다시점 비디오의 예측구조의 특성을 고려하여 움직임벡터 예측값을 선택하는 방법을 제안한다. 다시점 비디오 부호화에서 시간 방향과 뷰 방향의 예측을 수행하면서 서로 다른 성향의 움직임벡터가 발생된다. 또한 주변 블록에서 시간 방향과 뷰 방향 참조의 움직임벡터가 혼재하는 상황에서 동일한 성향의 움직임벡터가 선택되지 않는 경우가 발생되어 움직임벡터의 예측 효율이 저하된다. 이에 다시점 비디오 부호화의 예측구조에 따라 움직임벡터 예측값을 선택할 수 있는 방법을 제안한다. 제안하는 움직임벡터 예측값 선택 방법을 통하여 다시점 비디오 부호화의 압축 효율을 높일 수 있었으며, JMVM 3.6에서 움직임벡터 예측값을 선택하는 방법을 사용하는 다시점 비디오 부호화와 비교하여 PSNR(Peak Signal-to-Noise Ratio)이 약$0.03{\sim}0.1$ dB 정도 향상되었다.

Semi-supervised Multi-view Manifold Discriminant Intact Space Learning

  • Han, Lu;Wu, Fei;Jing, Xiao-Yuan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권9호
    • /
    • pp.4317-4335
    • /
    • 2018
  • Semi-supervised multi-view latent space learning is gaining considerable popularity recently in many machine learning applications due to the high cost and difficulty to obtain the large amount of label information of data. Although some semi-supervised multi-view latent space learning methods have been presented, there is still much space for improvement: 1) How to learn latent discriminant intact feature representations by employing data of multiple views; 2) How to exploit the manifold structure of both labeled and unlabeled point in the learned latent intact space effectively. To address the above issues, we propose an approach called semi-supervised multi-view manifold discriminant intact space learning ($SM^2DIS$) for image classification in this paper. $SM^2DIS$ aims to seek a manifold discriminant intact space for data of different views by making use of both the discriminant information of labeled data and the manifold structure of both labeled and unlabeled data. Experimental results on MNIST, COIL-20, Multi-PIE, and Caltech-101 databases demonstrate the effectiveness and robustness of our proposed approach.

A Multi-view Super-Resolution Method with Joint-optimization of Image Fusion and Blind Deblurring

  • Fan, Jun;Wu, Yue;Zeng, Xiangrong;Huangpeng, Qizi;Liu, Yan;Long, Xin;Zhou, Jinglun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2366-2395
    • /
    • 2018
  • Multi-view super-resolution (MVSR) refers to the process of reconstructing a high-resolution (HR) image from a set of low-resolution (LR) images captured from different viewpoints typically by different cameras. These multi-view images are usually obtained by a camera array. In our previous work [1], we super-resolved multi-view LR images via image fusion (IF) and blind deblurring (BD). In this paper, we present a new MVSR method that jointly realizes IF and BD based on an integrated energy function optimization. First, we reformulate the MVSR problem into a multi-channel blind deblurring (MCBD) problem which is easier to be solved than the former. Then the depth map of the desired HR image is calculated. Finally, we solve the MCBD problem, in which the optimization problems with respect to the desired HR image and with respect to the unknown blur are efficiently addressed by the alternating direction method of multipliers (ADMM). Experiments on the Multi-view Image Database of the University of Tsukuba and images captured by our own camera array system demonstrate the effectiveness of the proposed method.

Implementation of efficient multi-view system through function distribution in digital multi-channel broadcasting service

  • Kwon, Myung-Kyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.17-24
    • /
    • 2017
  • In recent digital broadcasting, up to 250 channels are multiplexed and transmitted. The channel transmission is made in the form of MPEG-2 Transport Stream (TS) and transmits one channel (Video, Audio). In order to check if many broadcast channels are transmitted normally, in multi-channel multi-view system, ability of real-time monitoring is required. In order to monitor efficient multi-channel, a distributed system in which functions and load are distributed should be implemented. In the past, we used an inefficient system that gave all of the functionality to a piece of hardware, which limited the channel acceptance and required a lot of resources. In this paper, we implemented a distributed multi-view system which can reduce resources and monitor them economically through efficient function and load balancing. It is able to implement efficient system by taking charge of decoding, resizing and encoding function in specific server and viewer function in separate server. Through this system, the system was stabilized, the investment cost was reduced by 19.7%, and the wall monitor area was reduced by 52.6%. Experimental results show that efficient real-time channel monitoring for multi-channel digital broadcasting is possible.

EFFICIENT MULTIVIEW VIDEO CODING BY OBJECT SEGMENTATION

  • Boonthep, Narasak;Chiracharit, Werapon;Chamnongthai, Kosin;Ho, Yo-Sung
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.294-297
    • /
    • 2009
  • Multi-view video consists of a set of multiple video sequences from multiple viewpoints or view directions in the same scene. It contains extremely a large amount of data and some extra information to be stored or transmitted to the user. This paper presents inter-view correlations among video objects and the background to reduce the prediction complexity while achieving a high coding efficiency in multi-view video coding. Our proposed algorism is based on object-based segmentation scheme that utilizes video object information obtained from the coded base view. This set of data help us to predict disparity vectors and motion vectors in enhancement views by employing object registration, which leads to high compression and low-complexity coding scheme for enhancement views. An experimental results show that the superiority can provide an improvement of PSNR gain 2.5.3 dB compared to the simulcast.

  • PDF

View Synthesis and Coding of Multi-view Data in Arbitrary Camera Arrangements Using Multiple Layered Depth Images

  • Yoon, Seung-Uk;Ho, Yo-Sung
    • Journal of Multimedia Information System
    • /
    • 제1권1호
    • /
    • pp.1-10
    • /
    • 2014
  • In this paper, we propose a new view synthesis technique for coding of multi-view color and depth data in arbitrary camera arrangements. We treat each camera position as a 3-D point in world coordinates and build clusters of those vertices. Color and depth data within a cluster are gathered into one camera position using a hierarchical representation based on the concept of layered depth image (LDI). Since one camera can cover only a limited viewing range, we set multiple reference cameras so that multiple LDIs are generated to cover the whole viewing range. Therefore, we can enhance the visual quality of the reconstructed views from multiple LDIs comparing with that from a single LDI. From experimental results, the proposed scheme shows better coding performance under arbitrary camera configurations in terms of PSNR and subjective visual quality.

  • PDF

다시점 영상 색상 보정을 위한 개선된 다항식 모델 (Improved Polynomial Model for Multi-View Image Color Correction)

  • 정재일;호요성
    • 한국통신학회논문지
    • /
    • 제38C권10호
    • /
    • pp.881-886
    • /
    • 2013
  • 여러 대의 카메라를 이용하여 영상을 획득하는 다시점 카메라 시스템에서 각 시점의 색상이 서로 다르게 촬영되는 문제가 발생한다. 본 논문에서는 이런 색상 불일치 문제를 효과적으로 해결하기 위해 개선된 다항식 모델을 제안한다. 특징점 기반 대응점 추출 알고리즘을 이용하여 기준 시점과 다른 시점 간의 색상 대응 관계를 획득하고, 이를 이용하여 상대적인 매핑 곡선을 계산한다. 이때 비선형적인 관계를 반영하기 위해서 5차 다항 모델을 이용한다. 추출된 대응점의 동적 영역이 좁을 경우에 매핑 곡선의 정확도가 떨어지게 되는데, 이를 보완하기 위해서 매핑 곡선의 양 끝 부분을 1차 다항 모델을 이용하여 다시 추정한다. 이렇게 유추된 모델을 이용하여 색상을 보정하면, 추출된 대응점의 동적 영역에 강인하게 색상 불일치 문제를 해결할 수 있다. 제안한 방법은 색상 차트 촬영과 같은 전처리 과정이 필요하지 않기 때문에, 기존에 촬영된 다시점 영상에도 적용할 수 있다는 장점을 갖는다. 다양한 실험을 통해 제안한 알고리즘이 다른 최신의 알고리즘보다 보정 효과가 우수함을 확인했고, 객관적 평가에서도 우수한 성능을 보였다.