• 제목/요약/키워드: multi-View

검색결과 1,262건 처리시간 0.031초

다시점 준지도 학습 기반 3차원 휴먼 자세 추정 (Multi-view Semi-supervised Learning-based 3D Human Pose Estimation)

  • 김도엽;장주용
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.174-184
    • /
    • 2022
  • 3차원 휴먼 자세 추정 모델은 다시점 모델과 단시점 모델로 분류될 수 있다. 일반적으로 다시점 모델은 단시점 모델에 비하여 뛰어난 자세 추정 성능을 보인다. 단시점 모델의 경우 3차원 자세 추정 성능의 향상은 많은 양의 학습 데이터를 필요로 한다. 하지만 3차원 자세에 대한 참값을 획득하는 것은 쉬운 일이 아니다. 이러한 문제를 다루기 위해, 우리는 다시점 모델로부터 다시점 휴먼 자세 데이터에 대한 의사 참값을 생성하고, 이를 단시점 모델의 학습에 활용하는 방법을 제안한다. 또한, 우리는 각각의 다시점 영상으로부터 추정된 자세의 일관성을 고려하는 다시점 일관성 손실함수를 제안하여, 이것이 단시점 모델의 효과적인 학습에 도움을 준다는 것을 보인다. Human3.6M과 MPI-INF-3DHP 데이터셋을 사용한 실험은 제안하는 방법이 3차원 휴먼 자세 추정을 위한 단시점 모델의 학습에 효과적임을 보여준다.

Novel Motion and Disparity Prediction for Multi-view Video Coding

  • Lim, Woong;Nam, Junghak;Sim, Donggyu
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권3호
    • /
    • pp.118-127
    • /
    • 2014
  • This paper presents an efficient motion and disparity prediction method for multi-view video coding based on the high efficient video coding (HEVC) standard. The proposed method exploits inter-view candidates for effective prediction of the motion or disparity vector to be coded. The inter-view candidates include not only the motion vectors of adjacent views, but also global disparities across views. The motion vectors coded earlier in an adjacent view were found to be helpful in predicting the current motion vector to reduce the number of bits used in the motion vector information. In addition, the proposed disparity prediction using the global disparity method was found to be effective for interview predictions. A multi-view version based on HEVC was used to evaluate the proposed algorithm, and the proposed correspondence prediction method was implemented on a multi-view platform based on HEVC. The proposed algorithm yielded a coding gain of approximately 2.9% in a high efficiency configuration random access mode.

깊이정보를 포함한 다시점 비디오로부터 계층적 깊이영상 생성 및 부호화 기법 (Generation and Coding of Layered Depth Images for Multi-view Video Representation with Depth Information)

  • 윤승욱;이은경;김성열;호요성;윤국진;김대희;허남호;이수인
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.375-378
    • /
    • 2005
  • The multi-view video is a collection of multiple videos capturing the same scene at different viewpoints. The multi-view video can be used in various applications, including free viewpoint TV and three-dimensional TV. Since the data size of the multi-view video linearly increases as the number of cameras, it is necessary to compress multi-view video data for efficient storage and transmission. The multi-view video can be coded using the concept of the layered depth image (LDI). In this paper, we describe a procedure to generate LDI from the natural multi-view video and present a method to encode multi-view video using the concept of LDI.

  • PDF

텍스쳐 추출시 제한된 수의 참여 영상을 이용한 Multi-view 영상 개선 알고리듬 (An Algorithm for the Multi-view Image Improvement with the Resteicted Number of Images in Texture Extraction)

  • 김도현;양영일
    • 한국멀티미디어학회논문지
    • /
    • 제3권1호
    • /
    • pp.34-40
    • /
    • 2000
  • 본 논문에서는 텍스쳐 추출시 제한된 수의 참여 영상을 이용한 multi-view 영상으로부터 가장 좋은 텍스쳐를 추출하는 효과적인 알고리듬을 제안하였다. 기존의 알고리듬이 정규화된 물체 공간에서 X-Y 평면을 삼각패치로 나누고 아휜 변환에 기반한 변이 보상 모델을 이용하여 삼각패치의 텍스쳐를 추출하였다. 본 논문에서는 기존의 방법과 달리 텍스쳐 추출시 참여 영상의 수를 제한하여 multi-view 영상으로부터 가장 좋은 텍스쳐를 추출하였다. Dragon, santa, city 그리고 kid의 multi-view 영상세트에 대해 실험한 결과 제안된 알고리듬으로 텍스쳐를 추출한후 이로부터 복원된 영상의 신호 대 잡음비(SNR)는 기존의 알고리듬으로 처리된 후 복원된 영상의 신호 대 잡음비보다 평균 0.2dB 정도 개선된 결과를 얻을 수 있었다. 제안된 방법으로 부호화된 데이터로부터 복원된 영상은 기존의 방법으로 부호화된 데이터로부터 복원된 영상보다 영상의 화질이 개선됨을 관찰할 수 있었다.

  • PDF

멀티 뷰 기법 리뷰: 이해와 응용 (Multi-view learning review: understanding methods and their application)

  • 배강일;이영섭;임창원
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.41-68
    • /
    • 2019
  • 멀티 뷰 기법은 데이터를 다양한 관점에서 보려는 접근 방법이며 데이터의 다양한 정보를 통합하여 사용하려는 시도이다. 최근 많은 연구가 진행되고 있는 멀티 뷰 기법에서는 단일 뷰 만을 이용하여 모형을 학습시켰을 때 보다 좋은 성과를 보인 경우가 많았다. 멀티 뷰 기법에서 딥 러닝 기법의 도입으로 이미지, 텍스트, 음성, 영상 등 다양한 분야에서 좋은 성과를 보였다. 본 연구에서는 멀티 뷰 기법이 인간 행동 인식, 의학, 정보 검색, 표정 인식 분야에서 직면한 여러 가지 문제들을 어떻게 해결하고 있는지 소개하였다. 또한 전통적인 멀티 뷰 기법들을 데이터 차원, 분류기 차원, 표현 간의 통합으로 분류하여 멀티 뷰 기법의 데이터 통합 원리를 리뷰 하였다. 마지막으로 딥 러닝 기법 중 가장 범용적으로 사용되고 있는 CNN, RNN, RBM, Autoencoder, GAN 등이 멀티 뷰 기법에 어떻게 응용되고 있는지를 살펴보았다. 이때 CNN, RNN 기반 학습 모형을 지도학습 기법으로, RBM, Autoencoder, GAN 기반 학습 모형을 비지도 학습 기법으로 분류하여 이 방법들이 대한 이해를 돕고자 하였다.

Facial Action Unit Detection with Multilayer Fused Multi-Task and Multi-Label Deep Learning Network

  • He, Jun;Li, Dongliang;Bo, Sun;Yu, Lejun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5546-5559
    • /
    • 2019
  • Facial action units (AUs) have recently drawn increased attention because they can be used to recognize facial expressions. A variety of methods have been designed for frontal-view AU detection, but few have been able to handle multi-view face images. In this paper we propose a method for multi-view facial AU detection using a fused multilayer, multi-task, and multi-label deep learning network. The network can complete two tasks: AU detection and facial view detection. AU detection is a multi-label problem and facial view detection is a single-label problem. A residual network and multilayer fusion are applied to obtain more representative features. Our method is effective and performs well. The F1 score on FERA 2017 is 13.1% higher than the baseline. The facial view recognition accuracy is 0.991. This shows that our multi-task, multi-label model could achieve good performance on the two tasks.

다시점 카메라 시스템을 이용한 디지털 매팅 방법 (Digital Matting Using Multi-view Camera System)

  • 현명한;호요성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.281-282
    • /
    • 2007
  • In this paper, we propose a method for digital matting using a multi-view camera system. In order to generate multi-view synthetic aperture images, we first move all images obtained from the multi-view camera according to their disparities. After we obtain corresponding trimaps by taking a variance of the synthetic aperture images, we convert the trimaps into multi-view alpha mattes. Experimental results show that the proposed scheme can create the composite images successfully by combining foreground objects with multi-view background images.

  • PDF

Distributed Video Coding for Illumination Compensation of Multi-view Video

  • Park, Sean-Ae;Sim, Dong-Gyu;Jeon, Byeung-Woo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권6호
    • /
    • pp.1222-1236
    • /
    • 2010
  • In this paper, we propose an improved distributed multi-view video coding method that is robust to illumination changes among different views. The use of view dependency is not effective for multi-view video because each view has different intrinsic and extrinsic camera parameters. In this paper, a modified distributed multi-view coding method is presented that applies illumination compensation when generating side information. The proposed encoder codes DC values of discrete cosine transform (DCT) coefficients separately by entropy coding. The proposed decoder can generate more accurate side information by using the transmitted DC coefficients to compensate for illumination changes. Furthermore, AC coefficients are coded with conventional entropy or channel coders depending on the frequency band. We found that the proposed algorithm is about 0.1~0.5 dB better than conventional algorithms.

계층적 깊이 영상으로 표현된 다시점 영상의 효과적인 압축 기술 (Effective Compression Technique of Multi-view Image expressed by Layered Depth Image)

  • 지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.29-37
    • /
    • 2014
  • 다시점 비디오는 카메라 수만큼의 컬러영상들과 깊이 영상들이 존재하므로 막대한 양의 데이터를 갖게 되어서, 그 양을 줄이는 새로운 압축 기술 개발이 필수적이다. 최근 계층적 깊이 영상(Layered Depth Image : LDI)의 개념을 이용하여 깊이 정보를 포함하는 다시점 비디오를 효과적으로 압축 부호화하는 기술이 주목 받고 있다. 이 방법은 여러 시점의 깊이 정보와 워핑(warping) 함수를 사용하여 다시점의 컬러와 깊이 영상을 합성하여 하나의 데이터 구조를 만드는 방법이다. 본 논문에서는 계층적 깊이 영상에서 실제 거리를 이용하고 오버랩(overlap) 문제를 해결하고 그리고 컬러 변환을 기반으로 복원을 위해서 추가되는 데이터의 양을 감소시켜 압축 성능을 향상시키는 방법을 제안하였다.

다시점 3차원 비디오 재생 시스템 설계 및 구현 (Design and Implementation of Multi-View 3D Video Player)

  • 허영수;박광훈
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.258-273
    • /
    • 2011
  • 본 논문에서는 기존 비디오 재생 시스템보다 고속으로 동작하는 다시점 3차원 비디오 재생 시스템을 설계하여 구현하였다. 대용량의 다시점 영상 데이터를 고속으로 처리하기 위해 구성 모듈들을 병렬화하여 다중코어 프로세서 환경에서 최적의 속도를 얻을 수 있는 구조를 제안하였다. 병목지점의 병행성을 활용하기 위하여 복호화, 영상합성, 렌더링 모듈을 파이프라인 구조로 설계하였다. 부하 균형을 위하여 복호화 모듈을 시점 단위로 분할하고, 영상합성 모듈을 합성영상을 기준으로 기하적으로 데이터 분할하였다. 실험결과로서, 다시점 영상이 올바르게 합성되어 무안경식 다시점 입체디스플레이 상에서 시청 시 입체감을 느낄 수 있었으며, 제안하는 응용프로그램의 처리구조는 다중코어 프로세서를 최대 활용하여 대용량의 다시점 영상데이터를 고속으로 처리할 수 있었다.