• 제목/요약/키워드: Multiview

검색결과 149건 처리시간 0.024초

다중 뷰 데이터에 대한 적응형 분광 군집화 (Adaptive Spectral Clustering for Multiview Data)

  • 손정우;전준기;김선중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1337-1340
    • /
    • 2015
  • 분광 군집화 기술은 Non-convex 군집에 대해 타 군집화 기술에 비해 강건하여 다양한 분야에서 활용되고 있다. 본 논문에서는 다중 뷰 데이터의 특성을 반영한 새로운 분광 군집화 기술을 제안한다. 제안한 방법은 협업학습의 접근 방법을 적용하되, 다수의 뷰가 서로 간에 가지는 독립성의 정도를 반영하여 유사도 그래프를 구축하고, 구축된 그래프를 기반으로 분광 군집화를 수행한다. 이를 통해 뷰들간 서로 다른 정보 요구를 그래프에 반영함으로써 군집화 성능을 높인다. 세 개의 뷰를 가정한 가상의 데이터에서 제안한 방법은 기존 방법에 비해 최대 8.25%, 높은 성능을 보였다.

기준 화면을 이용한 다시점 영상 부호화의 빠른 모드 결정 방법 (A Fast Mode Decision using Anchor Pictures for Multiview Video Coding)

  • 정충현;신광무;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.530-533
    • /
    • 2010
  • 다시점 영상 부호화에서는 시점 간의 공간적 중복성을 이용하여 데이터 중복성을 제거하는 것이 중요하다. 독립적으로 부호화하는 동시 부호화 방법(simulcast)보다 부호화 효율이 더욱 향상하였지만 계산 복잡도가 증가하는 문제가 있다. 본 논문에서는 다시점 영상 부호화기의 계산 복잡도를 감소시키기 위한 빠른 모드 결정 방법을 제안한다. GOP 내의 양 끝에 위치하고 있는 기준 화면의 MAD를 계산하여 영역을 분할하고 영역 맵을 생성한다. 시점 간의 예측을 사용하는 시점의 경우 인접 시점의 기준 화면도 이용하여 영역을 분할한다. 생성된 맵은 비기준 화면의 부호화 시 적용되어 후보 모드를 조기에 판단한다. 이와 같은 방법을 적용한 후의 실험 결과, 화질의 손실이 거의 없으면서 부호화 시간은 평균 58.6% 감소하였고, 비트율은 평균 1.9% 증가하였다.

  • PDF

다시점 영상에 대한 이상 물체 탐지 기반 영상 시놉시스 프레임워크 (Abnormal Object Detection-based Video Synopsis Framework in Multiview Video)

  • 팔라시 잉글;유진용;김영갑
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.213-216
    • /
    • 2022
  • There has been an increase in video surveillance for public safety and security, which increases the video data, leading to analysis, and storage issues. Furthermore, most surveillance videos contain an empty frame of hours of video footage; thus, extracting useful information is crucial. The prominent framework used in surveillance for efficient storage and analysis is video synopsis. However, the existing video synopsis procedure is not applicable for creating an abnormal object-based synopsis. Therefore, we proposed a lightweight synopsis methodology that initially detects and extracts abnormal foreground objects and their respective backgrounds, which is stitched to construct a synopsis.

멀티뷰를 활용한 라이브 커머스 플랫폼 설계 (Design of a Live Commerce Platform Using a Multiview)

  • 우예지;원애령;윤정원;이신화;전수민;이상운
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.157-160
    • /
    • 2021
  • 코로나 19로 인한 사회적 거리 두기가 계속되면서 온라인 쇼핑을 이용하는 고객이 증가했다. 그중 원활한 소통이 가능한 라이브 커머스 시장이 크게 성장했다. 모바일 기기만 있으면 시간과 장소의 제약 없이 라이브 커머스를 이용할 수 있지만 제한된 정보제공과 장애인을 위한 서비스가 없다는 것이 단점이다. 따라서 본 논문에서는 다양한 정보를 제공하기 위한 멀티뷰 화면을 송출하고 TTS, 딥러닝 기반의 STT 기술을 활용해 시·청각 장애인을 위한 기능을 포함한 새로운 형태의 라이브 커머스 플랫폼 및 시스템 구조를 제안한다.

  • PDF

멀티뷰를 활용한 영상 플랫폼 설계 (Design of a Media Platform Using a Multiview)

  • 신준혁;강찬민;김예빈;손명지;주민영;이상운
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.301-304
    • /
    • 2020
  • 시대가 변화됨에 따라 다양한 비대면 방송들이 증가하는 추세를 보이고 있다. 가상현실(VR)을 이용한 쇼케이스부터 실시간 쌍방향 소통을 활용한 무대까지 멀티뷰를 활용한 방송들이 여러 방향으로 활용되고 있으며. 이러한 환경 속에 관객과 조금 더 밀접한 방송을 진행하기 위한 여러 방법이 시도되고 있다. 따라서, 본 논문에서는 현장에서 녹화되고 있는 모든 카메라 소스들을 썸네일 사이즈로 만들어 한눈에 알아볼 수 있는 플랫폼을 구성하여 시청자가 원하는 카메라를 선택해 보고 싶은 장면을 선택할 수 있는 시스템을 제안한다.

  • PDF

MV-HEVC 기반 TMIV 에서의 성능 개선 (Performance Improvement of TMIV based on MV-HEVC)

  • 이광순;정준영;오관정;서정일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.70-72
    • /
    • 2021
  • 본문에서는 TMIV 에서 비디오 코덱으로 사용되고 있는 HEVC 를 MV(Multiview)-HEVC 로 대체한 실험결과를 소개하고 부호화 효율을 향상시키기 위한 아틀라스 생성 구조에 대해 제안하고자 한다. 이를 위해 본 논문에서는 푸루닝(pruning)된 패치를 패킹한 아틀라스 영상으로 구성된 MIV 앵커(anchor)에 MV-HEVC 를 적용하는 구조, 소스 시점영상으로부터 선택된 기본 시점영상으로만 패킹한 아틀라스 영상으로 구성된 MIV view 앵커에 적용하는 구조를 실험한다. 이와 더불어 부호화 효율을 향상시키기 위해 선택된 기본시점 영상을 패킹함에 있어서 2 개의 아틀라스영상에 걸쳐 가장 인접한 시점을 배치하는 아틀라스 영상 구조를 제안한다. 실험결과, 기존의 MIV 앵커에 MV-HEVC 를 적용하면 성능 개선이 거의 없으며, MIV view 앵커와 제안한 MIV view 앵커의 아틀라스영상 구조에 MV-HEVC 를 적용하면 객관적인 성능이 최대로 얻을 수 있음을 알 수 있었다.

  • PDF

RGB 이미지에서 트랜스포머 기반 고밀도 3D 재구성 (Transformer-based dense 3D reconstruction from RGB images)

  • 서가가;고서;문명운;조경은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.646-647
    • /
    • 2022
  • Multiview stereo (MVS) 3D reconstruction of a scene from images is a fundamental computer vision problem that has been thoroughly researched in recent times. Traditionally, MVS approaches create dense correspondences by constructing regularizations and hand-crafted similarity metrics. Although these techniques have achieved excellent results in the best Lambertian conditions, traditional MVS algorithms still contain a lot of artifacts. Therefore, in this study, we suggest using a transformer network to accelerate the MVS reconstruction. The network is based on a transformer model and can extract dense features with 3D consistency and global context, which are necessary to provide accurate matching for MVS.

Fast Estimation of Three-dimensional Spatial Light Intensity Distribution at the User Position of an Autostereoscopic 3D Display by Combining the Data of Two-dimensional Spatial Light Intensity Distributions

  • Hyungki Hong
    • Current Optics and Photonics
    • /
    • 제8권3호
    • /
    • pp.307-312
    • /
    • 2024
  • Measuring the three-dimensional (3D) spatial light intensity distribution of an autostereoscopic multiview 3D display at the user position is time-consuming, as luminance has to be measured at different positions around the user position. This study investigates a method to quickly estimate the 3D distribution at the user position. For this purpose, a measurement setup using a white semitransparent diffusing screen or a two-dimensional (2D) spatial sensor was devised to measure the 2D light intensity distribution at the user position. Furthermore, the 3D spatial light intensity distribution at the user position was estimated from these 2D distributions at different viewing distances. From the estimated 3D distribution, the characteristics of autostereoscopic 3D display performance can be derived and the candidate positions for further accurate measurement can be quickly determined.

주파수 적응 채널 잡음 모델링에 기반한 변환영역 Wyner-Ziv 부호화 방법 (Transform domain Wyner-Ziv Coding based on the frequency-adaptive channel noise modeling)

  • 김병희;고봉혁;전병우
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.144-153
    • /
    • 2009
  • 최근, 사용자 제작 콘텐츠(UCC: User Created Contents) 또는 다시점 비디오(Multiview Video) 등의 응용을 위한 경량화 부호화 기술의 필요성이 대두됨에 따라 비디오 부호화 복잡도의 대부분을 차지하는 움직임 예측/보상 과정을 부호화기가 아닌 복호화기 측에서 수행하는 분산 비디오 부호화 기술(Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있다. Wyner-Ziv 부호화 기술은 채널 코딩을 이용하여 원본 영상에 대한 복호화기 측의 예측영상인 보조정보에 포함된 잡음을 제거함으로써 영상을 복원하는 구조를 가진다. 일반적인 Wyner-Ziv 부호화 기술은 키 프레임 간의 움직임 예측/보상 과정에 기반한 프레임 보간법을 통해 보조정보를 생성하며, Shannon limit에 근접한 성능을 보이는 Turbo 코드나 LDPC 코드를 통해 잡음을 제거한다. Wyner-Ziv 부호화 기술은 채널 코드의 복호화를 위해 보조정보에 포함된 잡음의 정도를 예측하는데, 이를 '가상 채널 잡음(Virtual Channel Noise)'이라 하며 일반적으로 Laplacian이나 Gaussian으로 모델화 한다. 본 논문은 변환영역에서의 주파수 단위에 적응적인 채널 잡음 모델링에 기반한 Wyner-Ziv 부호화 방법을 제안한다. 다양한 영상에 대한 제안 방법의 실험 결과는 기존 방법과 비교하여 최대 약 0.52dB에 해당하는 율-왜곡 성능의 향상을 보여준다.

다중 입체 영상 획득을 위한 정밀 카메라 캘리브레이션 기법 (Accurate Camera Calibration Method for Multiview Stereoscopic Image Acquisition)

  • 김중희;윤여훈;김준수;윤국진;정원식;강석주
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.919-927
    • /
    • 2019
  • 본 논문에서는 입체 영상을 획득하기 위한 정밀 카메라 캘리브레이션(calibration) 기법을 제안한다. 일반적인 카메라 캘리브레이션 기법은 체커보드 구조의 목적 패턴을 이용하여 수행한다. 체커보드 패턴은 사전에 인지된 격자구조를 활용할 수 있으며, 체커보드 코너점을 통해 특징점 매칭을 용이하게 수행할 수 있음에 따라 2차원 영상 픽셀 지점과 3차원 공간상의 관계를 정확히 추정할 수 있다. 특징점 매칭을 통해 카메라 파라미터를 추정하므로 정밀한 카메라 캘리브레이션을 위해선 영상 평면내의 정확한 체커보드 코너 검출이 필요하다. 따라서 본 논문은 정확한 체커보드 코너 검출을 통해 정밀한 카메라 캘리브레이션을 수행하는 기법을 제안한다. 정확한 코너를 검출하기 위해 1-D 가우시안 필터링을 활용하여 코너 후보군들을 검출한 후 코너 정제(refinement) 과정을 통해 이상치(outlier)들을 제거하며 영상내의 부분 픽셀(sub-pixel) 단위의 정확한 코너를 검출한다. 제안한 기법을 검증하기 위해 카메라 내부 파라미터를 추정 결과를 판단하는 재투사 오차(reprojection error)를 확인하며, 카메라 위치 ground truth 값이 제공된 데이터 셋을 활용하여 카메라 외부 파라미터 추정 결과를 확인한다.