• 제목/요약/키워드: immersive video

검색결과 130건 처리시간 0.024초

프루닝 클러스터 그래프 구성 전략에 따른 몰입형 비디오 압축 성능 분석 (Efficient Pruning Cluster Graph Strategy for MPEG Immersive Video Compression)

  • 이순빈;정종범;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.101-104
    • /
    • 2022
  • MPEG Immersive Video (MIV) 표준화 기술은 다시점 영상 부호화 시 비디오 코덱의 부담을 최소화하기 위해 각 시점 영상의 차분 정보만을 표현하는 처리 기술을 바탕으로 하고 있다. 본 논문에서는 시점 간 중복성 제거를 진행하는 과정인 프루닝(pruning) 과정에서 복잡도 절감을 위해 병렬처리에 용이하도록 구성되는 프루닝 클러스터 그래프에 대해 서술하고, 각 클러스터 그래프 별 구성 전략에 따른 성능 분석을 진행한다. 클러스터 그래프 내에서 중복성 제거를 진행하지 않고 완전한 정보를 보존하는 바탕 시점(basic view)의 개수가 적게 포함될수록 처리할 전체 픽셀 화소율(pixel rate)은 감소하지만, 복원 화질 역시 감소하며 프루닝 복잡도는 증가하는 경향을 보인다. 실험 결과를 통해 프루닝 클러스터 그래프 구성에 따른 트레이드오프를 탐색하고, 최적화된 그래프 구성 전략에 따라 몰입형 비디오의 효율적인 전송이 가능함을 보인다.

  • PDF

LDPM 영상 평가를 활용한 동영상 스티칭의 시차 왜곡 검출 및 정정 방법 (Parallax Distortion Detection and Correction Method for Video Stitching by using LDPM Image Assessment)

  • 이성배;강전호;김규헌
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.685-697
    • /
    • 2020
  • 파노라마(Panorama) 및 360도 영상과 같은 몰입형(Immersive) 미디어 영상은 영상 내 공간을 사용자가 직접 방문한 것 같은 현장감을 제공해야하므로 실제 세계의 모습을 사실 그대로 나타낼 수 있어야 한다. 그러나 파노라마 및 360도 영상에서는 촬영 카메라들간의 시차(Parallax)로 인해 사물이 사라지거나 중복해서 나타나는 현상이 나타나며, 이와 같은 시차 왜곡은 사용자의 콘텐츠 몰입을 방해할 수 있다. 이에 따라서, 시차 왜곡을 극복하기 위한 많은 동영상 스티칭 알고리즘이 제안되고 있지만, Object detection 모듈의 낮은 성능과 Seam 생성 방식 등의 제한으로 여전히 시차 왜곡이 발생하고 있다. 이에 본 논문에서는 기존 동영상 스티칭 기술의 제한 사항을 분석하고, 해당 동영상 스티칭 기술의 제한을 극복하기 위하여 LDPM(Local Differential Pixel Mean) 영상 평가를 활용한 동영상 스티칭의 시차 왜곡 검출 및 정정 방법을 제안한다.

MPEG-I의 6DoF를 위한 360 비디오 가상시점 합성 성능 분석 (Performance Analysis on View Synthesis of 360 Videos for Omnidirectional 6DoF in MPEG-I)

  • 김현호;김재곤
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.273-280
    • /
    • 2019
  • 360 비디오는 VR 응용의 확산과 함께 몰입형 미디어로 주목받고 있으며, MPEG-I Visual 그룹은 6 자유도(6DoF)까지의 몰입형 미디어를 제공하기 위한 표준화를 진행하고 있다. 제한된 공간내에서 전방위 6DoF를 제공하는 Omnidirectional 6DoF는 제공되는 제한된 수의 360 비디오로부터 임의의 위치에서의 뷰(view)를 제공하기 위한 가상시점 합성이 필요하다. 본 논문에서는 MPEG-I Visual 그룹에서 진행된 전방위 6DoF를 위한 합성에 대한 탐색실험의 성능 및 분석 결과를 기술한다. 즉, 합성하려는 가상시점과 합성을 위한 360 비디오의 입력시점 사이의 거리 및 입력시점의 개수 등의 다양한 실험조건에 따른 합성 성능 결과 및 분석을 제시한다.

5G를 향한 영상회의 기술 및 서비스 동향 (Trends in the Telepresence Technologies and Services Beyond 5G)

  • 이훈기;한미경;장종현
    • 전자통신동향분석
    • /
    • 제32권5호
    • /
    • pp.20-29
    • /
    • 2017
  • In this paper, a video conferencing system, which has been attracting significant attention as an immersive telepresence service owing to the recent emergence of 5G networks, is described. We propose a service platform for Giga Media based video conferencing for 5G convergence services. The video conferencing service consists of a traditional structure that provides information exchange through the transmission of video and voice of remote participants using a Multipoint Control Unit (MCU), a browser-based video conferencing based on WebRTC, a multi-view point video conferencing, and holographic telepresence centered on mixed reality. The paper introduces the trends and detailed structures of various technologies used in the video conferencing system, and compares the video conferencing system technologies and video conferencing service characteristics for the integrated Giga Media platform.

몰입형 입체영상 부호화를 위한 VVC 인루프 필터 성능 분석 (Performance Analysis of VVC In-Loop Filters for Immersive Video Coding)

  • 최용호;방건;이진호;이진영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.151-153
    • /
    • 2022
  • 최근 Moving Picture Experts Group(MPEG)에서는 2차원 비디오 압축 표준인 Versatile Video Coding(VVC)에 이어서 다양한 영상 포맷들에 대한 압축 방식을 표준화하고 있다. 특히, 가상현실, 증강현실, 혼합현실 등의 지원을 위한 Six Degrees of Freedom(6DoF) 입체영상 콘텐츠들이 최근 다양한 분야들에서 활용되고 있는데, 6DoF 입체영상은 일반적으로 복수 시점의 고해상도 칼라영상과 깊이영상으로 구성된다. 이러한 고해상도의 6DoF 몰입형 입체영상을 제한된 네트워크 환경에서 완벽한 서비스를 목표로 MPEG에서는 몰입형 입체영상 압축 기술인 MPEG Immersive Video(MIV) 표준화를 활발하게 진행 중에 있다. MIV에서는 기본 뷰(Basic View)로 이루어진 영상과 추가 뷰(Addtional View)에서 중복성 높은 픽셀들이 제거된 아틀라스 패치로 이루어진 영상을 각각 VVC로 압축한다. 하지만 아틀라스 패치로 이루어진 영상의 경우에는 일반적인 2차원 칼라영상과 다른 특성을 가지기 때문에, VVC 인루프 필터 기술이 비효율적일 수 있다. 따라서, 본 논문에서는 MIV 표준에서의 VVC 인루프 필터들의 성능을 분석한다.

  • PDF

체감형 미디어 서비스를 위한 공간음향 기술 동향 (Spatial Audio Technologies for Immersive Media Services)

  • 이용주;유재현;장대영;이미숙;이태진
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.13-22
    • /
    • 2019
  • Although virtual reality technology may not be deemed as having a satisfactory quality for all users, it tends to incite interest because of the expectation that the technology can allow one to experience something that they may never experience in real life. The most important aspect of this indirect experience is the provision of immersive 3D audio and video, which interacts naturally with every action of the user. The immersive audio faithfully reproduces an acoustic scene in a space corresponding to the position and movement of the listener, and this technology is also called spatial audio. In this paper, we briefly introduce the trend of spatial audio technology in view of acquisition, analysis, reproduction, and the concept of MPEG-I audio standard technology, which is being promoted for spatial audio services.

Understanding the User Preferences in the Types of Video Censorship

  • Park, Sohyeon;Kim, Kyulee;Oh, Uran
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권2호
    • /
    • pp.147-161
    • /
    • 2022
  • Video on demand (VOD) platforms provide immersive, inspiring, and commercial-free binge watching experiences. Recently, the number of these platform users increased dramatically as users can enjoy various contents without physical and time constraints during COVID-19. However, such platforms do not provide sufficient video censorship services while there is a strong need. In this study, we investigated the users' desire for video censorship when choosing and watching movies on VOD platforms, and how video censorship can be applied to different types of scenes to increase the censoring effect without diminishing the enjoyment. We first conducted an online survey with 98 respondents to identify the types of discomfort while watching sexual, violent, or drug-related scenes. We then conducted an in-depth online interview with 18 participants to identify the effective video filtering types and regions for each of the three scenes. Based on the findings, we suggest implications for designing a censor application for videos that contain uncomfortable scenes.

Visual Object Tracking Fusing CNN and Color Histogram based Tracker and Depth Estimation for Automatic Immersive Audio Mixing

  • Park, Sung-Jun;Islam, Md. Mahbubul;Baek, Joong-Hwan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.1121-1141
    • /
    • 2020
  • We propose a robust visual object tracking algorithm fusing a convolutional neural network tracker trained offline from a large number of video repositories and a color histogram based tracker to track objects for mixing immersive audio. Our algorithm addresses the problem of occlusion and large movements of the CNN based GOTURN generic object tracker. The key idea is the offline training of a binary classifier with the color histogram similarity values estimated via both trackers used in this method to opt appropriate tracker for target tracking and update both trackers with the predicted bounding box position of the target to continue tracking. Furthermore, a histogram similarity constraint is applied before updating the trackers to maximize the tracking accuracy. Finally, we compute the depth(z) of the target object by one of the prominent unsupervised monocular depth estimation algorithms to ensure the necessary 3D position of the tracked object to mix the immersive audio into that object. Our proposed algorithm demonstrates about 2% improved accuracy over the outperforming GOTURN algorithm in the existing VOT2014 tracking benchmark. Additionally, our tracker also works well to track multiple objects utilizing the concept of single object tracker but no demonstrations on any MOT benchmark.

인터렉티브 가상 스튜디오와 몰입형 시청자 환경 (Interactive Virtual Studio & Immersive Viewer Environment)

  • 김래현;박문호;고희동;변혜란
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.87-93
    • /
    • 1999
  • In this paper, we introduce a novel virtual studio environment where a broadcaster in the virtual set interacts with tele-viewers as if they are sharing the same environment as participants. A tele-viewer participates physically in the virtual studio environment by a dummy-head equipped with video "eyes" and microphone "ears" physically located in the studio. The dummy head as a surrogate of the tole-viewer follows the tele-viewer's head movements and views and hears through the dummy head like a tele-operated robot. By introducing the tele-presence technology in the virtual studio setting, the broadcaster can not only interact with the virtual set elements like the regular virtual studio environment but also share the physical studio with the surrogates of the tele-viewers as participants. The tele-viewer may see the real broadcaster in the virtual set environment and other participants as avatars in place of their respective dummy heads. With an immersive display like HMD, the tele-viewer may look around the studio and interact with other avatars. The new interactive virtual studio with the immersive viewer environment may be applied to immersive tele-conferencing, tele-teaching, and interactive TV program productions.program productions.

  • PDF

인공지능 기반 멀티태스크를 위한 비디오 코덱의 성능평가 방법 (Evaluation of Video Codec AI-based Multiple tasks)

  • 김신;이예지;윤경로;추현곤;임한신;서정일
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.273-282
    • /
    • 2022
  • MPEG 내 VCM 그룹은 머신을 위한 비디오 코덱을 표준화하는 것으로 목표로 하고 있다. VCM 그룹은 객체 탐지, 객체 분할, 객체 추적 등 3가지의 머신비전 태스크를 포함한 데이터 세트와 데이터 세트 별 기준 데이터인 Anchor를 제공하고 있으며, 평가 템플릿을 이용하여 후보 기술군과 Anchor의 압축 대비 머신비전 성능을 비교할 수 있다. 하지만 성능 비교는 머신비전 태스크 별로 분리하여 수행되고 있으며, 다수의 머신비전 태스크에 대한 성능 평가를 수행할 수 있는 비트스트림을 생성할 수 있는 데이터는 별도로 제공하고 있지 않다. 본 논문에서는 인공 지능 기반 멀티 태스크를 위한 비디오 코덱의 성능 평가 방안에 대해 제안한다. 하나의 비트스트림의 크기 척도인 픽셀 당 비트수(BPP, Bits Per Pixel) 와 각 태스크의 정확도 결과인 Mean Average Precision(mAP)를 기반으로 산술 평균, 가중 평균, 조화 평균 등 총 3가지의 멀티 태스크 성능 평가 지표를 제안하며 mAP 결과를 기반으로 성능 결과를 비교하고자 한다. 멀티 태스크에서 태스크 별 mAP 결과 값의 범위의 차이가 있을 수 있으며 차이로 인해 생길 수 있는 성능 평가와 관련된 문제를 방지하고자 정규화한 mAP 기반 멀티 태스크 성능 결과를 산출하고 평가하고자 한다.