• 제목/요약/키워드: Moving picture coding

검색결과 74건 처리시간 0.037초

V3C 비트스트림 기반 ISOBMFF 캡슐화 실험 (ISOBMFF encapsulation experiment based on the V3C bitstream)

  • 남귀중;김준식;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.154-156
    • /
    • 2021
  • 최근 3차원 영상이 다양한 분야에서 활용되고 있으며, 이에 따라 3차원 영상에 대한 압축과 전송 방안에 대한 연구가 활발히 진행되고 있다. 국제 표준화 기구인 ISO/IEC 산하 Moving Picture Expert Group(MPEG)에서는 기존의 2차원 비디오 코덱을 이용하여 고밀도 포인트 클라우드 압축하는 방안인 V-PCC와 3DoF+ 영상을 압축하기 위한 방안인 MPEG Immersive Video(MIV)를 표준화 중에 있다. V-PCC와 MIV는 압축 방법의 유사성으로 인해 동일한 Volumetric Visual Video-based Coding(V3C) 형식으로 저장된다. 압축된 V3C 데이터를 효과적으로 저장하여 이용하기 위해서는 ISO based Media File Format(ISOBMFF) 캡슐화 과정이 필수적이다. 본 논문에서는 MPEG의 Carriage of V3C data 표준에 따라 V3C 데이터를 ISOBMFF로 캡슐화 실험을 진행하였으며, 실험에 대한 검증을 위하여 생성된 ISOBMFF 데이터를 V3C 데이터로 복원한 뒤, 디코딩 하여 확인하였다.

  • PDF

H.264 기반 선택적인 미세입자 스케일러블 코딩 방법 (A H.264 based Selective Fine Granular Scalable Coding Scheme)

  • 박광훈;유원혁;김규헌
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.309-318
    • /
    • 2004
  • 본 논문에서는 선택적으로 강화계층의 시간적 예측 정보를 사용하는 H.264 기반 선택적인 미 세입자 스케일러블 비디오 코딩 방법을 제안한다. 제안된 방법의 기본계층은 최근 표준화되었으며 고압축률이 특징인 H.264 (MPEG-4 Part 10 AVC) 알고리즘으로 코딩한다. 강화계층은 기본적으로 국제표준인 비트플레인 기반 MPEG-4 (Part 2) 미세입자스케일러블 코딩 방법으로 코딩한다. 본 논문에서는 엔코더측에서 강화계층간 시간적 예측 방법에 의해 발생된 효과적인 영상 정보를 드리프트 현상이 최소화하는 방향으로 선택적으로 적용하여 디코더측에 전송하는 방안을 제안하였다. 강화계층간 예측 방법만을 추가했을 때는 시간적 중복성을 줄여주는 효과를 볼 수 있지만 저비트율 대역에서 엔코더와 디코더간의 참조 저장 영상 불일치로 인한 드리프트 현상이 심하게 발생한다. 제안된 알고리즘은 시간적 예측 결과가 우수하여 코딩효율을 현저히 높혀줄 수 있는 경우에만 선택적으로 강화계층간의 시간적 예측 정보를 사용하였으며, 이로 인하여 저비트율 대역에서의 드리프트 현상을 현저하게 줄 일수 있었으며, 전반적으로 코딩 효율을 높여주는 효과를 가져왔다. 여러 영상 시퀀스를 대상으로 실험한 결과, 제안된 코딩 방법은 현존하는 국제표준인 MPEG-4 기반 미세입자 스케일러블 코딩 방법보다 같은 비트율 대역에서 영상화질이 약 3∼5 dB 높은 성능을 보여주고 있으며, H.264를 기반으로한 미세입자 스케일러블 코딩 방법보다도 약 1∼3 dB 높은 성능을 보여주고 있음을 발견할 수 있었다.

스케일러블 비디오 부호화에서 공간 계층간 움직임 벡터 예측를 이용한 고속 모드 결정 (Fast Block Mode Decision of Spatial Enhancement Layer using Interlayer Motion Vector Estimation in Scalable Video Coding)

  • 이범식;김문철;함상진;이근식;박창섭
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2007년도 동계학술대회
    • /
    • pp.13-17
    • /
    • 2007
  • 스케일러블 비디오 코딩(SVC, Scalable Video Coding)은 MPEG(Moving Picture Expert Group)과 VCEG (Video Coding Expert Group)의 JVT(Joint VIdeo Team)에 의해 현재 표준화 되고 있는 새로운 압축 표준 기술이며 시간, 공간 및 화질의 스케일러빌리티를 지원하기 위해 계층 구조를 가지고 있다. 공간적 스케일러빌리티를 위해 기본 계층으로부터 텍스처, 움직임 그리고 잔차신호 정보를 예측하여 사용한다. 그러나 고효율의 압축효과를 얻기 위해 기존의 방식에서는 기본계층에서 얻은 세가지 정보이외에 현재 향상 계층에서 자체적으로 얻은 부호화 정보를 비교하여 최소의 RD(Rate Distortion) 비용을 가지는 정보를 이용하여 부호화 하도록 되어 있다. 하지만 이러한 방식은 향상 계층에서 인터 모드 결정 시 $16\times16,\;16\times8,\;8\times16,\;8\times8,\;4\times4,\;4\times8,\;4\times4$ 블록 모드에 대한 움직임 벡터 예측 및 보상 과정을 거쳐야 하기 때문에 향상 계층에서의 부호화 복잡도는 기본 계층에 비해 상당히 증가하게 된다. 본 논문에서는 기본계층에서 예측한 움직임 벡터 정보를 이용하여 항상 계층에서 모드 결정을 고속화하는 방법에 대해 소개한다. 제안된 방법은 기본 계층에서 예측한 블록모드 중에서 큰 블록인 $16\times16$ 블록에서 움직임 벡터가 (0, 0) 일 경우에 대하여 향상 계층에서는 $16\times16$매크로 블록에 대해서만 움직임 예측 및 보상을 수행함으로써 향상 계층에서 움직임 모드 결정을 조기에 완료하게 된다. 이것은 하위 공간 계층에서 예측한 움직임 벡터 정보가 아주 작을 때는 큰 블록 크기로 모드로 결정되는 일반적인 원리를 이용한 것이고 이 제안 방법을 이용하였을 경우 향상계층에의 모드 결정과정을 고속화함으로써 전체 스케일러빌 비디오 부호하기의 연산량 및 복잡도를 최대 70%까지 감소 시켰다. 그러나 연산량 감소에 따른 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.

  • PDF

LCD 오버드라이브를 위한 다중 모드 BTC 영상 압축 알고리즘 (Multi-Mode BTC Image Compression Algorithm for LCD Overdriving)

  • 조문기;윤영섭
    • 전자공학회논문지
    • /
    • 제52권3호
    • /
    • pp.67-74
    • /
    • 2015
  • BTC (Block Truncation Coding) 영상 압축은 하드웨어 구현이 간단하고, 영상의 에지 보존 능력이 뛰어나, LCD 오버드라이브의 압축 기법으로 널리 사용되어지고 있다. 본 논문에서는 높은 화질을 유지하고 높은 압축률을 얻기 위한 방법으로, Multi-Mode BTC (MM-BTC) 알고리즘을 제안한다. 본 논문에서 제안하는 advanced Y-based BTC 방법으로 RGB 각각의 비트맵을 하나의 비트맵으로 단일화 하여 압축 율을 높였고, 본 논문에서 제안하는 improved 2-level 와 4-level BTC 방법을 사용하여 높은 화질을 얻도록 하였다. 시뮬레이션 확인 결과, MM-BTC 는 기존 연구된 BTC 알고리즘 결과보다 최대 2.34 dB 높은 정지 영상 PSNR(Peak Signal to Noise Ratio)결과를 확인 할 수 있었다. LCD overdrive 에 적용한 동영상 PSNR과 비교 결과, MM-BTC 가 기존 연구된 BTC 알고리즘 결과보다 최대 2.33 dB 높은 PSNR 결과가 확인되었다.

VVC 부호화기의 화면내 부호화 모드 결정 개선 방법 (Enhanced intra prediction mode decision method for VVC)

  • 윤병진;권대혁;최재륜;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.191-193
    • /
    • 2019
  • ISO/IEC JTC1 WG11 Moving Picture Expers Group 과 ITU-T SC16 은 Joint Video Experts Team 을 구성하여 차세대 비디오 부호화 표준으로서 Versatile Video Coding(VVC)를 표준화 중이다. VVC 는 현재 블록의 화면내 예측 모드일 가능성이 높은 모드의 집합인 Most Probable Mode(MPM) 리스트를 유도하고, MPM 을 이용하여 효율적으로 화면내 예측 모드를 부호화한다. VVC 참조 소프트웨어는 주변 블록의 화면내 예측 모드가 일치하는지 여부에 따라 1 개 또는 2 개의 모드를 최종 후보 선택을 위한 과정인 Rate-Distortion Optimization(RDO) 과정에 추가한다. 하지만 현재 MPM 은 항상 첫 번째 후보로 Planar 모드가 위치하며 이로 인하여, 주변 블록의 화면내 예측 모드가 RDO 에 추가되지 않는 경우가 존재한다. 따라서 본 논문은 VVC 의 부호화기에서 주변 블록의 화면내 예측 모드가 고려되지 않는 경우가 존재하는 문제를 해결하기 위한 방법을 제안한다. 제안 방법은 MPM 유도 과정에서 RDO 에 포함할 후보의 개수를 수정하여 RDO 과정에 항상 주변 블록의 화면내 예측 모드가 추가되도록 한다. 본 논문은 실험을 통해 제안 방법이 약 0.04%의 부호화 효율을 향상시켰음을 보인다.

  • PDF

균일전력 밀도의 엔벨로프 발생기와 변환 부호화 방식의 정보량 축소를 이용한 음원 전용DSP설계에 관한 연구 (A Study on the Design of Digital Sound Processor for Music using Equal Power Density Envelope Generator and Transform Coder)

  • 구재을;방효창;김종한;김원후
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.14-27
    • /
    • 1995
  • 본 논문은 ADPCM에 MPEG (Moving Picture Expert Group)에서 사용하는 변환 부호화 방식을 이요한 양자화 잡음의 축소와 균등 전력 밀도의 엔벨로프 재생 방식을 이용하여 악기의 특색에 따라 서로 다른 형태의 정보량 축소 방식을 채택한 디지탈 음원 DSP에 관하여 기술한다. 이를 검증하기 위하여 32개의 악기 소리를 동시에 구현할 수 있는 일종의 RISC인 음발생 전용 DSP를 설계하였고 1MByte의 메모리에 200여가지의 악기음을 코딩하여 알고리즘의 정확성을 입증하였다.

  • PDF

디지털 오디오 방송 서비스를 위한 오디오 코덱의 구현 (Implementation of the Audio CODEC for Digital Audio Broadcasting Service)

  • 장대영;홍진우
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.66-71
    • /
    • 2001
  • 본 논문에서는 디지털 오디오 방송 시스템의 소스 부호화기로 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI에서 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (moving Picture Exports Group Phase 2) 시스템의 TS(Transport Stream) 형식으로 입출력한다. 내부 오디오 신호처리를 위한 DSP (Digital Signal Processor)는 TI(Texas Instruments) 사의 TMS320C6701 (Floating point 166 MHz)을 사용하였으며, 인코더 에서는 DSP를 4개까지, 디코더에서는 3개까지 사용하여 구성할 수 있도록 설계하였다. DSP에서는 시스템 제어. 오디오 신호 입 력. 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP는 직렬 및 병렬 접속에 의해 데이터를 전 달한다 현재 본 시스템을 사용하여 2채널의 AAC 코덱을 구현하였으며, 이후 본 시스템을 이용하여 멀티채널 AAC 코덱, MPEG-4 오디오 코덱을 구현할 예정이며. DAB 및 디지털 방송 분야에 활용될 것이다.

  • PDF

디지털 오디오 방송을 위한 AAC 오디오 코덱 구현 (Implementation of the AAC Audio CODEC for Digital Audio Broadcasting)

  • 장대영;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.43-48
    • /
    • 2000
  • 본 논문에서는 디지털 오디오 방송 시스템으로서 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI가 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (Moving Picture Experts Group phase 2) 시스템의 TS(Transport Stream) 형식으로 입/출력한다. 내부 오디오 신호처리를 위한 DSP(Digital Signal Processor)로서는 Tl(Texas Instruments) 사의 TMS320C6701 (Floating point, 166 MHz)을 사용하였다. 인코더에서는 DSP 를 4 개까지, 디코더에서는 3 개까지 사용하여 구성할 수 있도록 설계하였다. DSP 에서는 시스템 제어, 오디오 신호 입력, 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP 는 직렬 및 병렬 접속에 의해 서로 데이터를 전달한다. 본 시스템은 이후 다양한 디지털 방송 분야에 활용될 것이다.

  • PDF

변형된 비용 함수를 이용한 움직임 추정 기법 (Motion Estimation Using Modified Cost Functions)

  • 조한욱;서정욱;정제창
    • 방송공학회논문지
    • /
    • 제3권1호
    • /
    • pp.100-109
    • /
    • 1998
  • 최근 HDTV나 화상회의 시스템, VOD(video on demand) 서비스 등에서 쓰이는 영상 신호의 부호화가 주요한 관심사가 되고 있다. 동영상 압축 알고리즘에서 움직임 추정기법은 매우 중요한 역할을 담당하는 반면, 수행시간이나 하드웨어 구현에 어려움이 많아 이를 개선하기 위한 많은 알고리즘들이 개발되어 왔다. 본 논문에서는 적절한 화소 분류를 통해 우수한 화질과 적은 계산량, 간단히 하드웨어 구조를 가지는 효율적인 움직임 추정기법을 제안한다. 기존의 1-비트 화소 분류 방법에서 변형된 새로운 비용 함수를 이용한 2-비트, 3-비트 호소 분류 방법과 2차 비용함수를 이용한 화소 분류 방법을 제안하였다. 또한 여러 고속 움직임 추정 알고리즘과도 쉽게 연결하여 사용할 수 있으며 우수한 성능을 나타내는 것을 모의 실험을 통해 보였다.

  • PDF

A Synchronization Scheme for Hierarchical Video Streams over Heterogeneous Networks

  • Sohn, Yejin;Cho, Minju;Seo, Minjae;Paik, Jongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권8호
    • /
    • pp.3121-3135
    • /
    • 2015
  • Owing to the increase in consumption of multimedia content and the improvement of device capacity, user demand for high-quality content has increased. However, it is difficult to transport such large amounts of content over the existing broadcasting network with limited bandwidth. To provide high-definition broadcasting, some studies suggest methods of transporting multimedia over heterogeneous networks after encoding content hierarchically. MPEG Media Transport (MMT), standardized by Moving Picture Experts Group (MPEG), is a solution that enables large-volume media transport over heterogeneous networks such as digital broadcasting networks and packet-switched networks. In the case of delivering a scalable encoded video over different networks, synchronization of each stream is an important issue. MMT defines a synchronization scheme, but does not contain sufficient functions to implement it. In this paper, we propose a synchronization scheme for media streams that are encoded hierarchically, divided into layers, and transported over heterogeneous networks. We implement our scheme using MMT and HTTP, and experimented using three encapsulated video streams with different durations. As a result, we show that the proposed scheme can reduce the waiting time to display high-quality video, relative to Dynamic Adaptive Streaming over HTTP-Scalable Video Coding (DASH-SVC) by requesting segments of enhanced layers after calculating the transmission time. Additionally, we find out that the selection of durations have a relation to the characteristics of the video.