• Title/Summary/Keyword: Moving picture coding

검색결과 74건 처리시간 0.022초

Carriage of Volumetric Visual Video based Coding(V3C) 국제표준 기술 동향

  • 남귀중;김규헌
    • 방송과미디어
    • /
    • 제26권2호
    • /
    • pp.46-55
    • /
    • 2021
  • 최근 디바이스와 5G 통신의 비약적인 발전을 통해 가상/증강 현실 분야, 자율 주행 등 3차원 그래픽스 기술에 대한 연구가 활발하게 진행되고 있으며, 3차원 정보를 면밀하게 표현할 수 있는 포인트 클라우드와 다시점 초실감 콘텐츠가 주목받고 있다. 이와 같은 콘텐츠는 전통적인 2D 비디오 대비 많은 데이터를 사용하고 있기에, 효율적 사용을 위해서는 압축이 필수적으로 요구된다. 이에 따라 국제표준화기구인 ISO/IEC 산하 Moving Picture Expert Group(MPEG)에서는 고밀도 포인트 클라우드 및 초다시점 실감형 콘텐츠에 대한 압축 방안으로 V-PCC(Video based Point Cloud Compression) 및 MIV(MPEG Immersive Video) 기술을 표준화 중에 있으며, 또한, 압축된 데이터를 효율적으로 저장, 전송하기 위한 방안으로 Carriage of Visual Volumetric Video Coding(V3C) 표준화가 진행중에 있다. 본 고에서는 MPEG에서 진행중인 V3C 표준 기술에 대하여 살펴보고자 한다.

볼류메트릭 비디오를 위한 MPEG Dynamic Mesh Coding (DMC) 표준화 동향 (Overview of MPEG Dynamic Mesh Coding (DMC) for Volumetric Video)

  • 최이현;정종범;이순빈;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.261-264
    • /
    • 2022
  • MPEG 에서는 frame-based animated mesh compression(FAMC)와 같은 동적 메쉬를 압축하는 기준을 만들어왔다. 그러나 이러한 동적 메쉬 압축 표준은 시변 연결성(time-varying) 정보가 아닌 일정한 연결성 정보를 가진 메쉬를 기준으로 개발되었기 때문에 실시간 스트리밍에서 사용하기 부적합하다. 따라서, moving picture experts group(MPEG)에서는 시변 연결성 정보를 사용하는 동적 메쉬 압축에 대한 새로운 표준을 제안하였는데, 본 논문에서는 MPEG 이 제의한 call for proposals (CfP)에 대해 여러 기관들이 제안한 메쉬 압축 기술들을 소개한다.

  • PDF

소프트웨어 MPEG-1 재생 시스템 개발 (A Development of Software MPEG-1 Playback System)

  • 박태강;이호석
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1749-1755
    • /
    • 1999
  • 기존의 하드웨어로 구현되었던 멀티미디어 시스템들의 다수가 CPU의 성능이 향상됨에 따라 소프트웨어로 구현이 가능하게 되었다. 또한, MPEG(Moving Picture Expert Group)은 디지털 동영상 압축 부호화의 표준화 기구로 자리잡고 있으며 MPEG-1과 MPEG-2가 상용화되어 있다. 본 논문에서는 윈도우 95 환경 하에서 전용 하드웨어의 도움 없이 MPEG-1 동영상을 소프트웨어로 재생할 수 있는 소프트웨어 MPEG-1 재생 시스템의 개발에 대하여 소개한다.

  • PDF

시간축 서브밴드 해석을 이용한 적응적 움직임 추정에 관한 연구 (An adaptive motion estimation based on the temporal subband analysis)

  • 임중곤;정재호
    • 한국통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1361-1369
    • /
    • 1996
  • Motion estimation is one of the key components for high quality video coding. In this paper, a new motion estimation scheme for MPEG-like video coder is suggested. The proposed temporally adaptive motion estimation scheme consists of five functional blocks: Temporal subband analysis (TSBA), extraction of temporal information, scene change detection (SCD), picture type replacement (PTR), and temporally adapted block matching algorithm (TABMA). Here all the functional components are based on the temporal subband analysis. In this papre, we applied the analysis part of subband decompostion to the temporal axis of moving picture sequence, newly defined the temporal activity distribution (TAD) and average TAD, and proposed the temporally adapted block matching algorithm, the scene change detection algorithm and picture type replacement algorithm which employed the results of the temporal subband analysis. A new block matching algorithm TABMA is capable of controlling the block matching area. According to the temporal activity distribution of objects, it allocates the search areas nonuniformly. The proposed SCD and PTR can prevent unavailable motion prediction for abrupt scene changes. Computer simulation results show that the proposed motion estimation scheme improve the quality of reconstructed sequence and reduces the number of block matching trials to 40% of the numbers of trials in conventional methods. The TSBA based scene change detection algorithm can detect the abruptly changed scenes in the intentionally combined sequence of this experiment without additional computations.

  • PDF

스케일러블 비디오 부호화에서 통계적 가설 검증 기법을 이용한 프레임 간 모드 결정 (Fast Intermode Decision of Scalable Video Coding using Statistical Hypothesis Testing)

  • 이범식;김문철;함상진;이근식;박근수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.111-115
    • /
    • 2006
  • 스케일러블 비디오 코딩(SVC, Scalable Video Coding)은 MPEG(Moving Picture Expert Group)과 VCEG (Video Coding Expert Group)의 JVT(Joint VIdeo Team)에 의해 현재 표준화 되고 있는 새로운 압축 표준 기술이며 시간, 공간 및 화질의 스케일러빌리티를 지원하기 위해 계층 구조를 가지고 있다. 특히 시간적 스케일러빌리티를 위해 계층적 B-픽처 구조를 채택하고 있다. 스케일러블 비디오 코딩의 기본 계층은 H.264|AVC와 호환적이므로, 모션 예측과 모드 결정과정에서 $16{\times}16,\;16{\times}8,\;8{\times}16,\;8{\times}8,\;8{\times}4,\;4{\times}8$ 그리고 $4{\times}4$와 같은 7개의 서로 다른 크기를 갖는 블록을 사용한다. 스케일러블 비디오 코딩에서 사용되고있는 계층적 B-픽처 구조는 키 픽처인 I와 P 픽처를 제외하고는 한 GOP (Group of Picture)내에서 모두 B-픽처를 사용하므로 H.264|AVC와 비교했을 때 연산량 증가와 함께 부호화 지연도 급격히 증가한다. B-픽처는 양방향 모션 벡터인 LIST0와 LIST1을 사용하고 양방향 모두에서 다중 참조 픽처를 사용하기 때문이다. 본 논문에서는 통계적 가선 검증을 이용하여 스케일러블 비디오 부호화에 적용 가능한 고속 프레임간 모드 결정 알고리듬 대해 소개한다. 제안된 방법은 $16{\times}16$ 매크로 블록과 $8{\times}8$ 서브 매크로 블록에 통계적 가설 감증 기법을 적용하여 실행되며, 현재 블록과 복원된 참조 블록간의 픽셀 값을 비교하여 RD(Rate Distortion) 최적화 기반 모드 결정을 빨리 완료함으로써 고속 프레임간 모드 결정을 가능하게 한다. 제안된 방법은 프레임 간 모드 결정을 고속화함으로써 스케일러블 비디오 부호화기의 연산량과 복잡도를 최대 57%감소시킨다. 그러나 연산량 감소에 따른 비트율의 증가나 화질의 열화는 최대 1.74% 비트율 증가 및 0.08dB PSNR 감소로 무시할 정도로 작다.

  • PDF

Design on MPEC2 AAC Decoder

  • NOH, Jin Soo;Kang, Dongshik;RHEE, Kang Hyeon
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1567-1570
    • /
    • 2002
  • This paper deals with FPGA(Field Programmable Gate Array) implementation of the AAC(Advanced Audio Coding) decoder. On modern computer culture, according to the high quality data is required in multimedia systems area such as CD, DAT(Digital Audio Tape) and modem. So, the technology of data compression far data transmission is necessity now. MPEG(Moving Picture Experts Group) would be a standard of those technology. MPEG-2 AAC is the availableness and ITU-R advanced coding scheme far high quality audio coding. This MPEG-2 AAC audio standard allows ITU-R 'indistinguishable' quality according to at data rates of 320 Kbit/sec for five full-bandwidth channel audio signals. The compression ratio is around a factor of 1.4 better compared to MPEG Layer-III, it gets the same quality at 70% of the titrate. In this paper, for a real time processing MPEG2 AAC decoding, it is implemented on FPGA chip. The architecture designed is composed of general DSP(Digital Signal Processor). And the Processor designed is coded using VHDL language. The verification is operated with the simulator of C language programmed and ECAD tool.

  • PDF

VVC의 화면 내 예측에서 적응적 TBC를 사용하는 방법 (Adaptive TBC in Intra Prediction on Versatile Video Coding)

  • 이원준;박광훈
    • 방송공학회논문지
    • /
    • 제25권1호
    • /
    • pp.109-112
    • /
    • 2020
  • VVC는 화면 내 예측에서 67가지의 모드를 사용한다. 이때 화면 내 예측 모드 표현을 위한 데이터를 감소시키기 위하여 MPM(Most Probable Mode)을 사용한다. 시그널링 되는 모드가 MPM 후보 내에 존재하는 경우 MPM 리스트의 해당 index를 송신하는 방법을 사용하고 MPM 후보 내에 존재하지 않는 경우에는 TBC 부호화를 적용한다. 화면 내 예측에서 TBC가 적용될 때 MPM 후보를 제외하고 낮은 번호의 모드 순서대로 3가지가 선택되어 5비트로 부호화되고 나머지 모드는 6비트로 부호화된다. 본 논문에서는 VVC의 화면 내 예측에서 사용하는 TBC 기술의 한계점을 알아보고 화면 내 예측에서 TBC를 사용할 때 기존의 방법보다 효율적으로 부호화 할 수 있는 적응적인 방법을 제안한다. 그 결과 기존의 부호화 방법과 비교해서 overall 부호화 성능이 AI와 RA에서 각각 0.01%, 0.04%의 부호화 효율이 증대되었다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.

웨이블렛 변환을 이용한 오디오 코딩 (Audio Signal Coding Using Wavelet Transform)

  • 배석모;김도형;정재호
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.64-70
    • /
    • 1997
  • 본 논문은 MPEG의 서브밴드 필터링을 웨이블렛 변환으로 대체하였을 때 얼마만큼의 계산량이 감소하는 가를 연구하였다. MPEG 오디오에서는 16비트 PCM 오디오 데이타를 입력으로 받아 서브밴드 필터링후 서브밴드 샘플을 양자화하여 전송하는 것을 기본으로 한다. MPEG의 서브밴드 필터링의 경우 32 대역의 등간격으로 분할한다. 이 경우 32개의 필터가 필요하고 각 필터는 512의 길이를 갖는 필터를 사용한다. 본 연구에서는 분할 대역을 6개로 하고 웨이블렛 필터중 가장 짧은 Haar 필터를 사용하였다. 제안된 시스템은 256kbps 이상의 전송율에서는 MPEG 오디오와 비슷한 수준의 CD 음질을 유지하였으며, 계산량 비교결과 부호화기는 약 40%, 복호화기는 약 70%의 감소를 보였다.

  • PDF

VVC 표준의 MPM 유도 단순화 방법 (Simplified MPM derivation for Versatile Video Coding)

  • 최재륜;권대혁;한희지;이하현;강정원;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.17-19
    • /
    • 2019
  • ISO/IEC JTC1 WG11 Moving Picture Expers Group 과 ITU-T SC16 은 Joint Video Experts Team 을 구성하여 차세대 비디오 부호화 표준으로서 Versatile Video Coding(VVC)를 표준화 중이다. VVC 는 현재 블록의 화면내 예측 모드일 가능성이 높은 모드의 집합인 Most Probable Mode(MPM) 리스트를 유도하고, MPM 을 이용하여 효율적으로 화면내 예측 모드를 부호화한다. VVC 는 주변 블록의 화면내 예측 모드에 따라 7가지 종류의 MPM 리스트 유도 방식을 가지고 있으나 이 중 두 가지는 동일한 MPM 들로 유도되는 중복성이 있다. 따라서 본 논문은 이 중복성 문제를 해결하기 위한 MPM 유도 방법을 제안한다. 제안 방법은 MPM 유도조건을 수정하여 중복적인 유도 방식이 제거된 6 가지 MPM 리스트 유도 방식을 갖는다. 실험을 통해 제안방법이 부호화 효율에 전혀 영향을 주기 않고 MPM 유도 과정을 단순화시켰음을 보인다.

  • PDF