• 제목/요약/키워드: Media compression format

검색결과 21건 처리시간 0.028초

NNR 비트스트림 기반 ISOBMFF 캡슐화 방안 (ISOBMFF encapsulation method based on NNR bitstream)

  • 이민석;이성배;남귀중;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.821-824
    • /
    • 2022
  • 최근 딥러닝(Deep Learning) 기술이 다양한 분야에서 활용되고 있으며, 사전 학습된 딥러닝 모델에 대한 압축과 전송 방안에 관한 연구 또한 활발히 진행되고 있다. 이와 관련하여, 국제 표준화 기구인 ISO/IEC 산하 MPEG(Moving Picture Expert Group)에서는 인공신경망 모델을 다양한 딥러닝 프레임워크(Deep Learning Framework)에서 상호운용 가능한 포맷으로 압축 표현할 수 있는 NNC(Compression of Neural Network for Multimedia Content Description nd Analysis) 표준화를 진행하고 있다. 압축된 딥러닝 모델의 데이터를 효과적으로 저장하여 전송 및 사용하기 위해서는 ISOBMFF(ISO based Media File Format) 캡슐화 과정이 필요하다. 본 논문에서는 MPEG의 NNC 표준에 따라 사전 학습된 딥러닝 모델을 압축한 후 이를 통해 생성된 비트스트림(bitstream)을 ISOBMFF로 캡슐화하기 위한 기술을 제안 및 실험한다. 또한, 실험에 대한 검증을 위하여 생성된 ISOBMFF 데이터를 비트스트림으로 복원한 뒤 복호화하여 입력 비트스트림과 차이가 없음을 확인한다.

  • PDF

비디오 정합을 위한 오디널 특징의 유일성 및 강건성 분석 (Analysis of Uniqueness and Robustness Properties of Ordinal Signature for Video Matching)

  • 정광민;김정엽;현기호;하영호
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.576-584
    • /
    • 2006
  • 내용기반 비디오 정합은 원본의 클립에서 특징(signature)을 구한 후 복사본의 특징과 비교하여 유사도를 측정한다. 특히 정확한 위치의 프레임을 정합하는 것은 매우 중요하며 원본과 복사본의 프레임율, 잡음, 해상도, 압축형식에 따라 정합 율이 달라질 수 있다. 비디오 특징 중 오디널(ordinal) 특징은 일반적으로 우수한 정합특징을 나타내고 있으나 비디오 특징의 구별 능력을 나타내는 유일성 실험(uniqueness test)과 잡음에 대한 내성을 나타내는 강건성 실험(robustness test)이 중요한 요소로 고려되지 않았다. Hua등은 유일성 실험에서 해상도, 압축형식 등을 고려하였지만 강건성 실험에서 영상에 잡음을 첨가하는 대신 압축 형식이 변환된 영상을 사용하였다. 본 논문에서는 오디널 특정의 유일성 분석과 함께 실질적인 잡음 모텔을 도입하여 오디널 특징의 강건성 실험 방법을 제안하고 성능을 분석하였다.

  • PDF

디지털 방송용 한글 허프만 부호 설계 및 PSIP 구조 (Huffman Code Design and PSIP Structure of Hangul Data for Digital Broadcasting)

  • 황재정;진경식;한학수;최준영;이진환
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.98-107
    • /
    • 2001
  • 본 논문은 한글 텍스트 데이터에 대한 부호화 효율을 극대화시키는 관점에서 예외 부호화를 통해 최적의 허프만 부호를 얻는 다. 한글 코드는 표준 완성형과 유니 코드를 대상으로 하였으며 같은 허프만 부호를 부여하였다. 현재 우리나라의 디지털 TV는 한글 문자를 압축하지 않고 전송하는 형태이며. 본격적인 데이터 방송이 시작되면 한글 데이터가 차지하는 전송량으로 인한 심자 한 문제가 야기된다. 본 논문에서는 데이터 방송에서 문제가 되는 전송량을 줄이기 위해 한글 진용 퇴적의 허프만 부호를 생성한 다. 미국의 ATSC 표준을 바탕으로 한 디지털 TV 국내 표준에 적용하기 위해 프로그램 및 시스템 프로토콜(PSIP) 구조를 제안한 다. 결과로서. 발생확률 0.0043 이하의 확률을 갖는 문자를 예외 부호화하여 최대 47%의 압축율을 얻는 기법을 제안하였다.

  • PDF

강화학습 기반 비활성 영역 패딩 기술 (Reinforcement Learning based Inactive Region Padding Method)

  • 김동신;우딘 쿠툽;오병태
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.599-607
    • /
    • 2021
  • 비활성 영역이란 특정 영상을 표현하기 위해 유효하지 않은 화소 값으로 채워지는 영역을 의미한다. 일반적으로 원본 영상의 형태가 사각형 형태가 아닌 경우 이를 사각형 형태로 변환하는 과정에서 주로 발생하며, 특히 3D 영상을 2D로 표현할 때 자주 발생한다. 이러한 비활성 영역은 압축 효율을 크게 저하시키기 때문에, 활성 영역과 비활성 영역의 경계 부분에 필터링 기술 등을 적용해 해결해 왔다. 하지만 일반적인 필터링 적용 기술은 영상의 특성을 적절하게 반영하지 못할 가능성이 크다. 제안하는 기법에서는 영상의 특성과 압축 과정을 고려한 강화학습을 통한 패딩을 진행하였다. 실험결과 제안한 기법이 기존 기법보다 평균 3.4% 성능이 향상됨을 확인할 수 있다.

Performance Analysis of Open Web Video Codec VP8

  • Park, Younghyeon;Lee, Hoyoung;Jeon, Byeungwoo
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권2호
    • /
    • pp.86-96
    • /
    • 2013
  • VP8, an open web media video format, has recently attractedmuch attention, particularly from major web browser companies, as a video codec for HTML5 on internet due to its good coding efficiency and royalty-free policy. Compared to other video compression schemes such as H.264/AVC, it has several distinctive coding tools that help to ensure good coding efficiency and low decoding complexity. In this paper, we investigate its coding techniques and analyze its rate-distortion (R-D) coding performance as compared to that of H.264/AVC.

  • PDF

HD 블랙박스 녹화과정에서의 위치정보 은익방법 (Location Information Hiding Way Of HD Black Box Recording process)

  • 석진환;윤종철;홍종성;한찬호
    • 융합신호처리학회논문지
    • /
    • 제17권1호
    • /
    • pp.10-17
    • /
    • 2016
  • HD 블랙박스에 포함되는 GPS 위치정보 저장방법은 특정한 표준을 가지지 않고 제조사마다 고유한 방식을 사용하고 있다. 본 논문에서는 GPS 위치정보를 저장하기 위한 저장 공간의 한계성을 극복하고 이에 따른 화질저화를 유발하는 문제점을 해결하기 위하여, 숨겨진 필수영역을 이용한 HDTV 비디오 콘텐츠에 포함된 위치정보 은닉방법을 제안한다. HDTV 비디오 콘텐츠는 압축을 위하여 프레임 하단에 8-라인의 Border Extender가 반드시 필요하게 된다. 이는 현 위치정보를 은닉하는 공간으로 사용되며 화질열화를 방지하기 위하여 그레이스케일 블록 형태의 이미지로 삽입하였다. 제안 방법은 실제 HD블랙박스를 사용하여 확인되었으며, 기존의 부가영역을 사용한 ASCII 코드의 형식보다 해석이 어려우며 편집 재 압축할 경우 위치정보가 사라지는 보안효과가 있다. 따라서 제안방법은 페이스 북이나 유튜브 등과 같은 위치기반 동영상 서비스에도 적합하다.

BiM을 이용한 메타데이터의 효율적인 부호화 방법 (An efficient compression method of metadata using BiM)

  • 양승준;남제호;김영태;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.199-202
    • /
    • 2001
  • ISO/IEC 15938-1(MPEG-7 Systems)에서는 멀티미디어 컨텐츠에 대한 메타데이터의 효율적인 전송과 저장을 위한 이진 표현 방법인 BiM(binary format for MPEC-7)을 제공한다. 멀티미디어 컨텐츠를 기술(description)하는 메타데이터의 텍스트 표현은 대체로 많은 저장 용량과 전송 리소스를 요구하기 때문에 효율적인 압축을 위해서는 이진 형식으로의 변환이 요구된다. 또한 텍스트 형식은 방송 환경과 같은 스트리밍 전송에는 적절하지 못한 단점이 있다. BiM은 컨텐츠에 대한 기술을 전체 또는 2개 이상의 AU(access units) 단위로 분할하며 부호화하는 방법을 지원함으로써 스트리밍 전송을 가능하게 한다. 이러한 구조는 이진 포맷 형태로 표현되는 헤더를 가지는 패킷 기반 형태이며, 융통성이 있는 전송 순서를 제공한다. 또한, 비트 스트림의 전체를 해석(parsing)하지 않고 랜덤 엑세스 기능을 제공하는 장점이 있다. BiM이 지닌 이러한 장점들로 인하여 현재 방송산업계를 중심으로 메타데이터를 방송에 활용하기 위한 기술을 표준화하는 국제 민간 표준화 기구인 TV-Anytime 포럼에서는 방송 컨텐츠에 대한 메타데이터의 압축에 관한 요구사항을 만족하는 하나의 방법으로 BiM을 고려하고 있다 본 논문에서는 이러한 MPEG-7 시스템의 BiM을 소개하고, 이를 이용하여 TV-Anytime 포럼의 메타데이터를 이진 포맷으로 부호화한 실험과 그 결과를 기술한다.

  • PDF

360 비디오의 SSP를 위한 기하학적 패딩 (Geometry Padding for Segmented Sphere Projection (SSP) in 360 Video)

  • 김현호;명상진;윤용욱;김재곤
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.25-31
    • /
    • 2019
  • 360 비디오는 VR 응용의 확산과 함께 몰입형 미디어로 주목받고 있으며, JVET(Joint Video Experts Team)에서 post-HEVC로 진행중인 VVC(Versatile Video Coding) 표준화에서 360 비디오 부호화도 함께 고려되고 있다. 360 비디오 부호화를 위하여 2D로 투영된 영상에는 투영 면(face) 경계의 불연속성과 비활성 영역이 존재할 수 있으며 이는 부호화 효율을 저하시키고 시각적 아티팩트(visual artifact)를 발생시킬 수 있다. 본 논문에서는 2D 투영 기법 중 SSP(Segmented Sphere Projection)에서의 이러한 불연속성과 비활성 영역을 줄이는 효율적인 기하학적 패딩(padding) 기법을 제시한다. 실험결과, 제안 기법은 복사에 의한 패딩을 사용하는 기존 SSP 대비 미미한 부호화 효율 저하는 있지만 주관적 화질이 향상된 것을 확인할 수 있었다.

HDR/WCG 비디오와 3D 오디오를 지원하는 초고품질 방송서비스와 고정 UHD/이동 HD 방송 서비스를 제공하는 ATSC 3.0 기반 UHDTV 방송 시스템 개발 (Development of ATSC3.0 based UHDTV Broadcasting System providing Ultra-high-quality Service that supports HDR/WCG Video and 3D Audio, and a Fixed UHD/Mobile HD Service)

  • 기명석;석진욱;백승권;장대영;이태진;김휘용;오혜주;임보미;배병준;김흥묵;최진수
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.829-849
    • /
    • 2017
  • TV디스플레이 대형화, 방송과 통신의 융합화, 신호 압축 및 전송 기술의 고도화로 인해 지상파 디지털 방송은 초고품질 방송, 하이브리드 방송, 고정UHD/이동HD 동시방송을 제공할 수 있는 UHD 방송으로 진화하고 있다. 이러한 지상파 UHDTV 방송을 위한 국내 표준은 북미의 차세대 방송 표준인 ATSC3.0을 근간으로 하고 있다. ATSC3.0은 비디오 압축 표준으로 HEVC 비디오 부호화 표준을, 오디오 압축 표준으로는 MPEG-H 3D 오디오 부호화 표준을 채택하고 있다. 또한 방송망과 IP망에서의 운용을 위해 기존의 MPEG-2 TS 방식을 대신하여 IP기반의 ROUTE/DASH와 MMT를 전송 포맷으로 채택하고 있으며, 4K UHD 방송과 이동 HD 서비스를 동시에 제공하기 위한 다중화 기술을 도입하고 있다. 본 논문에서는 ATSC3.0을 기반으로 HDR/WCG 지원 고품질 비디오 서비스, 10.2채널/4객체 지원 입체음향 서비스, 고정 UHD와 이동 HD 동시방송 서비스를 제공하기 위해 필요한 오디오/비디오 부호화기, ROUTE/DASH 패키저, 다중화 시스템과 물리계층 송수신을 위한 ATSC 3.0 LDM 시스템을 구현하고, 이를 실시간 방송 송수신 환경에 적용하여 서비스 가능성을 검증하고자 하였다.

Motion JPEG2000을 이용한 디지털시네마 인터넷전송기술 연구 (An Internet Streaming Service for Digital Cinema Using Motion JPEG2000)

  • 정대권
    • 방송공학회논문지
    • /
    • 제14권1호
    • /
    • pp.93-98
    • /
    • 2009
  • Motion JPEG2000 부호화 기법을 사용하는 디지털시네마 시스템과 서비스의 구현은 방대한 재원과 시간을 필요로 하고 있다. 본 논문에서는 인터넷상에서 PC와 RTP 프로토콜을 사용하는 디지털시네마 전송시스템을 제안하고, 동영상 타일들이 각각의 PC에 전송 되고 독립적으로 부호화되고 한 화면으로 결합되어 대화면을 이루는 방법을 제안하였다. 128${\times}$128, 256${\times}$256, 512${\times}$512와 같은 다양한 크기의 타일들에 대해 실험을 한 결과, 두 대의 PC를 사용하여 타일을 수신 및 복호하여 전체 크기의 동영상을 성공적으로 재생할 수 있었다. 압축률 160:1 에서는 30dB 에서 40dB 의 PSNR을 보여주고 있고, 16:1 이하에서는 30dB 에서 50dB 의 PSNR을 보여준다. 제안된 시스템은 멀티 비젼 동영상의 복원에도 사용될 가능성을 보여준다.