• 제목/요약/키워드: 압축 포맷

검색결과 112건 처리시간 0.031초

BiM을 이용한 메타데이터의 효율적인 부호화 방법 (An efficient compression method of metadata using BiM)

  • 양승준;남제호;김영태;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.199-202
    • /
    • 2001
  • ISO/IEC 15938-1(MPEG-7 Systems)에서는 멀티미디어 컨텐츠에 대한 메타데이터의 효율적인 전송과 저장을 위한 이진 표현 방법인 BiM(binary format for MPEC-7)을 제공한다. 멀티미디어 컨텐츠를 기술(description)하는 메타데이터의 텍스트 표현은 대체로 많은 저장 용량과 전송 리소스를 요구하기 때문에 효율적인 압축을 위해서는 이진 형식으로의 변환이 요구된다. 또한 텍스트 형식은 방송 환경과 같은 스트리밍 전송에는 적절하지 못한 단점이 있다. BiM은 컨텐츠에 대한 기술을 전체 또는 2개 이상의 AU(access units) 단위로 분할하며 부호화하는 방법을 지원함으로써 스트리밍 전송을 가능하게 한다. 이러한 구조는 이진 포맷 형태로 표현되는 헤더를 가지는 패킷 기반 형태이며, 융통성이 있는 전송 순서를 제공한다. 또한, 비트 스트림의 전체를 해석(parsing)하지 않고 랜덤 엑세스 기능을 제공하는 장점이 있다. BiM이 지닌 이러한 장점들로 인하여 현재 방송산업계를 중심으로 메타데이터를 방송에 활용하기 위한 기술을 표준화하는 국제 민간 표준화 기구인 TV-Anytime 포럼에서는 방송 컨텐츠에 대한 메타데이터의 압축에 관한 요구사항을 만족하는 하나의 방법으로 BiM을 고려하고 있다 본 논문에서는 이러한 MPEG-7 시스템의 BiM을 소개하고, 이를 이용하여 TV-Anytime 포럼의 메타데이터를 이진 포맷으로 부호화한 실험과 그 결과를 기술한다.

  • PDF

사용자 기반 실감 객체 오디오 파일 포맷 및 오디오 장면 묘사 기법 (An User Controllable Object Audio File Format and Audio Scene Description)

  • 조충상;김제우
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.25-33
    • /
    • 2010
  • 최근의 오디오 기술은 사용자 중심으로 변화하고 있으며, 사용자의 환경과 의도에 따라 능동적으로 서비스가 이루어지는 대화형 오디오 서비스 시대로 변화하고 있다. 이에 맞추어 시장에서는 고품질 오디오 서비스를 위한 무손실 오디오 기술을 탑재한 멀티미디어 기기와 사용자가 선택적으로 악기를 조절할 수 있는 객체 오디오 음원 서비스가 이루어지고 있다. 본 논문에서는 사용자가 컨트롤 할 수 있는 실감 객체 오디오 파일 포맷을 설계하고 실감 정보를 낮은 복잡도에서 저장 매체와 전송 매체에 적용 가능한 오디오 장면 묘사 방법을 제안한다. 설계된 실감 객체 오디오 파일 포맷은 MPEG-4 파일 포맷을 기반으로 설계되었다. MPEG-4 파일 포맷은 MPEG-4에 속하는 고성능 오디오 코덱을 오디오 코덱 객체 번호를 통해서 쉽게 적용가능하다. 또한 오디오 객체 개수의 변화에 따라 파일 포맷의 트랙을 변화 시켜 사용하면 되므로 객체 오디오를 포함하기에 적절하다. 본 연구에서 개발된 파일 포맷은 실감 객체오디오 생성시 MPEG-4 오디오 코덱으로 압축된 객체 오디오, 실감 객체 오디오를 위한 오디오 장면 묘사 데이터를 독립적인 트랙으로 포함하고 있다. 포함된 오디오 장면 묘사 기법은 저장 매체를 위해 전체 오디오 장면에 적용되는 오디오 묘사 기법과 각각의 오디오 객체에 적용되는 오디오 묘사 기법을 노드 구조로 설계 하였으며, 전송 매체를 위해서 기본적인 객체 오디오 동작을 하기위한 필수 정보와 오디오 세부장면 묘사를 위한 정보로 분할하여 설계하였다. 이를 바탕으로 본 연구에서는 실감 객체 오디오 시뮬레이터를 개발하였다. 개발된 시뮬레이터는 객체 음원과 오디오 장면 묘사 정보를 부호화하여 MPEG-4 파일 포맷에 저장하며, 생성된 실감 객체 오디오 파일은 재생 모듈에서 오디오 객체에 입력 받은 사용자 정보와 오디오 장면 묘사 정보가 적용되어 사용자에게 몰입감이 높은 실감 오디오 서비스를 제공한다.

양자화 기반의 모델 압축을 이용한 ONNX 경량화 (Lightweight of ONNX using Quantization-based Model Compression)

  • 장두혁;이정수;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.93-98
    • /
    • 2021
  • 딥 러닝의 발전으로 다양한 AI 기반의 응용이 많아지고, 그 모델의 규모도 매우 커지고 있다. 그러나 임베디드 기기와 같이 자원이 제한적인 환경에서는 모델의 적용이 어렵거나 전력 부족 등의 문제가 존재한다. 이를 해결하기 위해서 클라우드 기술 또는 오프로딩 기술을 활용하거나, 모델의 매개변수 개수를 줄이거나 계산을 최적화하는 등의 경량화 방법이 제안되었다. 본 논문에서는 다양한 프레임워크들의 상호 교환 포맷으로 사용되고 있는 ONNX(개방형 신경망 교환 포맷) 포맷에 딥러닝 경량화 방법 중 학습된 모델의 양자화를 적용한다. 경량화 전 모델과의 신경망 구조와 추론성능을 비교하고, 양자화를 위한 다양한 모듈 방식를 분석한다. 실험을 통해 ONNX의 양자화 결과, 정확도는 차이가 거의 없으며 기존 모델보다 매개변수 크기가 압축되었으며 추론 시간 또한 전보다 최적화되었음을 알 수 있었다.

다중 감각 미디어 응용 포맷의 구성 방법 연구 (A Study on Multiple Sensorial Media Application Format)

  • 오정엽;김상균
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.330-340
    • /
    • 2016
  • 본 논문은 MPEG-A(ISO/IEC 23000) 표준으로 새로이 제정된 다중 감각 미디어 응용 포맷의 구조와 구현에 대해 설명한다. 다중 감각 미디어 응용 포맷은 비디오/오디오 데이터와 더불어 감각 효과 메타데이터의 효과적인 저장, 재생, 관리를 용이하게 한다. 포맷을 구성하기 위해, MPEG-4 파트 12(ISO/IEC 14496-12)의 ISO 기본미디어 파일 포맷과 MPEG-V 파트 3(ISO/IEC 23005-3)의 표준 메타데이터를 사용하였다. 본 논문에서는 MPEG-V 파트 3의 감각효과 메타데이터(SEM)의 샘플화를 위해 SEM XML 문서의 분할과, 분할된 샘플을 이진화하는 방법에 대해 비교 분석한다. 이진화 방법에 대한 비교 분석 결과 MPEG-V 이진표현 방법과 Binary MPEG format for XML(BiM)이 gzip방법에 비해 압축율과 처리시간 등에서 우수한 성능을 보였다.

모바일 게임 환경의 ASTC 텍스쳐 포맷 효용성 연구 (A Study on the Efficiency of ASTC Texture Format in Mobile Game Environment)

  • 홍성찬;김태규;정원조
    • 한국게임학회 논문지
    • /
    • 제19권6호
    • /
    • pp.91-98
    • /
    • 2019
  • 본 연구는 모바일 Android OS에서 텍스쳐 포맷인 ASTC의 메모리 점유율, CPU 처리 속도, 평균 프레임 비교 검증을 진행하였다. 실험 환경 구성으로 가상의 게임 씬을 구현하여 Android 플랫폼으로 빌드하였다. 이를 바탕으로 비교 검증 데이터를 추출하였다. ASTC는 ETC보다 2D 텍스쳐의 메모리 사용량에서 36% 낮은 점유율을 보였다. CPU 연산 처리에서는 18% 빠른 처리속도를 보였다. 평균 프레임은 58% 더 높은 54프레임을 확인하였다. 스마트 모바일 게임 환경에서 ASTC는 ETC보다 비교우위의 결과를 확인하였다.

스마트폰에서 촬영된 HEIF 파일의 디지털 포렌식 특징 분석 (Analysis of the HEIF files taken with a Smartphone for Digital Forensic Investigation)

  • 권영진;방수민;한재혁;이상진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.521-524
    • /
    • 2021
  • HEIF (High Efficiency File Format)는 MPEG에서 개발된 이미지 포맷으로써, 비디오 코덱인 H.265를 활용하여 정지된 화면을 하나의 이미지 형태로 저장할 수 있도록 개발된 컨테이너이다. 아이폰은 2017년부터 HEIF를 사용하고 있으며, 2019년부터는 갤럭시 S10과 같은 안드로이드 기기도 해당 포맷을 지원하고 있다. 이 포맷은 우수한 압축률을 가지도록 이미지를 제공할 수 있으나, 복잡한 내부 구조를 가지고 있으며 기기나 소프트웨어 간 호환성이 현저하게 부족하여 일반적으로 사용되는 JPEG(또는 JPG) 파일을 대체하기에는 아직 대중적이지 못한 상황이다. 하지만 이미 많은 기기에서 HEIF를 사용하고 있음에도 불구하고 디지털 포렌식 연구는 부족한 상황이다. 이는 디지털 포렌식 조사 과정에서 파일 내부에 포함된 정보의 파악이 미흡하여 잠재적인 증거를 놓칠 수 있는 위험에 노출될 수 있다. 따라서 본 논문에서는 아이폰에서 촬영된 HEIF 형식의 사진 파일과 갤럭시에서 촬영된 모션 포토 파일을 분석하여 파일 내부에 포함된 정보와 특징들을 알아본다. 또한 이미지 뷰어기능을 지원하는 소프트웨어를 대상으로 HEIF에 대한 지원 여부를 조사하고 HEIF 뷰어를 분석하는 포렌식 도구의 요구사항을 제시한다.

AVI to MPEG-4 파일 생성 도구 (Tool of file Production from AVI to MPEG-4)

  • 김선태;마평수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.403-405
    • /
    • 2001
  • MPEG-4 미디어 파일은 저비트율에서 고비트율까지 다양한 응용범위에서 이용 가능하므로, 요즘들어서 MPEG-4의 미디어 파일이 많은 분야에서 사용되고 있다. 하지만 미디어를 다루는 전문가 외에는 MPEG-4 알고리즘을 이용한 미디어 파일을 생성하여 서비스하기에는 많은 어려움이 있다. 따라서, 본 논문에서는 사용자가 사용하기 편리한 인터페이스를 갖춘 MPEG-4파일 생성 도구를 만들었다. 본 파일 생성도구는 일반 PC에 보편화된 미디어 포맷인 AVI과일을 입력으로 오디오와 비디오를 포함한 MPEG-4 파일을 생성하는 도구이다. 이 도구에는 비디오의 화면 크기 변환, 오디오의 채널변환 및 샘플링 주파수 변환 등의 전처기와 비디오/오디오 압축을 위한 각각의 MPEG-4 비디오/오디오 부호기 및 생성된 두개의 미디어 파일을 하나로 묶어 표준에 맞은 파일을 생성하는 포맷터를 포함한다. 본 파일 생성도구는 응용 비트율에 따른 파일 생성뿐 만 아니라 각각의 미디어 파일의 조건을 사용자 인터페이스의 간단한 입력으로 원하는 응용에 맞는 다양한 파일을 생성할 수 있다.

  • PDF

MPEG-2/H.264 변환을 위한 1/2 화소 보정 (Half Pixel Correction for MPEG-2/H.264 Transcoding)

  • 권순영;이주경;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.481-483
    • /
    • 2004
  • 다양한 동영상 압축표준에서 압축효율을 높이기 위해 1/2 화소를 이용한다. 1/2 화소는 프레임 간 참조시 압축 효율을 높이기 위한 프레임 내 화소를 연산하여 생성되는 가상의 값이며 이 연산식은 표준에 따라 다르다. MPEG-2에서 H.264로의 포맷 변환시 이 1/2 화소값의 차이로 인해 MPEG-2의 모션벡터와 움직임 보상된 값을 그대로 사용할 수 없게 된다. 본 논문에서는 MPEG-2의 모션벡터를 그대로 사용하고 DCT(Discrete Cosine Transform) 도메인에서 두 표준의 화소값의 차이를 보정하는 기법을 제안한다. 제안된 기법은 픽셀 도메인의 창조 블록을 이용하여 보정 할 위치를 찾고 두 표준의 1/2 화소 계산식의 차이를 이용하여 보정 할 값을 구하게 된다. 구해진 보정 값을 DCT하여 DCT 도메인의 현재 블록에 더하여 보정하게 된다. 이 기법은 모든 블록의 값을 완벽하게 보정할 수는 없지만 두 표준 간 차이값이 큰 1/2 화소를 보정할 수 있으며 IDCT라 DCT로 인한 화질 열화도 감소된다 또한, DCT 상태에서 보정을 수행하므로 픽셀 도메인에서 보다 약 7%의 계산복잡도도 낮출 수 있다.

  • PDF

피처 프레임 구성 방안에 따른 피처 맵 압축 효율 및 머신 태스크 성능 분석 (Analysis of Feature Map Compression Efficiency and Machine Task Performance According to Feature Frame Configuration Method)

  • 이성배;이민석;김규헌
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.318-331
    • /
    • 2022
  • 최근 하드웨어 연산 장치와 소프트웨어 기반 프레임워크의 발전으로 딥러닝 네트워크를 활용한 머신 태스크가 다양한 산업 분야 및 개인 IoT 장비에서의 활용이 기대되고 있다. 그러나 딥러닝 네트워크를 구동하기 위한 장치의 고비용 문제와 서버에서 머신 태스크 결과만을 전송받을 때 사용자가 요구하는 결과를 받지 못할 수 있다는 제한 사항을 극복하기 위하여 Collaborative Intelligence (CI)에서는 피처 맵의 전송을 그 해결 방법으로 제시하였다. 본 논문에서는 CI 패러다임을 지원하기 위하여 방대한 데이터 크기를 갖는 피처 맵의 효율적인 압축 방법을 실험을 통해 분석 및 제시하였다. 해당 방법은 전통적인 비디오 코덱에서의 압축 효율을 높이기 위하여 피처 맵의 재정렬을 적용하여 중복성을 높였으며, 정지 영상 압축 포맷과 동영상 압축 포맷을 동시에 활용하여 압축 효율을 높이고 머신 태스크의 성능을 유지하는 피처 맵 방법을 제시하였다. 본 논문에서는 이와 같은 방법의 분석을 통해 MPEG-VCM의 피처 압축 앵커 대비 BPP와 mAP의 BD-rate에서 14.29%의 성능이 향상됨을 검증하였다.

부복호화기 효율을 고려한 다시점 영상 합성 기법 (Multi-view Synthesis Algorithm for the Better Efficiency of Codec)

  • 최인규;정원식;이광순;유지상
    • 한국정보통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.375-384
    • /
    • 2016
  • 본 논문에서는 스테레오 영상과 스테레오 영상 바깥 시점의 위성 영상 그리고 상응하는 깊이 영상이 입력으로 주어질 때 이 입력 영상들을 압축에 적합한 포맷으로 변환하고 활용하여 중간시점 영상을 합성하는 새로운 기법을 제안한다. 송출 단에서 깊이 영상들은 하나의 global 영상으로, 위성영상은 시점 이동 시에 발생하는 프레임 밖의 영역 및 가려짐 영역과 같은 홀 영역에만 해당하는 residual 영상으로 변환 후에 데이터 량을 줄이기 위하여 다운샘플링하고 주시점의 스테레오 영상과 더불어 HEVC 코덱으로 부호화 한 후 전송한다. 수신 단에서 복호화된 각 입력 영상들을 이용하여 스테레오 영상 간 그리고 스테레오 영상과 위성 영상간의 중간시점 영상을 합성한다. 실험을 통하여 제안한 포맷을 이용하여 합성한 중간 시점 영상을 MVD(Multiview Video plus Depth) 포맷을 이용하여 합성한 중간 시점 영상과 비교했을 때 전송하는 데이터의 비트율(bit-rate) 대비 객관적 그리고 주관적 화질이 뛰어남을 확인하였다.