• 제목/요약/키워드: 영상 압축 표준

검색결과 489건 처리시간 0.026초

MAF(Multimedia Application File Format) 기반 멀티미디어 검색 시스템의 설계 및 구현 (A Design and Implementation of Multimedia Retrieval System based on MAF(Multimedia Application File Format))

  • 강영모;박주현;방형진;낭종호;김형철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권9호
    • /
    • pp.574-584
    • /
    • 2006
  • 최근 MPEG-A(ISO/IEC 23000)에서는 MAF(Multimedia Application File Format)[1]라는 새로운 멀티미디어 파일 포맷을 제안하고 있다. MAF 파일포맷은 기존의 MPEG 압축 규격을 갖는 미디어 파일에 더해, 미디어 내용 정보를 기술하는 메타데이타를 MPEG-7을 사용하여 하나의 시스템 포맷 내에 포함할 수 있도록 해준다. 하지만 현재로서는 이러한 표준을 구현한 실제 시스템이 없기 때문에, 응용 측면에서 MAF가 얼마나 유용한지 검증하기 어렵다는 문제점을 가지고 있다. 본 논문에서는 PC와 모바일 단말기상에서 MPEG-A 표준을 기반으로 한 멀티미디어 검색 시스템을 설계 및 구현한다. 또한 MPEG-A에서는 아직 동영상에 관련된 메타데이타에 대해서는 제안된 바가 없기 때문에 MPEG-7 MDS(Multimedia Description Scheme)[2]와 TV-Anytime[3]을 기반으로 모바일 환경에서도 저작 및 사용하기 편리한 메타데이타들을 설계한다. 전체 시스템을 설계하기 위해서 MAF 검색 시스템이 가져야 할 5가지 요구사항인 이식성, 확장성, 호환성, 적응성, 효율성을 정의하고 이러한 요구사항을 바탕으로 하여 MAF 검색 시스템의 전체 구조를 응용 계층, 미들웨어 계층, 플랫폼 계층으로 설계한다. 제안하는 검색 시스템은 MAF 형식의 멀티미디어 데이타를 저작, 재생, 검색할 수 있는 클라이언트 파트와, 대용량의 MAF 형식의 멀티미디어 파일과 MAF 파일로부터 추출한 MPEG-7 형태의 메타데이타를 저장, 관리할 수 있는 서버 파트로 구성된다. 그리고 설계한 MAF 검색 시스템의 유용성을 검증하기 위하여, PC에서는 MS 윈도우 플랫폼 그리고 모바일 단말기에서는 WIPI 플랫폼 상에서 클라이언트 시스템을 구현하고 시스템 요구사항들을 모두 만족하는지 여부를 확인한다. 제안하는 검색 시스템은 MPEG-A 표준을 검증하고 그 유용성을 확인하기 위해 사용될 수 있다.

대화형 T-DMB 컨텐츠의 효율적인 전송을 위한 장면기술정보 최적화 기법 (An Optimization Technique of Scene Description for Effective Transmission of Interactive T-DMB Contents)

  • 이송록;정원식;유영재;차경애
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.363-378
    • /
    • 2006
  • 디지털멀티미디어방송(Digital Multimedia Broadcasting, DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량 내에서나 모바일폰, PDA 등과 같은 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 미디어 및 상호작용 정보의 인코딩 규격으로는 MPEG-4 표준을 사용하며, 대화형 컨텐츠의 사용자 상호작용 등의 정보는 장면기술정보인 MPEG-4 BIFS(Binary Format for Scene)에 의해서 이루어진다. 사용자와의 상호작용이 풍부하고 장면 구성이 복잡한 컨텐츠일수록 BIFS 데이터가 전송되기 위해서 요구되는 비트율도 증가한다. 그러나 이동 단말에 고품질의 비디오 및 오디오 데이터를 전송하는 DMB 환경에서는 BIFS 스트림의 전송율은 매우 제한적이다. 한편 사용자 단말기에서 DMB 컨텐츠를 재생하려면 비디오, 오디오 등 미디어 객체들을 디코딩하기 전에 장면 구성 정보인 BIFS 스트림을 디코딩 및 파싱하여야 한다. 그러므로 MPEG-4의 높은 미디어 압축율에도 불구하고 제한된 대역폭과 장면 구성 정보 등 부가 데이터 전송 및 디코딩으로 인한 지연이 발생될 수 있다. 따라서 방송 컨텐츠의 특성 상 사용자의 임의 접근 시에도 재생될 컨텐츠의 BIFS 데이터를 파싱하여 대기 시간을 최소화하도록 초기 장면 구성 정보를 효율적으로 전송해야 한다. 본 연구에서는 지상파 DMB 대화형 컨텐츠의 장면기술정보인 BIFS 스트림을 저전송율 환경에 적응된 형태로 전달하기 위해서, 장면기술정보를 최적화하는 기법을 제안한다.

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

초 고화질 텔레비전 방송을 위한 차세대 오픈 케이블 방식에 대한 연구 (A study of next generation OpenCable systems for Ultra-High Definition television broadcasting)

  • 조창연;허준;김준태
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.228-237
    • /
    • 2009
  • 본 논문에서는 최근 많은 관심을 받고 있는 초 고화질 방송(Ultra-High Definition TV: UD-TV) 에 대하여 간략히 알아보고, 무선 채널에 비해 잡음의 영향이 적은 케이블 채널에서의 전송 가능성과 효율적인 전송방식에 대하여 살펴 보고자 한다. 국내 및 북미에서 디지털 케이블 방송의 전송 표준으로 채택하고 있는 오픈 케이블(OpenCable, J.83 Annex B) 시스템을 근간으로 하여, 기존의 256QAM에서 1024QAM으로 단순 확장된 시스템의 TOV(Threshold of Visibility) 증가를 살펴 보고, 이를 개선하기 위한 오류 정정 부호기의 부호율 변화 및 터보 부호의 적용을 통해 수정 확장된 시스템의 성능을 분석함으로써 수정 확장된 1024QAM 오픈 케이블 시스템의 최대 성능 한계를 알아본다. 그 결과 기존 오류 정정 부호기의 구조를 갖는 오픈 케이블 시스템은 31.5dB 이하의 신호 대 잡음비에서는 오류 없는 수신이 불가능하며, 그보다 낮은 TOV를 얻기 위해서는 기존 오류 정정 부호기의 수정이 불가피함을 확인했다. 또한 UD-TV의 전송 가능성을 기존 6MHz채널 대역폭 내에서의 섀논 한계(Shannon Capacity) 및 차세대 동영상 압축 기술과의 관계를 통해 고찰해 보고, 2개 이상의 채널을 결합하여 UD-TV를 전송하는 여러 가지 시나리오를 제시한다.

H.264/AVC에서 성능 향상을 위한 단방향의 4X4 인트라 예측 모드 (Uni-directional 4X4 Intra Prediction Mode for H.264/AVC Coding Efficiency)

  • 정광수;박시내;심동규;이윤진;박광훈;오승준;정세윤;최진수
    • 방송공학회논문지
    • /
    • 제15권6호
    • /
    • pp.815-829
    • /
    • 2010
  • 본 논문에서는 H.264/AVC의 성능향상을 위해 단방향 예측에 의한 $4{\times}4$ 인트라 부호화 방법을 제안한다. 최신의 동영상 압축 표준인 H.264/AVC에서는 $16{\times}16$$4{\times}4$ 인트라 예측 방법을 사용하고 있다. $4{\times}4$ 인트라 예측 방법은 예측 블록의 크기가 작기 때문에 $16{\times}16$ 예측 방법과 비교하여 상대적으로 복잡한 영역에서 보다 정밀한 예측이 가능하고, $16{\times}16$ 인트라 예측 방법은 $4{\times}4$ 예측 방법에 비해 상대적으로 큰 예측 블록을 사용하여 예측 방향정보를 적게 전송함으로써 평편한 영역에서 보다 높은 효율로 부호화할 수 있는 특징이 있다. 제안하는 방법은 매크로블록(Macroblock)을 부호화하기 위해 $4{\times}4$ 블록 단위로 예측하여 예측블록의 정밀도를 높이고, 동시에 모두 같은 방향으로 예측하여 예측 방향 정보를 줄임으로써 부호화 효율을 높이는 효과가 있다. 실험 결과, 제안하는 단방향의 $4{\times}4$ 인트라 예측 방법은 기존 H.264/AVC의 $16{\times}16$ 예측 방법과의 툴 단위 성능 비교에서 약 10.47% 정도의 비트 감소를 보인다. 또한, $16{\times}16$$4{\times}4$ 예측 방법을 모두 적용한 것과 두 가지 방법에 제안한 방법을 추가로 적용했을 때의 성능 비교에서는 평균적으로 약 1.57% 정도의 비트 감소가 있음을 확인할 수 있다.

JPEG2000 이미지에서 적응적 코드블록 판별 알고리즘을 이용한 동적 고속 관심영역 코딩 방법 (A Fast and Dynamic Region-of-Interest Coding Method using the Adaptive Code-Block Discrimination Algorithm in JPEG2000 Images)

  • 강기준;서영건;박재흥;유창열;박순화;이점숙;이부권
    • 정보처리학회논문지B
    • /
    • 제14B권5호
    • /
    • pp.321-328
    • /
    • 2007
  • 본 논문에서는 묵시적 ROI 코딩 방법과 수정된 묵시적 ROI 코딩 방법을 보완한 JPEG2000 이미지에서 적응적 코드블록 판별 알고리즘을 이용한 동적 고속 관심영역 코딩 방법을 제안한다. 제안한 방법에서는 코드 블록 판별 시간을 줄이기 위하여 ROI 모양의 특징을 고려하여 몇 가지의 경계 모양을 만들고, 이 모양 패턴으로 한정하여 코드블록 판별 알고리즘을 만들었다. 그리고 ROI 임계값과 배경 임계값을 이용하여 ROI 코드블록 내의 배경 웨이블릿 계수의 포함율에 따라 적응적인 코드블록 판별을 함으로서 ROI 코드블록 내의 배경 웨이블릿 계수의 우선적 처리와 손실 문제를 개선하였다. 또한 ROI 코드블록 내의 배경 웨이블릿 계수의 우선권 조절은 웨이블릿 계수 단위로 처리하는 기존의 방법과는 달리 패턴을 기반으로 하여 일괄처리를 함으로서 빠른 ROI 코딩이 가능하다. 제안한 방법의 유용성을 보이기 위해 기존의 방법들과 비교 실험한 결과, 제안한 방법이 기존의 방법들과 성능 평가에 있어서 큰 차이가 없으면서 처리 속도는 매우 빠름을 확인하였다.

통합 비디오 코덱을 위한 4×4/8×8 DCT와 양자화 회로의 고성능 구조 (High-Performance Architecture of 4×4/8×8 DCT and Quantization Circuit for Unified Video CODEC)

  • 이선영;조경순
    • 정보처리학회논문지A
    • /
    • 제18A권2호
    • /
    • pp.39-44
    • /
    • 2011
  • 본 논문은 통합 비디오 코덱에 적용할 수 있는 DCT와 양자화 회로에 대한 고성능 구조를 제안한다. 제안된 구조는 JPEG, MPEG-1/2/4, H.264, VC-1과 같은 동영상 압축 표준들에 사용되는 모든 변환과 양자화에 적용할 수 있다. 통합 DCT 회로 구조를 위해 8x8 DCT의 변환행렬을 재배치하는 순열행렬을 정의하였고 $4{\times}4$ DCT의 변환행렬과 통합하기 위해 $8{\times}8$ 변환행렬을 4개의 $4{\times}4$ 변환행렬로 나누었다. $8{\times}8$ DCT는 재배치와 분할된 변환행렬을 기반으로 $4{\times}4$ DCT 연산을 반복하여 수행된다. 구현된 회로는 사용자가 변환 계수를 입력하기 때문에 앞으로 등장할 어떤 종류의 DCT 변환에도 매우 쉽게 확장할 수 있다. DCT 회로의 곱셈기들은 회로 크기를 최소화하기 위해 양자화 회로에서 사용되는 곱셈기들과 공유하였다. 이때, 양자화 회로는 회로 구현에 필요한 자원과 처리 시간의 증가 없이 DCT 회로와 통합된다. 제안된 DCT와 양자화 회로는 RTL로 구현하였고 FPGA가 탑재된 보드에서 동작을 검증하였다.

FEF (Future Extension Frame) 다중화 기법을 이용한 지상파 단일 채널 고정 4K UHD & 이동 HD 융합방송 전송시스템 개발에 관한 연구 (A study of Development of Transmission Systems for Terrestrial Single Channel Fixed 4K UHD & Mobile HD Convergence Broadcasting by Employing FEF (Future Extension Frame) Multiplexing Technique)

  • 오종규;원용주;이진섭;김준태
    • 방송공학회논문지
    • /
    • 제20권2호
    • /
    • pp.310-339
    • /
    • 2015
  • UHDTV (Ultra High Definition TV)와 같은 실감의 대용량 방송과 방송망과 통신망을 결합한 융합방송 (Convergence Broadcasting)에 대한 연구가 세계적으로 활발히 진행되고 있다. 최근 DVB (Digital Video Broadcasting) - T2 (2nd Generation Terrestrial) 방송 전송 시스템에 채용된 Multiple-PLP (Physical layer Pipe) 다중화 및 전송 기법들과 최근 표준이 완료된 SHVC (Scalable High efficiency Video Coding) 영상 압축 기술을 채용하여, 지상파 단일 채널을 통해 4K UHD & HD 모바일 방송을 전송하는 전송시스템 개발에 관한 연구가 수행되었다. 하지만 Multiple-PLP 다중화 기법은 서로 다른 계층의 데이터를 각각 다른 채널 부호율과 변조 성상도를 적용하여 하나의 프레임을 통해서 전송할 수 있는 반면, 프레임 내의 OFDM (Orthogonal Frequency Division Multiplexing) 심벌의 크기나 보호구간의 크기는 달리할 수가 없다. 이에 본 논문에서는 다른 계층의 데이터의 FFT & 보호구간의 크기를 달리하여 전송할 수 있는 FEF (Future Extension Frame) 다중화 기법을 이용한 지상파 고정 4K UHD & 이동 HD 융합 방송의 전송 가능성 및 성능을 검증해 보았다. 이를 위해 DVB-T2 지상파 방송 전송 시스템에 채용된 전송 기법들과 FEF 다중화 기법을 적용한 지상파 단일 채널 고정 4K UHD & 이동 HD 융합방송 전송시스템의 구조들을 제안하였다. 이후에는 예측 분석한 SHVC 압축 후의 데이터 전송 요구량을 바탕으로, 제안한 융합방송 전송 시스템을 통해 6 MHz & 8 MHz 대역폭에서 두 계층의 데이터를 전송할 수 있는 최적의 전송 파라메터를 도출하고, 이에 따른 TOV (Threshold of Visibility)를 찾기 위해 AWGN (Additive White Gaussian Noise), 정적 Brazil-D, 그리고 TU (Typical Urban)-6 채널 하에서 수신 성능을 검증해 보았다. 그리고 이를 통해 6MHz 및 8MHz 대역폭에서 4K UHD & HD 계층의 데이터를 고정 수신 그리고 수신 속도가 매우 빠른 이동 환경에서 원활히 수신할 수 있음을 보였다.

H.264|MPEG-4 AVC 비디오 부호화에서 움직임 벡터 정보와 16~16 및 4X4 화면 내 예측 최종 모드간 통계적 연관성을 이용한 화면 간 프레임에서의 4X4 화면 내 예측 고속화 방법 (A Fast 4X4 Intra Prediction Method using Motion Vector Information and Statistical Mode Correlation between 16X16 and 4X4 Intra Prediction In H.264|MPEG-4 AVC)

  • 나태영;정윤식;김문철;함상진;박창섭;박근수
    • 방송공학회논문지
    • /
    • 제13권2호
    • /
    • pp.200-213
    • /
    • 2008
  • H.264|MPEG-4 AVC는 ITU-T와 ISO/IEC 공동으로 결성된 JVT (Joint Video Team)에 의해서 정의된 가장 최신의 영상 압축 표준이다. H.264|MPE6-4 AVC는 효율적 부호화를 위하여 여러 방법이 제안되었는데, 화면 간 프레임(P-frame)에서의 화면 내 예측(Intra Prediction)의 경우 매크로블록마다 후보 모드 결정 및 율-왜곡 비용 계산에 따른 부호화 시간의 급격한 증가를 초래하여 고속화 방법의 필요성이 대두되고 있다 본 논문에서는 $16{\times}16$$4{\times}4$ 화면 내 예측 부호화 결과를 바탕으로, 두 예측 결과의 통계적 상관관계를 규정한 후, 이를 활용한 $4{\times}4$ 화면 내 예측의 후보 모드 수를 감소시키는 방법을 제안한다. 구체적으로는 화면 간 예측(Inter Prediction) 단계에서 결정된 움직임 벡터 정보를 이용하여 현재 매크로블록의 화면 내 예측이 필요한지를 미리 판정한 후, 매 화면 내 프레임(I-frame)의 $16{\times}16$ 화면 내 예측의 최종 후보 모드에 따른 $4{\times}4$ 화면 내 예측의 최종 결정 모드들의 발생분포를 누적 확률 순으로 배열하여 특정 누적 확률에 도달하기까지 만의 후보 모드들만을 예측에 포함하는 참조 테이블을 부호화 과정 중에 생성한 후 동일 GOP 내에 위치하는 모든 화면 간 프레임의 화면 내 예측 시 활용하게 된다. 제안하는 방법은 H.264|MPEG-4 AVC의 참조 소프트웨어인 JM11.0을 사용하여 실험하였으며, 총 부호화 시간을 최대 51.24% 감소시킬 수 있었으며 PSNR 감소와 비트율 증가는 무시할 정도의 작은 변화만 있었다.