• 제목/요약/키워드: intra-frame

검색결과 151건 처리시간 0.027초

MPEG-2의 GOP 구조를 이용한 I 프레임의 시공간적 오류 은닉 (Spatio-Temporal Error Concealment of I-frame using GOP structure of MPEG-2)

  • 강민정;류철
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.72-82
    • /
    • 2004
  • 본 논문은 MPEG-2 인트라 (I) 프레임의 더욱 강화된 오류 은닉 기술을 제안한다. MPEG-2 소스 부호화 알고리즘은 가변장 부호화를 사용하기 때문에 채널 오류에 매우 민감하다. 채널에서 발생된 전송 오류는 오류 정정 기술을 사용하여 보정되지만 제대로 보정되지 않은 오류는 디코더에서 오류 은닉 기술을 사용함으로써 시각적 왜곡이 최소화될 수 있다. 또한 GOP의 시작 프레임인 I 프레임의 오류는 움직임 보상 예측 부호화 방식으로 인하여 다른 인터 프레임에 전달되어 더욱 심각한 화질 저하를 가져온다. 본 논문에서 제안하는 오류 은닉 방식은 I 프레임에 발생된 연속적인 슬라이스 오류를 인접한 인터 프레임의 시공간적 정보를 이용하여 기존 방식보다 효과적으로 처리하는 방식이다. 이 방식은 기존의 방식들이 갖는 시간적 그리고 공간적에서 발생하는 단점을 효율적으로 개선할 수 있으며, 전송 오류가 심한 망에서 발생되는 극심한 슬라이스 오류에서도 좋은 시각적 효과를 얻을수 있다. 알고리즘은 MPEG-2 비디오 코덱 범위에서 수행되었으며 모의실험을 통하여 제안된 방식이 다른 방식들보다 높은 PSNR과 개선된 시각적 효과를 확인할 수 있었다.

객체기반 비디오 편집 시스템을 위한 불확실 영역기반 사용자 지원 비디오 객체 분할 기법 (Uncertain Region Based User-Assisted Segmentation Technique for Object-Based Video Editing System)

  • 유홍연;홍성훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.529-541
    • /
    • 2006
  • 본 논문에서는 객체기반 비디오 부호화 또는 멀티미디어 편집을 위한 반지동 비디오 객체 분할방식을 제안한다. 반자동 객체분할은 사용자 지원에 의한 분할 방식으로, 비디오 시퀀스의 초기 프레임에서 사용자가 관심객체의 경계를 표시하고 이후의 영상 프레임의 객체를 배경으로부터 연속적으로 분리해 낸다. 제안된 방식은 부분적으로 사용자 조력에 의한 프레임내 분할과 완전 자동에 의한 프레임간 분할 처리과정으로 구성되는데, 영상 전체에 대해 연산을 수행하는 기존 방식과는 달리 객체 경계가 존재하는 영상영역 부분에서만 연산을 수행한다. 프레임내 분할은 사용자가 관심객체의 경계를 지정하고, 이 경계 주위 화소들의 유사성을 이용한 후처리에 의해 정확한 초기 객체를 구한다. 프레임간 분할에서는 이전 프레임에서 추출한 객체의 경계 정보에 근거하여 시간적 유사성을 구한 후 경계와 영역 추적에 의해 연속적으로 동영상 객체를 추출한다. 실험결과로부터 제안된 방식은 비디오 편집, 객체기반 비디오 압축 및 인덱싱 등의 멀미디어 응용에 사용 가능할 정도로 안정되고 정확한 객체추출을 수행함을 확인하였다. 이 결과를 바탕으로 다수의 편리한 기능을 포함한 비디오 편집시스템을 개발하였다.

  • PDF

HEVC기반의 디지털 워터마킹을 위한 인트라 예측의 분석 (Analysis of Intra Prediction for Digital Watermarking based on HEVC)

  • 서영호;김보라;김동욱
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1189-1198
    • /
    • 2015
  • 최근 디지털 방송기술의 비약적인 발전과 함께 초 고해상도 및 초 고화질 영상서비스에 관심이 높아지고 영상 서비스에 관한 수요가 늘어나고 있다. 따라서 기존의 Full HD 보다 4배 혹은 16배의 해상도가 크게 개선된 UHD나 Full HD를 지원하는 모바일 기기 등 영상기기의 보급이 이루어지고 있다. 이러한 큰 해상도의 콘텐츠가 보급이 됨에 따라 그에 해당하는 고효율의 비디오 압축 방법이 제시되고 있다. 따라서 새로운 압축방법에 적용할 수 있는 소유권/지적재산권 보호를 위한 워터마킹 기술 또한 필요하다. 본 논문에서는 새로운 압축 방법인 HEVC 기반의 재인코딩 과정시 인트라 프레임의 예측모드들을 분석하여 경향성을 분석해 HEVC 기반의 워터마킹 가능성 검토에 목적을 둔다. 인트라 프레임에서의 예측모드의 변화를 분석하고 나타나는 경향성의 분석을 통해 변화하지 않는 블록을 찾는 알고리즘을 제안한다.

H.264 부호화기를 위한 Intra-prediction & DCTQ Hardware 구조 (The Architecture of Intra-prediction & DCTQ Hardware for H.264 Encoder)

  • 서기범
    • 대한전자공학회논문지SD
    • /
    • 제47권5호
    • /
    • pp.1-9
    • /
    • 2010
  • 이 논문에서는, 풀 HD 영상을 실시간에 처리가능한 새로운 화면 내 예측 및 DCTQ 하드웨어구조를 제안한다. 화면내 예측,.$4{\times}4$ 을 처리하기 위한 예측과 변환, 양자화, 역양자화, 역변환및 복원의 전체 cycle 을 줄일 수 있는 방법을 제안한다. $4{\times}4$ 예측 부호화 cycle을 줄이기 위해, 양자화과정을 예측 사이클에서 적용할 수 있도록 하였으며, 회로의 크기를 줄이기 위하여 9가지 모드 중 2개의 모드를 먼저 선택하는 알고리듬을 사용하였다. 또한 $16{\times}16$ 예측과 $8{\times}8$ 예측 과정를 하나의 코어를 이용하여 설계하므로 크기를 줄였다. 제안된 구조는 108Mhz 클럭에서 full HD영상을 30frame/sec에서 동작하며, 한 매크로블록의 처리 cycle 은 425 cycle이다.

H.264/AVC 표준에서 역트리 구조를 이용하여 고속으로 화면내 모드를 결정하는 방법 (Fast Intra-Mode Decision for H.264/AVC using Inverse Tree-Structure)

  • 고현석;유기원;서정동;손광훈
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.310-318
    • /
    • 2008
  • H.264/AVC는 각 매크로블록에 대해서 최적의 부호화 모드와 참조 프레임을 결정해 주는 RDO (Rate-Distortion Optimization) 기법을 사용하여 기존의 비디오 압축 표준보다 더 좋은 부호화 효율을 얻고 있다. 하지만, RDO 기법은 하나의 매크로블록 모드를 결정할 때마다, 다양한 블록 타입의 화면내 (Intra) 예측을 수행하고 화면간 (Inter) 예측에 대해서도 1/4 화소까지 고려하는 움직임 추정(Motion Estimation)을 수행한 후 발생되는 비트까지 고려하여 최적의 모드를 결정하기 때문에 부호화기의 복잡도가 매우 큰 문제점이 있다. 따라서 영상의 객관적 화질은 유지하면서 부호화기의 복잡도를 낮추기 위한 많은 고속 알고리즘들이 제안되었고 연구 중에 있다. 본 논문에서는, 역 트리 구조의 경계 방향 예측 알고리즘을 이용한 고속 화면내 모드 결정 기법을 제안한다. 제안된 방법은 $4{\times}4$ 블록의 지역 경계 정보를 이용하여 해당 블록의 DE (Dominant Edge)를 찾아내고 DE에 상응하는 화면내 모드를 이용하여 RDO를 수행한다 $8{\times}8$ 블록 (또는 $16{\times}16$ 블록)의 DE는 이전 단계 4개의 $4{\times}4$ 블록 (또는 $8{\times}8$ 블록) DE들로부터 계산되고, 이 단계에서의 RDO 또한 DE에 상응하는 화면내 모드를 이용한다. 실험결과 제안 방법은 화면내 부호화에 사용되는 후보 모드의 수를 줄임으로써 JM12.2와 비교하여 화면내 부호화 시간을 평균 64% 단축시킬 수 있었다.

비디오 해상도 및 양자화 파라미터를 고려한 HEVC의 화면내 부호화 복잡도 감소 기법 (Scheme for Reducing HEVC Intra Coding Complexity Considering Video Resolution and Quantization Parameter)

  • 이홍래;서광덕
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.836-846
    • /
    • 2014
  • 최근 초고해상도(UHD: Ultra High Definition) 영상 서비스의 확산을 위하여 기존의 비디오 압축 기술인 H.264/AVC 대비 두 배이상의 압축 성능을 가지는 HEVC (High-Efficiency Video Codec)의 표준화가 완료되었다. 그러나 높은 압축 효과를 얻기 위하여 복잡한 연산이 필요한 기법들이 많이 도입되어 HEVC의 부호화 복잡도는 H.264/AVC보다 크게 증가되었다. 예로써 HEVC의 화면내 예측 부호화는 예측 모드을 최대 35개까지 확장함으로써 기존 H.264/AVC에 비해서 향상된 부호화 효율을 갖지만 화면내 부호화의 복잡도는 크게 증가되어 복잡도 감소 기법이 필요하다. 본 논문은 화면내 예측 부호화에 사용되는 예측 모드 35가지를 비디오 해상도와 양자화 파라미터 크기를 고려하여 4개의 세트로 분류하고 비디오 해상도에 따른 PU (Prediction Unit)의 크기의 점유율에 따라 예측 모드 개수를 변경함으로써 계산 복잡도를 감소시키는 기법을 제안한다. 실험 결과를 통해 제안된 기법을 적용함으로써 대략 2%의 BD-rate 증가로 부호화 시간을 7% 가량 감소시킬 수 있음을 확인하였다.

Intra-and Inter-frame Features for Automatic Speech Recognition

  • Lee, Sung Joo;Kang, Byung Ok;Chung, Hoon;Lee, Yunkeun
    • ETRI Journal
    • /
    • 제36권3호
    • /
    • pp.514-517
    • /
    • 2014
  • In this paper, alternative dynamic features for speech recognition are proposed. The goal of this work is to improve speech recognition accuracy by deriving the representation of distinctive dynamic characteristics from a speech spectrum. This work was inspired by two temporal dynamics of a speech signal. One is the highly non-stationary nature of speech, and the other is the inter-frame change of a speech spectrum. We adopt the use of a sub-frame spectrum analyzer to capture very rapid spectral changes within a speech analysis frame. In addition, we attempt to measure spectral fluctuations of a more complex manner as opposed to traditional dynamic features such as delta or double-delta. To evaluate the proposed features, speech recognition tests over smartphone environments were conducted. The experimental results show that the feature streams simply combined with the proposed features are effective for an improvement in the recognition accuracy of a hidden Markov model-based speech recognizer.

무선 채널의 비트 에러에 강한 웨이블릿 비디오 코딩 기법 (A Bit-Error Resilient Wavelet Video Coding Scheme in Wireless Channels)

  • 이주경;정기동
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권6호
    • /
    • pp.695-704
    • /
    • 2003
  • 웨이블릿 기반 비디오는 DCT 기반 비디오에 비해 전송오류에 더 민감하다. 즉, 어떤 프레임의 부대역에 오류가 발생하면 같은 프레임의 다른 부대역뿐 아니라 그 프레임을 참조하는 이후 프레임의 복원에도 영향을 주어 비디오의 화질이 감소하게 된다. 본 논문에서는 프레임 간 참조를 수행하는 웨이블릿 비디오의 오류 전파를 줄이기 위해 프레임 내 참조 기법을 제안한다. 제안된 기법에서는 LL 부대역을 제외한 나머지 부대역에서 같은 프레임의 하위 부대역을 참조하여 다른 프레임으로의 오류전파를 줄인다. 무선 채널에서의 비트 에러 패턴을 이용하여 모의실험을 수행한 결과 화면의 움직임이 빠른 비디오에서는 제안된 기법의 성능이 압축율에 관계없이 우수하였으며 화면의 움직임이 거의 없는 비디오에서는 비트율이 높은 경우에 성능이 높은 것으로 나타났다.

정지영상/동영상에서 non-rigid object의 효율적인 영역 분할 방식에 관한 연구 (Effective segmentation of non-rigid object in a still picture and video sequences)

  • 이인재;김용호;김중규;이명호;안치득
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.17-31
    • /
    • 2002
  • 멀티미디어 표준안으로 제안된 MPEG-4는 객체기반 부호화 방식으로서, 객체를 효율적으로 분할하는 것은 MPEG-4에 있어 중요한 관건이다. 지금까지 이 분야에 대한 연구는 주로 rigid object를 대상으로 하였으나, 본 논문에서는 non-rigid object, 특히 구름이나 연기와 같은 non-rigid object를 대상으로 하여 효율적인 영역 분할 방식을 연구하였다. Non-rigid object는 모양이나 크기가 일정치 않으며 시간에 따라 형태도 변형되므로 정확히 분할해내는 것은 쉽지 않다. 따라서 본 논문에서는 이를 효율적으로 극복하기 위해 정지 영상에서는 watershed 알고리즘을 사용하여 non-rigid object를 분할해 주었다. 그리고 동영상에서는 intra-frame segmentation과 inter-frame segmentation을 통해 연속되는 프레임 내 관심 있는 객체의 경계선을 자동으로 추출해 주었다. 이 때 영상 내 경계 정보와 영역 정보 각각에 가중치를 두어 원하는 객체를 보다 정확히 추출해 주었다.

변환영역에서의 에지활동도에 기반한 H.264/AVC 고속 인트라모드 선택 방법 (Fast Intra Mode Selection Algorithm Based on Edge Activity in Transform Domain for H.264/AVC Video)

  • 서재성;김동형
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.790-800
    • /
    • 2009
  • H.264/AVC 부호화 표준은 부호화 효율을 높이기 위해 1/4 화소 단위의 움직임 추정, 다중 참조 프레임, 인트라 예측, 루프 필터, 다양한 블록 크기의 지원 등과 같은 새로운 부호화 도구들을 사용한다. 이를 통해 이전의 비디오 부호화 표준들에 비해 율-왜곡(率-歪曲) 관점에서 높은 성능을 보이지만 그로 인해 부호기의 복잡도는 크게 증가하였다. 본 논문은 부호기 복잡도의 증가를 초래하는 주요 부호화 도구들 중 인트라 매크로블록 모드 선택의 복잡도 감소에 주안(主眼)점을 두며, 이에 대한 복잡도 감소 알고리즘을 제시한다. 고속 인트라 모드 선택을 위한 제안하는 방법은 변환 영역에서 에지 활동도를 산출효과 이를 이용하여 intra4x4 및 색차블록에 대한 예측모드를 고속으로 선택함으로써 H.264/AVC 인트라프레임에 대한 고속 부호화를 수행한다. 실험 결과 제안하는 알고리즘은 참조소프트웨어와 비교하여 QCIF 및 CIF 영상에 대해서 각각 59.76% 및 65.03%의 속도향상을 가져오는 반면 비트율 증가 및 PSNR 감소는 매우 미미한 것으로 나타났다.