• 제목/요약/키워드: Intra Coding

검색결과 340건 처리시간 0.025초

채널 간 선택적 참조 라인 공유 방법 (Selective Reference Line Sharing for Chroma Intra Prediction)

  • 이유진;박지윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.197-198
    • /
    • 2022
  • Versatile Video Coding (VVC)는 차세대 동영상 압축 표준화 과정에서 다수의 부호화 기술을 새롭게 채택하였는데, 이중 Multiple Reference Lines (MRL)을 포함한 일부 기술은 휘도 채널에만 적용될 수 있으며 색차 성분에 대해서는 적용이 고려되지 않는다. 본 논문은 VVC 에서 휘도 채널에만 적용되는 MRL 기술을 색차 채널로 확장하기 위하여, DM(Derived Mode)을 사용하는 색차 블록의 대응 휘도 블록이 MRL 을 사용하는 경우에 해당 참조 라인을 선택적으로 공유하여 색차 블록이 화면 내 예측에 복수개의 참조 라인을 고려하여 선택할 수 있도록 하는 방법을 제안한다. 실험 결과, VVC Test Model (VTM) 15.0 대비 Cb, Cr 성분 각각 -0.09%, -0.05%의 성능 향상을 보인다.

  • PDF

적응적 인트라 프레임 압축을 위한 최적 QP 결정 방법 (Optimal QP Determination Method for Adaptive Intra Frame Encoding)

  • 박상현
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1009-1018
    • /
    • 2015
  • 영상 압축에서 GOP의 첫 번째 프레임은 많은 비트를 발생시키는 인트라 모드로 압축되며, 다음 프레임의 인터 모드 압축에도 사용되기 때문에 첫 번째 프레임 압축에 사용되는 초기 QP 값은 첫 프레임뿐만 아니라 이후 프레임에도 영향을 주게 된다. 영상의 특성을 반영하여 전체 GOP의 품질을 최대로 하는 초기 QP 값을 결정하기 위하여 I 프레임과 P 프레임의 PSNR 비율을 이용하는 방법이 제안되었다. 본 논문에서는 PSNR 비율을 이용하는 방법에서 초기 QP를 쉽고 정확하게 결정하기 위한 트래픽 모델을 제안한다. 먼저 I 프레임과 P 프레임의 PSNR 비율과 GOP의 PSNR 사이의 관계에 대한 특성을 분석하여, 이 특성을 반영하는 모델을 제시하고 이를 이용한 초기 QP값을 결정한다. 실험 결과는 제안하는 방법을 이용한 초기 QP 결정 방법이 기존의 JVT 알고리즘에 비해 정확하게 최적의 초기 QP 값의 ${\pm}2$ 범위 내에서 초기 QP값을 예측하고 PSNR 성능도 더 우수함을 보여준다.

정지영상/동영상에서 non-rigid object의 효율적인 영역 분할 방식에 관한 연구 (Effective segmentation of non-rigid object in a still picture and video sequences)

  • 이인재;김용호;김중규;이명호;안치득
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.17-31
    • /
    • 2002
  • 멀티미디어 표준안으로 제안된 MPEG-4는 객체기반 부호화 방식으로서, 객체를 효율적으로 분할하는 것은 MPEG-4에 있어 중요한 관건이다. 지금까지 이 분야에 대한 연구는 주로 rigid object를 대상으로 하였으나, 본 논문에서는 non-rigid object, 특히 구름이나 연기와 같은 non-rigid object를 대상으로 하여 효율적인 영역 분할 방식을 연구하였다. Non-rigid object는 모양이나 크기가 일정치 않으며 시간에 따라 형태도 변형되므로 정확히 분할해내는 것은 쉽지 않다. 따라서 본 논문에서는 이를 효율적으로 극복하기 위해 정지 영상에서는 watershed 알고리즘을 사용하여 non-rigid object를 분할해 주었다. 그리고 동영상에서는 intra-frame segmentation과 inter-frame segmentation을 통해 연속되는 프레임 내 관심 있는 객체의 경계선을 자동으로 추출해 주었다. 이 때 영상 내 경계 정보와 영역 정보 각각에 가중치를 두어 원하는 객체를 보다 정확히 추출해 주었다.

H.264/AVC의 $4{\times}4$ DCT기반 워터마크에 따른 영상왜곡과 비트율 변화에 대한 연구 (Study on Image Distortions and Bit-rate Changes Induced by Watermark based-on $4{\times}4$ DCT of H.264/AVC)

  • 김성민;원치선
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.115-122
    • /
    • 2005
  • 지금까지 적용되었던 MPEG(Motion Picture Expert Group)기반의 워터마크(watermark) 기법들은 새로운 압축 표준 H.264/AVC의 달라진 부호화 방식으로 인하여 H.264/AVC에 그대로 적용되기에는 많은 문제점을 가지고 있다. 본 논문에서는 이전의 압축표준에 사용되었던 DCT(Discrete Cosine Transform)기반의 워터마크 기법이 H.264/AVC에 적용 되었을 때 발생 할 수 있는 문제를 분석하였으며, 그 결과를 영상왜곡 및 비트율(bit-rate) 변화의 측면에서 연구 하였다. 기존의 MPEG-2 사용 되었던 DCT기반 워터마크 기법들이 H.264/AVC에 적용되었을 때 H.264/AVC 부호화의 큰 특징인 인트라(intra) 부호화 및 CAVLC(Context Adaptive Variable Length Coding)의 영향으로 인하여 PSNR은 모든 QP(Quantization Parameter)에 대하여 평균 28.17 dB 감소 되었으며, 비트율은 모든 QP에 대하여 평균 56.71 % 증가 하였다.

보조정보의 움직임 벡터를 이용한 분산 비디오 코딩에서 H.264/AVC로의 트랜스코딩 (Transcoding from Distributed Video Coding to H.264/AVC Based on Motion Vectors of Side Information)

  • 민경연;유성은;심동규;전병우
    • 방송공학회논문지
    • /
    • 제16권1호
    • /
    • pp.108-122
    • /
    • 2011
  • 본 논문은 저복잡도 및 고효율 분산 비디오 코딩에서 H.264/AVC로의 변환을 위한 트랜스코딩 방법을 제안한다. 제안한 방법은 낮은 복잡도로 높은 부호화 성능을 유지하기 위하여, 보조정보 생성을 위하여 측정된 움직임 벡터를 Wyner-Ziv (WZ) 프레임뿐만 아니라 키 프레임에서도 적용하여 부화화를 수행한다. 보조정보 생성을 위하여 측정된 움직임 벡터는 키 프레임에서 이전의 키 프레임으로의 움직임 추정에 의해 결정된 움직임 벡터임으로, 이 움직임 벡터를 이용하여 인트라 키 프레임을 예측 프레임으로 변환압축하는 방법을 제안한다. 또한, 제안한 방법은 두 예측 움직임 벡터를 기반으로 측정된 두 움직임 벡터 중, 비트율-왜곡 최적화를 수행하여 최적의 움직임 벡터를 선택한다. 보조정보의 움직임 벡터는 보조정보를 생성하기 위하여 수행된 움직임 추정을 통하여 측정된 움직임 벡터임으로, 적은 탐색 영역을 적용하여도 높은 부호화 효율을 얻을 수 있다. 따라서, 제안한 방법은 예측 움직임 벡터와 보조정보 기반의 예측 움직임 벡터로 적용하여 적은 탐색 영역에서 움직임 추정을 수행함으로써, 저복잡도로 높은 부호화 효율을 가질 수 있다. 실험결과는 기존 변환 방법과 대비하여, 트랜스코더의 복잡도가 2.82%로 감소하고 비트율 성능은 23.06% 상향되었다.

다차원 DCT를 이용한 비디오 부호화기 설계 (Design of video encoder using Multi-dimensional DCT)

  • 전수열;최우진;오승준;정세윤;최진수;문경애;홍진우;안창범
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.732-743
    • /
    • 2008
  • 본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.

HEVC 부호화기 고효율 압축을 위한 인지시각 특징기반 양자화 방법 (Human Visual Perception-Based Quantization For Efficiency HEVC Encoder)

  • 김영웅;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.28-41
    • /
    • 2017
  • 본 논문에서는 사람의 인지특성을 기반으로 대조 민감도에 의해 나타나는 특성을 모델링 한 JND (Just Noticeable Difference) 모델을 비디오 코딩에 적용하여 압축률을 높이는 방법을 제안한다. 제안하는 방법은 JND 모델에 따른 임계치를 기준으로 양자화 단계에서 비가시 신호를 제한하여 주관적 화질을 유지하면서 비트율을 낮추는 방법으로, 변환을 통해 주파수 도메인으로 변환된 잔차 신호들을 양자화 단계에서 입력으로 받아 신호제한 및 양자화를 수행한다. 양자화 단계에서 주파수 도메인의 신호가 JND 관점에서 유사하게 인지되는 기준 임계치를 구해 잔차 신호에서 비가시 신호를 제한하고 양자화를 수행한 후, 최적의 율-인지왜곡 비용을 갖는 양자화 계수를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증은 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 적용했으며, CTC (Common Test Condition)의 Random Access 모드에서 HM 16.0을 통해 압축된 영상 대비 평균 4.11%, BQTerrace 영상의 양자화 파라미터 22에서 최대 17.22%의 비트율 절감을 보였으며, Low Delay 모드에서 평균 7.16%, 최대 22.55%, All intra 모드에서 평균 13.41%, 최대 21.64%의 비트율 절감을 보였다. 5명의 평가자들의 주관적 화질 측정으로 평균 DMOS (Difference Mean Opinion Score) 값은 최대 약 0.36 최소 0 정도의 분포를 보였다.

기준선 기반 이진 형상 부호화기 (Baseline based Binary Shape Coder)

  • 이시화;조대성;조유신;손세훈;장의선;신재섭;서양석
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.114-124
    • /
    • 1997
  • 이진 영상 부호화는 종래의 영상 처리에 객체 기반 처리 기능을 제공한다. 이진 영상 부호화를 위하여 본 논문에서는 기준선을 기반으로 하는 새로운 이진 영상 부호화 방식을 제안한다. 종래 이진 부호화기와 달리 본 방식은 객체의 외곽선을 추적하면서2차원의 영상 데이터를 1차원으로 변환하여 이를 부호화한다. 추출되는 데이터는 기준선의 시작점과 거리값 리스트 그리고 변환값 리스트이다. 무손실 부호화에서 이들은 모두 부호화되나 손실 부호화에서는 가변 샘플링을 통하여 구간별로 비슷한 손실정도를 갖도록 조정이 되어 선택된 거리값들 만이 부호화 된다. 또한 프레임간의 움직임 보상에서도 거리값과 변환값을 이용하여 빠른 처리 속도를 갖도록 하였다. 실험결과 현재 MPEG-4 잠정표준안에 채택되어 있는 CAE방식에 비하여 객관적 평가에서는 정지영상부호화(intra 모드)에서는 앞서며, 동영상부호화(inter 모드)에서는 떨어지고 있다. 그러나 주관적인 평가에서는 두 경우 모두 좋은 것으로 평가받고 있다.

  • PDF

인터 프레임의 시공간적 정보를 이용한 MPEG-2 인트라 프레임의 오류 은닉 (Error Concealment of MPEG-2 Intra Frames by Spatiotemporal Information of Inter Frames)

  • 강민정;류철
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.31-39
    • /
    • 2003
  • MPEG-2 소스 부호화 알고리즘은 가변장 부호화를 사용하기 때문에 채널 오류에 매우 민감하다. 압축 데이터가 전송되는 동안 비트 오류가 발생하게 되고, 이 오류를 정정 기술로 보정할 수 없는 경우 디코더에서는 오류 은닉 방식을 사용함으로써 영상의 화질 저하를 최소화할 수 있다. 본 논문에서 제안하는 알고리즘은 I 프레임의 연속적인 매크로블록 오류를 은닉하기 위한 방식으로 I 프레임과 시간적으로 가장 가까이 위치한 이전 GOP의 B 프레임의 시간적 정보와 P 프레임의 공간적 정보를 이용한다. 이 방식은 기존의 오류 은닉 방식들이 갖는 시간적 오류에 의한 움직임 왜곡과 공간적 오류에 의한 번짐 현상을 개선할 수 있으며, 전송 오류가 매우 심한 망에서의 심각한 슬라이스 오류를 보다 효과적으로 은닉할 수 있다. 알고리즘은 MPEG-2 비디오 코덱에서 수행되었고 모의 실험을 통하여 다른 방식들에 비하여 I 프레임의 슬라이스 오류를 효율적으로 은닉할 수 있음을 증명한다.

  • PDF

패킷 손실이 발생하는 네트워크 환경에서의 H.264의 FMO 성능분석과 비교에 관한 연구 (H.264의 FMO Performance Evaluation and Comparison over Packet-Lossy Networks)

  • 김원정;임혜숙;임창훈
    • 한국통신학회논문지
    • /
    • 제31권5C호
    • /
    • pp.490-496
    • /
    • 2006
  • H.264는 현재 IP를 기반으로 하는 유무선 네트워크분야에서 많은 관심을 받고 있는 표준으로서 기존에 제정된 비디오 표준들보다 향상된 에러 복구 기술들을 포함하고 있다. 본 논문에서는 기존의 비디오 표준에서 사용되어 오던 raster scan 방식과 H.264의 에러 복구 기술들 중 하나인 FMO (flexible macroblock ordering) 방식에 에러 은닉 기술을 적용하여 에러 은닉의 성능이 정확히 온 인접한 매크로블락 수에 따라 좌우됨을 분석하고, 다양한 패킷 손실율에서의 성능을 보인다. 시뮬레이션 결과, FMO 방식이 raster scan 방식에 비해 손실없이 오는 인접한 매크로블락 수가 많아 에러 은닉에 의한 PSNR 성능이 $1{\sim}9dB$ 정도 향상되고, 특히 인트라 프레임 간격이 길고 패킷 손실율이 높은 경우에 FMO 방식에 의한 PSNR 성능 향상이 더 크다.