• 제목/요약/키워드: VIDEO ENCODER

검색결과 447건 처리시간 0.023초

VVC 인코더에서 합성 곱 신경망의 어텐션 맵을 이용한 휘도 매핑 함수 생성 방법 (Luma Mapping Function Generation Method Using Attention Map of Convolutional Neural Network in Versatile Video Coding Encoder)

  • 권나성;이종석;변주형;심동규
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.441-452
    • /
    • 2021
  • 본 논문에서는 VVC의 LMCS에서 휘도 신호 매핑 방법의 부호화 효율을 향상시키기 위한 휘도 신호 매핑 함수 생성 방법을 제안한다. 본 논문에서 제안하는 방법은 기존 LMCS에서 지역적 특징을 반영하기 위하여 사용하는 지역적 공간 분산에 합성 곱 신경망의 어텐션 맵을 곱하여 인지 지각적 특징을 추가적으로 반영한다. 제안하는 방법의 성능 평가를 위하여 AI (All Intra) 조건에서 VVC 표준 실험 영상의 A1, A2, B, C, D 클래스를 이용하여 VTM-12.0과 BD-rate 성능을 비교한다. 실험 결과로서 본 논문에서 제안하는 방법이 VTM-12.0 대비 BD-rate 성능 관점에서 휘도 성분이 평균 -0.07%의 성능 향상을 보이고, 부/복호화 시간은 거의 동일하다.

패리티 요구량 예측을 이용한 적응적 경판정 출력 기반 고속 분산 비디오 복호화 기술 (Adaptive Hard Decision Aided Fast Decoding Method using Parity Request Estimation in Distributed Video Coding)

  • 심혁재;오양근;전병우
    • 방송공학회논문지
    • /
    • 제16권4호
    • /
    • pp.635-646
    • /
    • 2011
  • 분산 비디오 압축 기술은 부호화기의 복잡한 과정을 복호화기로 이동시킴으로써 저복잡도 부호화기를 가능하게 한다. 하지만 WZ 복호화기는 움직임 예측/보상 과정뿐만 아니라 채널 복호 과정까지 수행하기 때문에 복호화 과정의 높은 복잡도가 문제점으로 지적되고 있다. LDPC 부호의 복호화는 상당히 반복적인 과정으로 수행되기 때문에 그 수행 횟수만큼 복잡도가 늘어나는데, 실제로 이러한 반복적인 복호 과정은 전체 WZ 복호화 복잡도의 60% 이상을 차지하고 있기 때문에 복잡도 절감의 주요 대상이다. 따라서 이러한 복잡도 절감을 위해 과거에 HDA(Hard Decision Aided) 방법을 적용하는 방법이 제안되었다. HDA 방법은 해당 패리티에 대한 복호 과정의 복잡도를 상당량 줄여주지만, 채널 복호가 성공하기에 부족한 패리티량에 대해서도 여전히 복호 과정을 수행하는 문제점을 가지고 있다. 따라서 이러한 소모적인 과정을 줄임으로써 추가적인 복잡도 절감 효과를 얻을 수 있다. 이에 본 논문에서는 비트 플레인 간의 상관도와 시간적 상관도에 기반하여 최소 연산으로 패리티 요구량을 예측하는 방법을 제안한다. 제안 방법과 HDA 방법을 함께 적용할 경우 채널 복호 과정에서는 평균 72% 정도의 고속 복호가 가능하며, 저하되는 율 왜곡 성능은 -0.0275 dB (BDPSNR) 정도로상당히 낮다.

초저복잡도 H.264 부호기의 움직임 추정 및 모드 결정 알고리즘 (Motion Estimation and Mode Decision Algorithm for Very Low-complexity H.264/AVC Video Encoder)

  • 유영일;김용태;이승준;강동욱;김기두
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.528-539
    • /
    • 2005
  • H.264는 우수한 부호화 성능으로 말미암아 DMB 차세대 DVD 등 새로운 멀티미디어 서비스를 위한 비디오 코덱으로 채택되어 왔다. 그러나 이 표준의 표준 코덱인 Joint Model(JM)은 연산 자원이 한정된 임베디드 환경에서 사용되기에는 너무 복잡한 다수의 알고리즘을 포함하고 있다. 본 논문은 임베디드 환경에서 사용할 수 있도록 설계된 초저복잡도 H.264 부호화 알고리즘을 제시한다. 제안하는 알고리즘은 압축 성능의 급격한 악화를 가져오지 않는 범위 내에서 몇 가지 부호화 도구의 사용을 제한하고, 또 움직임 추정과 모드 결정 과정에 몇 가지의 조기 종료 조건과 우회 조건을 추가하는 방법으로 구현하였다. 제안하는 알고리즘을 사용하여 7.5fps QCIF 영상을 64kbps로 부호화하는 경우, 표준 JM에 비해서 평균적으로 0.4 dB 정도의 미약한 PSNR 열화를 나타냄에도 불구하고, 단지 $15\%$의 계산량만을 필요로 할 뿐만 아니라, 필요한 메모리의 양과 전력 사용률을 획기적으로 낮추는 것이 가능하다. 제안하는 알고리즘의 H.264 부호기를 Intel PXA255 Processor를 사용하는 PDA에 이식하는 실험을 통하여 PDA에서 H.264 기반의 MMS(Multimedia Messaging Service)의 실현 가능성을 검증하였다.

선형 관계를 이용한 H.264/MPEG-4 AVC 비트율 제어 방법 (Rate Control based on linear relation for H.264/MPEG-4 AVC)

  • 나형율;임성창;이영렬
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.27-38
    • /
    • 2006
  • 제한된 채널 대역폭이나, 저장 공간의 한계가 있는 경우 일정한 화질의 영상을 얻기 위해서는 영상의 움직임, 화면전환, 버퍼 용량, 채널 대역폭등의 변화에 순간, 순간 적응할 수 있는 비트율 제어 방법이 필요하다. 각 프레임마다 목표한 비트수를 얼마나 정확하게 예측할 수 있는지, 또는 버퍼에 의한 영상 지연 시간을 얼마나 짧게 할 수 있는지 등이, 효율적인 부호화기를 구성하는데 필요한 기술들이다. 따라서 본 논문에서는 비디오 부호화기에서 찾을 수 있는 여러 가지 선형 관계를 이용하여 위의 요구 조건을 만족하는 비트율 제어 방법을 제안한다. 제안된 방법에서는 3가지의 선형 관계에 대해서 설명을 한다. 첫 번째로, 비트수(R)와 양자화 된 변환 계수 중 Zero의 비율(p)과의 관계. 두 번째, PSNR과 양자화변수(QP) 사이의 관계, 그리고 마지막으로 QP와 p에서의 선형적 특성을 찾을 수 있었다. 제안된 비트율 제어 방법과 H.264/MPEG-4 AVC JM9.3의 비트율 제어 방법을 비교 실험하여 본 결과, 제안된 방법에서 정확한 비트수 예측, 낮은 버퍼 충만도, 높은 PSNR을 관찰 할 수 있었다.

HEVC 부호화기의 적응적 참조 구조 변경 방법 (Adaptive Reference Structure Decision Method for HEVC Encoder)

  • 목정수;김재련;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.1-14
    • /
    • 2017
  • 본 논문에서는 HEVC (High Efficiency Video Coding) 부호화기의 성능 향상을 위한 적응적 참조 구조 변경 방법을 제안한다. 제안하는 방법은 입력 영상 내에 장면 전환, 장면 회전, Light on/off, Fade in/out 등의 이벤트 발생 시 저하되는 화면 간 예측의 성능을 향상시키기 위해 참조 픽쳐 리스트를 수정하여 참조 구조를 변경한다. GOP (Group Of Pictures) 단위로 한정된 계층적 참조 구조에서 영상 이벤트가 발생한 픽쳐를 기준으로 두 개의 서브 그룹으로 분할하고 각각의 서브 그룹 내에서 참조 픽쳐를 결정한다. 이를 통해, 시간적 중복성이 높은 참조 픽쳐를 화면 간 예측에서 사용하여 부호화 효율을 향상시킨다. 또한, HEVC의 계층적 부호화 구조 특징을 이용하여 이벤트 발생 후 처음으로 부호화되는 픽쳐를 CRA (Clean Random Access) 픽쳐로 변경하여 부호화 속도를 향상시키는 방법을 제안한다. 제안하는 방법은 이벤트 발생 후 처음으로 부호화되는 프레임은 화면 내 예측이 매우 높은 확률로 선택된다는 통계적 특징을 기반으로 화면 간 예측을 수행하지 않는다. 실험 결과 본 논문에서 제안하는 적응적 참조 구조 변경 방법은 HM 16.0 대비 CTC (Common Test Condition)에서 평균 0.3%의 BD-rate를 개선하였으며 부호화 속도는 평균 4.9% 향상시켰다. 또한, 이벤트 발생에 따른 픽쳐 타입 변경 방법은 평균 0.11%의 BD-rate 저하가 있었지만 부호화 속도를 평균 12.2% 향상시킬 수 있었다.

적응적 탐색 영역을 이용한 보조 정보 생성의 고속화 방법 (Fast Side Information Generation Method using Adaptive Search Range)

  • 박대윤;심혁재;전병우
    • 방송공학회논문지
    • /
    • 제17권1호
    • /
    • pp.179-190
    • /
    • 2012
  • 분산 비디오 압축(DVC, Distributed Video Coding) 기술은 부호화기의 움직임 추정과 같은 복잡한 과정을 복호화기로 이동시킴으로써 경량화 비디오 부호화를 가능하게 하는 새로운 방법으로 주목 받고 있다. 한편, DVC 복호화기에서는 움직임 추정과 보상 과정뿐만 아니라 채널 복호 과정도 수행해야 하기 때문에 복호화기의 복잡도는 크게 증가하게 된다. 이에 복호화기 복잡도의 가장 많은 비중을 차지하는 채널 복호 과정을 고속화하기 위한 다양한 방법이 제안되고 있다. 하지만 다양한 고속화 방법에 의해 채널 복호 과정이 고속화될수록 채널 복호화 이외의 과정들에 대한 복잡도가 부각되는데, 일례로 DVC 복호화기에서 낮은 비율을 차지하던 보조 정보생성 과정의 복잡도가 상대적으로 증가된다. 따라서 본 논문에서는 보조 정보 생성 과정에 적응적 탐색 영역 방법을 적용하여 DVC 복호 과정을 고속화할 수 있는 알고리즘을 제안한다. 제안된 적응적 탐색 영역을 이용하는 방법을 적용할 경우 고정된 탐색 영역을 적용한 종래의 방법에 비해 평균적으로 보조 정보 생성 시간의 63% 정도가 절감 가능하며, 저하되는 율 왜곡 성능은 약 0.17%(BDBR) 정도로 상당히 낮다.

H.264/AVC용 가변 블록 크기를 지원하는 움직임 추정 부호기의 연구 (A Study on Motion Estimation Encoder Supporting Variable Block Size for H.264/AVC)

  • 김원삼;손승일
    • 한국정보통신학회논문지
    • /
    • 제12권10호
    • /
    • pp.1845-1852
    • /
    • 2008
  • 인터 예측의 핵심 요소는 ME와 MC이다. ME는 SAD(Sum of Absolute Difference)와 같은 정합기준을 사용하는 것뿐만 아니라 비트스트림의 최종 비트수에 따라서 최적의 움직임 벡터를 찾는다. 인터 예측부호화는 고화질의 실시간 비디오 응용에 있어서 언제나 주된 병목을 초래한다. 따라서 실시간 비디오 응용에서는 인터 예측을 수행하는 고속의 전용 하드웨어를 필요로 한다. 본 논문에서는 H.264/AVC의 움직임 추정기를 연구하였다. 설계된 움직임 추정기는 2-D 시스토릭 배열 기반으로 기본 처리기 요소를 병렬로 연결하여 SAD 값을 빠르게 계산한다. 참조데이터를 상위영역과 하위영역으로 나누어 각각의 연결선을 두고 입력 시퀀스를 조절하여 파이프라인 중지 없이 연속적인 연산을 수행한다. 데이터 재사용 기법을 통하여 메모리 엑세스를 줄였고 특별한 지연 없이 최소의 SAD를 갖는 파티션을 찾아내어 움직임 벡터를 생성하게 하였다. 설계된 움직임 추정기는 가변 블록 크기를 지원하며 하나의 매크로블록의 연산을 하는데 328 사이클이 소요된다. 논문 [6]이 로컬메모리를 사용하는 것과 달리, 본 논문은 로컬메모리를 사용하지 않는다.

주파수 적응 채널 잡음 모델링에 기반한 변환영역 Wyner-Ziv 부호화 방법 (Transform domain Wyner-Ziv Coding based on the frequency-adaptive channel noise modeling)

  • 김병희;고봉혁;전병우
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.144-153
    • /
    • 2009
  • 최근, 사용자 제작 콘텐츠(UCC: User Created Contents) 또는 다시점 비디오(Multiview Video) 등의 응용을 위한 경량화 부호화 기술의 필요성이 대두됨에 따라 비디오 부호화 복잡도의 대부분을 차지하는 움직임 예측/보상 과정을 부호화기가 아닌 복호화기 측에서 수행하는 분산 비디오 부호화 기술(Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있다. Wyner-Ziv 부호화 기술은 채널 코딩을 이용하여 원본 영상에 대한 복호화기 측의 예측영상인 보조정보에 포함된 잡음을 제거함으로써 영상을 복원하는 구조를 가진다. 일반적인 Wyner-Ziv 부호화 기술은 키 프레임 간의 움직임 예측/보상 과정에 기반한 프레임 보간법을 통해 보조정보를 생성하며, Shannon limit에 근접한 성능을 보이는 Turbo 코드나 LDPC 코드를 통해 잡음을 제거한다. Wyner-Ziv 부호화 기술은 채널 코드의 복호화를 위해 보조정보에 포함된 잡음의 정도를 예측하는데, 이를 '가상 채널 잡음(Virtual Channel Noise)'이라 하며 일반적으로 Laplacian이나 Gaussian으로 모델화 한다. 본 논문은 변환영역에서의 주파수 단위에 적응적인 채널 잡음 모델링에 기반한 Wyner-Ziv 부호화 방법을 제안한다. 다양한 영상에 대한 제안 방법의 실험 결과는 기존 방법과 비교하여 최대 약 0.52dB에 해당하는 율-왜곡 성능의 향상을 보여준다.

Overlapping method와 SPIHT Algorithm과 Lifting Steps을 이용한 3차원 손실 의료 영상 압축 방법 (3-D Lossy Volumetric Medical Image Compression with Overlapping method and SPIHT Algorithm and Lifting Steps)

  • 김영섭
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.263-269
    • /
    • 2003
  • 이 논문은 3차원 정수 웨이브릿 변환을 이용한 손실 의료 영상 압축에 대한 방법을 보여준다. 의료영상에 3차원 웨이브릿 분할법과 3차원 spatial dependence tree를 이용한 Set Partitioning in Hierarchical Trees(SPIHT) algorithm을 제공한다. 또한 3차원 웨이브릿 분할법에서 정수 웨이브릿 필터들을 이용한 lifting방법을 이용하고, unitary 변환을 만들기 위하여 정확한 scaling을 이용한다. 압축률이 증가하면 할수록 인접한 coding unit사이에선 boundary effect가 생긴다. Video와 같지 않아서 인접한 coding unit사이에서의 boundary artifact는 보여서는 안 된다. 이러한 현상을 제거하기 위해서 인접한 coding unit사이에 axial domain으로 overlapping방법을 사용한다. 또한 코딩 할 때 여러 종류의 정수 필터들을 사용한다. 결과로 어떤 특정한 필터를 사용할 때 좋은 결과를 얻었고 overlapping방법을 사용했기 때문에 ringing artifacts는 거의 찾아 볼 수가 없게 되었다. 그리고 어두운 면을 코딩 할 때도 좋은 결과를 얻었다.

  • PDF

저 복잡도의 H.264/AVC를 위한 고속 인트라 모드 선택 기법 (Fast Ultra-mode Selection Algorithm for H.264/AVC Video Coding with Low Complexity)

  • 김종호;정제창
    • 한국통신학회논문지
    • /
    • 제30권11C호
    • /
    • pp.1098-1107
    • /
    • 2005
  • H.264/AVC는 부호화 성능을 향상시키기 위해 많은 최신의 기술들을 채택하였지만, 그 결과 부호화기의 복잡도가 매우 증가하였다. 특히 화면내(intra) 예측 부호화에서는 주변블록과의 방향성 상관도에 따라 4${\times}$4 휘도블록은 9개, 16${\times}$16 휘도블록과 8${\times}$8 색차블록은 각각 4개의 부호화 모드가 있는데, 이들 중 최적의 모드는 율-왜곡 최적화(RDO) 기법에 의해 선택한다. 따라서 하나의 매크로블록을 부호화하기 위해서는 592번의 RDO 계산을 수행해야 한다. 본 논문에서는 간단한 구조의 방향성 마스크와 주변블록의 모드정보를 이용하여 RDO 계산의 대상이 되는 모드의 개수를 줄임으로써 부호화 복잡도를 줄이는 알고리즘을 제안한다. 제안한 방법은 RDO 계산을 최대132회로 줄이고 부호화 시간을 전역탐색(exhaustive search)에 비해 $70\%$까지 줄이면서 PSNR 및 비트율 변화가 거의 없음을 실험을 통해 보이고 있다.