• 제목/요약/키워드: encoder optimization

검색결과 92건 처리시간 0.022초

DCT 계수를 이용한 고속 인트라 코딩 (Fast Intra Coding using DCT Coefficients)

  • 김가람;김남욱;이영렬
    • 방송공학회논문지
    • /
    • 제20권6호
    • /
    • pp.862-870
    • /
    • 2015
  • HEVC 표준에서 율-왜곡 최적화(RDO) 과정은 좋은 압축 성능을 보이지만 상대적으로 많은 부호화 시간이 요구된다. RDO 과정의 부호화 시간을 줄이기 위해서 본 논문에서는 변환 계수와 CBF(Coded Block Flag) 이용한 고속 인트라 예측 방법을 제안한다. 제안된 고속 인트라 압축방법은 HM16.0 참조SW의 RMD(Rough Mode Decision)를 통해 나온 인트라 예측모드의 후보 수를 3개로 줄이고 이산 여현 변환(Discrete Cosine Transform) 계수 분포와 비교하여 예측 모드의 수를 한 번 더 줄인다. 이후 RDO를 수행하기 전, 양자화된 DCT 계수값이 모두 0이 되는 후보가 있으면 RDO과정 없이 그 후보를 선택하는 방법이다. 제안된 방법은 HEVC 부호화 보다 비트율이 2.5% 중가했지만 평균 55%의 부호화 속도 향상을 얻는다.

계층 간 CU 깊이 예측을 이용한 HEVC SVC 고속 부호화 방법 (Complexity Reduction Method Using Inter-layer CU Depth Information for Scalable Video Coding Base on HEVC)

  • 장형문;남정학;심동규
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.765-780
    • /
    • 2012
  • 본 논문은 차세대 압축 표준(high efficiency video coding; HEVC)을 기반으로 하는 계층 간 비디오 압축 코덱의 부호화 속도 향상을 위하여 참조 계층 CU(coding unit) 깊이정보를 참조하여 향상 계층의 CU깊이를 고속으로 결정하는 방법을 제안한다. 향상 계층의 CU깊이를 예측하기 위해 먼저, 참조 계층의 대응 CU의 깊이 정보를 참조 한다. 이때, 참조 깊이 기준으로 -1부터 +1까지의 CU깊이에 대한 RDcost만을 계산하여 향상 계층의 최종 CU깊이를 결정한다. 제안하는 방법을 이용하여 향상 계층의 모든 CU깊이에 대한 율-왜곡 최적화(rate-distortion optimization) 과정을 거치지 않고 최종 CU깊이를 결정하기 때문에 계산 복잡도 감소 효과를 얻을 수 있다. 제안하는 방법의 고속화 성능을 평가하기 위해 HM 4.0 기반의 simulcast 계층 간 부호화기를 이용한 결과 제안하는 알고리듬을 적용하지 않은 경우 대비 약 1.4% 정도 이내의 적은 비트율 증가에도 불구하고, 약 26%의 계산 복잡도 감소 효과를 얻을 수 있었다.

물체의 효율적인 이송을 위한 양팔 로봇의 최적 자세 (Optimization of Dual-arm Configurations for Efficient Handling of Objects)

  • 박치성;하현욱;손준배;이장명
    • 로봇학회논문지
    • /
    • 제6권2호
    • /
    • pp.130-140
    • /
    • 2011
  • This paper proposes an optimal posture for the task-oriented movement of dual arm manipulator. A stability criterion function which consists of three kinds of feature-representative parameters has been utilized to define the optimal posture. The first parameter is the force which is applied to the object. The torque of each joint and position of arm are attained from the current sensor and encoder, respectively. From these two data, the applied force to an object is estimated using sum of vectors of the joint torques estimated from the measured current. In order to investigate the robustness of each posture, the variation of the end-effector from the encoder information has been utilized as the second parameter. And for the last parameter for the optimality, the total energy consumption has been used. The total consuming energy of each posture can be computed from the current information and the battery voltage. The proposed robot structure consists of a mobile inverted pendulum and dual manipulators. In order to define the optimal posture for the each object, external disturbances are applied to the mobile inverted pendulum robot and the first and second parameters are investigated to find the optimal posture among the pre-selected most representative postures. Finally, the proposed optimal posture has been verified by the proposed stability criterion function which consists of total force to the object, the fluctuation of the end-effector position, and total energy consumption. The effectiveness of the proposed algorithms has been verified and demonstrated through the practical simulations and real experiments.

깊이정보를 이용한 HEVC의 인코더 고속화 방법 (HEVC Encoder Optimization using Depth Information)

  • 이윤진;배동인;박광훈
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.640-655
    • /
    • 2014
  • 최근 영상시스템 환경은 2D 비디오카메라에 깊이 카메라가 부착되어 2D 및 3D 어플리케이션을 지원하는 형태로 보편화 되고 있다. 이러한 3차원 멀티미디어 시스템 환경으로의 변화는 비디오 시스템에서 깊이정보 획득을 용이하게 만들었다. 깊이정보는 객체 구분, 배경영역 인지 등에 이용할 수 있는데, 2D 부호화에 이를 이용한다면 높은 부호화 효율을 얻을 수 있다. 따라서, 본 논문에서는 차세대 2D 비디오 코덱인 HEVC 인코더에 반영한 깊이정보 이용 비디오 부호화 방법을 제안한다. 제안방법으로, 현재 부호화하려는 CU가 배경영역에 위치할 경우 1) 주변블록의 SKIP 모드를 참조하여 결정하는 CU 분할 조기 결정, 2) 시간적 위치의 CU 정보를 이용하여 수행하는 CU 분할 구조 제한, 3) 배경영역에 따른 움직임 예측 탐색 범위 제한이 있다. 실험은 HEVC 참조 소프트웨어인 HM 12.0에 적용하였고, 실험결과 40% 이상의 부호화 복잡도가 감소했으며, BD-Bitrate는 0.5% 손실되었다. 특히, 마이크로소프트사에서 개발한 키넥트를 통해 획득한 영상을 이용한 실험 결과에서는 영상 품질의 큰 열화 없이 기존대비 최대 53%의 부호화 복잡도가 감소하는 결과를 나타내어, 향후 실시간 화상통신, 모바일 또는 핸드헬드 환경에서의 비디오 서비스 등에서 광범위하게 적용할 수 있을 것으로 기대된다.

신경망 기반 비디오 압축을 위한 레이턴트 정보의 방향 이동 및 보상 (Latent Shifting and Compensation for Learned Video Compression)

  • 김영웅;김동현;정세윤;최진수;김휘용
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.31-43
    • /
    • 2022
  • 전통적인 비디오 압축은 움직임 예측, 잔차 신호 변환 및 양자화를 통한 하이브리드 압축 방식을 기반으로 지금까지 발전해왔다. 최근 인공 신경망을 통한 기술이 빠르게 발전함에 따라, 인공 신경망 기반의 이미지 압축, 비디오 압축 연구 또한 빠르게 진행되고 있으며, 전통적인 비디오 압축 코덱의 성능과 비교해 높은 경쟁력을 보여주고 있다. 본 논문에서는 이러한 인공 신경망 기반 비디오 압축 모델의 성능을 향상시킬 수 있는 새로운 방법을 제시한다. 기본적으로는 기존 인공 신경망 기반 비디오 압축 모델들이 채택하고 있는 변환 및 복원 신경망과 엔트로피 모델(Entropy model)을 이용한 율-왜곡 최적화(Rate-distortion optimization) 방법을 사용하며, 인코더 측에서 디코더 측으로 압축된 레이턴트 정보(Latent information)를 전송할 때 엔트로피 모델이 추정하기 어려운 정보의 값을 이동시켜 전송할 비트량을 감소시키고, 손실된 정보를 추가로 전송함으로써 손실된 정보에 대한 왜곡을 보정한다. 이러한 방법을 통해 기존의 인공 신경망 기반 비디오 압축 기술인 MFVC(Motion Free Video Compression) 방법을 개선하였으며, 실험 결과를 통해 H.264를 기준으로 계산한 BDBR (Bjøntegaard Delta-Bitrate) 수치(%)로 MFVC(-14%) 보다 두 배 가까운 비트량 감축(-27%)이 가능함을 입증하였다. 제안된 방법은 MFVC 뿐 아니라, 레이턴트 정보와 엔트로피 모델을 사용하는 신경망 기반 이미지 또는 비디오 압축 기술에 광범위하게 적용할 수 있다는 장점이 있다.

고성능 DSP에서 동영상 인코더의 최적화 구현을 위한 캐쉬 및 내부 메모리 성능 분석 (Performance Analysis of Cache and Internal Memory of a High Performance DSP for an Optimal Implementation of Motion Picture Encoder)

  • 임세훈;정선태
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.72-81
    • /
    • 2008
  • 고성능 DSP는 보통 캐쉬와 내부 메모리를 지원한다. 이러한 고성능 DSP에 멀티미디어 스트림 응용을 최적화하여 구현하고자 하는 경우에는, DSP 가 지원하는 캐쉬와 내부 메모리를 효율적으로 잘 활용하여야 한다. 본 논문에서는 2단계 레벨 캐쉬 구조 및 내부 메모리 구성을 지원하는 고성능 DSP인 TMS320C6000 시리즈에 대해 동영상 인코더와 같은 멀티미디어 스트림 처리 응용을 최적으로 구현하기 위해서 필요한 캐쉬 성능 분석, 내부 메모리 구성 및 배치에 따른 성능 분석과 개선 방안에 대해 연구하였다. 분석 및 실험 결과, L2 메모리의 경우, 이중 집합연관 캐쉬로 구성하고, 남은 메모리는 내부 메모리로 구성하는 것이 수행 시간 성능 개선에 효과적임을 확인하였다. 또한, L1P 캐쉬의 경우는 자주 호출되고 시간이 많이 소요되는 루틴들을 연속적으로 내부 메모리에 배치하는 것이 L1P 캐쉬의 히트 율을 개선하며, L1D 캐쉬의 경우는 사용하는 데이터의 크기를 조절하므로 써 쉽게 히트 율을 개선할 수 있다는 것을 밝혔다. 본 논문의 연구 결과는 고성능 DSP 에 멀티미디어 스트림 처리 응용을 최적화로 구현하는데 도움을 줄 것으로 기대한다.

H.264/AVC에서 DCT 계수의 근사화를 이용한 고속 인트라 모드 결정 기법 (Fast Intra Mode Decision for H.264/AVC by Using the Approximation of DCT Coefficient)

  • 라병두;엄민영;최윤식
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.23-32
    • /
    • 2007
  • H.264 영상 부호화 표준은 인트라 예측에서 압축 효율을 향상시키기 위해 율-왜곡 최적화(RDO : Rate Distortion Optimization) 방법을 사용한다. 이러한 방법을 사용함으로써 현재 블록에 대한 최적의 부호화 모드의 선택이 가능해졌지만 복잡도와 연산은 이전대비 더욱 증가하였다. 본 논문은 우세한 에지 방향(DED : Dominant Edge Direction)의 예측을 통한 고속인트라 모드 결정 알고리즘을 제안한다. 이를 위해 이 알고리즘은 이산 코사인 변환(DCT : Discrete Cosine Transform) 계수를 근사화하여 이용한다. DED를 예측함으로써 $4{\times}4$ 휘도 블록의 경우 최적 모드 결정을 위한 율-왜곡 최적화 계산에 9개 모드 중 3개 모드가 선택된다. $16{\times}16$ 휘도 블록과 $8{\times}8$ 색상 블록의 경우 4개 모드 대신에 2개 모드가 최적 모드 결정을 위해 율-왜곡 최적화 계산을 수행한다. 이러한 방법을 이용한 실험 결과 인트라 전체 검색 방법대비 약 72%의 연산시간이 감소하는 결과를 보여준다.

하드웨어 기반 HEVC 인트라 인코더에서 다운 샘플링을 사용한 고속 Rough Mode Decision (Down Sampling for Fast Rough Mode Decision for a Hardware-based HEVC Intra-frame encoder)

  • 장지훈;이채은
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.341-348
    • /
    • 2016
  • HEVC 표준은 기존의 H.264 표준을 대체할 차세대 고효율 영상 압축 코덱이다. H.264 표준에 비해 약 50% 수준으로 비트레이트를 감소시켰지만 계산 복잡도는 약 1.4배 정도 증가하였다. 계산 복잡도를 낮추기 위해 다양한 고속화 알고리즘들이 제안되어 왔다. 인트라 코딩에는 rough mode decision(RMD) 기법이 적용되었다. 최적의 모드를 선정하기 위한 rate-distortion optimization (RDO) 과정은 복잡도가 높기 때문에 RMD를 사용하여 더 간소화된 방법으로 RDO 단계를 위한 후보 모드들을 선정한다. 그러나 큰 사이즈의 블록들의 경우 RMD 과정 역시 계산 복잡도를 줄일 필요가 있다. 본 논문에서는 RMD 과정에서 참조 픽셀을 가져오고, 예측 픽셀 생성하는 과정에서 다운 샘플링을 적용하였으며 참조 소프트웨어에 적용된 기존 RMD 방식에 비해 계산량을 70%가량 줄일 수 있었다. 이때 BDBR 증가는 0.04%로 미미한 수준이다. 제안한 다운샘플링 기법을 RMD 하드웨어에 적용하면 게이트 카운트는 약 33%, 버퍼의 크기는 약 66% 줄어든다.

다중 참조 영상의 적응적 선택 및 선택적 인트라 모드를 이용한 H.264/AVC의 고속 모드 결정 방법 (Fast Mode Decision in H.264/AVC Using Adaptive Selection of Reference Frame and Selective Intra Mode)

  • 이웅호;이정호;조익환;정동석
    • 한국통신학회논문지
    • /
    • 제31권3C
    • /
    • pp.271-278
    • /
    • 2006
  • 비트율-왜곡 최적화 기법은 H.264/AVC(Advance Video Coding)의 부호화 효율을 높이기 위한 방법이긴 하나 모드 결정 과정 중 부호화기의 복잡도를 높아지는 단점이 있다. 많은 고속화 모드결정 연구들이 모드결정의 복잡도를 줄이기 위하여 제안되어져 왔었다. 본 논문에서는 H.264/AVC의 모드결정의 전체적인 복잡도를 줄이기 위하여 다중 참조 영상 선택 고속화 알고리즘과 선택적인 인트라 모드 선택 알고리즘의 두 가지 고속화 알고리즘을 제안한다. 참조영상 선택 고속화 알고리즘은 인터 모드 결정에 효과적이며, 선택적인 인트라 모드 선해 알고리즘은 과도한 인트라 모드 결정의 계산량을 효율적으로 감소시켰다. 제안된 알고리즘을 실험한 결과로 평균 44.63%의 부호화 시간 감소비를 보이면서 영상의 열화와 같은 부호화 효율 감소는 거의 눈에 띄지 않았다.

$TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현 (Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore)

  • 양용호;이인성;권오주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.962-970
    • /
    • 2004
  • 본 논문에서는 TI사의 부동소수점 DSP인 TMS320C6701$^{TM}$을 이용한 2.4kbps EHSX(Enhanced Harmonic Stochastic Excitation) 음성부호화기의 실시간 구현 방법에 대해서 논한다. EHSX는 4khz의 대역폭을 갖는 음성신호를 2.4kbps의 비트율을 갖는 압축 패킷으로 변환하는 부호화 방법으로, 유/무성음에 따라 하모닉(Harmonic) 여기 부호화 방법과 CELP 부호화 방법을 선택적으로 사용하는 구조를 갖는다. 본 논문에서는 이러한 EHSX의 실시간 구현을 위해 연산량의 큰 비중을 차지하는 CELP 분석의 코드북 검색부분과 일부 IIR 필터링 부분에 대한 고정소수점 변환 방법과, 부호화시 하모닉 검색 및 피치 검색방법에 대한 알고리즘 상 연산량 감소 방법, DSP의 구조를 고려한 코드를 배치방법 등 연산량을 감소시키기 위한 최적화 방법을 제시한다. 설계된 음성 부호화기는 PESQ(perceptual evaluation of speech quality) ITU-T Recommendation P.862를 이용한 음질 평가 결과로서 약MOS 3.28을 얻었으며, 실시간으로 압축 및 복원을 수행한다.