Abstract
As wireless network technology has advanced, demands for multimedia contents through mobile environment have tendered to upward. Since network situation is changing every moment and types of user terminals are diverse, it is difficult for a content provider to consider network situation and type of user terminal to provide multimedia contents. As one solution, transcoding techniques have been proposed, but those have much complexity. In this paper, in order to reduce computational complexity, we propose a fast mode decision using input modes, motion vectors, and residual energies which are obtained from input bitstream for 2:1 down-scaling spatial transcoding application. The proposed method reduces processing time in mode decision by restricting possible mode types based on input information. Experimental results show that the proposed method achieves about 2.66 times improvement in encoding time compared to the normal encoding process while the PSNR is degraded by about 0.04dB, and bit-rate is increased by 1.6%.
무선 네트워크 기술이 발전함에 따라, 모바일 환경을 통한 멀티미디어 컨텐츠 공급이 증가하고 있는 추세이지만, 공급자가 시시각각 변화하는 네트워크 상황과 다양한 사용자의 단말기 종류를 모두 고려하여 적당한 컨텐츠를 공급하는 것은 매우 어렵다. 이러한 문제를 해결하기 위해 트랜스코딩 기술이 제안되었지만 계산 복잡도가 크다. 본 논문에서는 다양한 트랜스코딩 기술 중 하나인 공간해상도 트랜스코딩 기술에서 2:1 화면 축소를 대상으로 H.264에서 매크로블록의 모드 결정 과정 중에 필연적으로 발생하는 계산 복잡도를 줄이기 위해 입력 비트스트림에서 얻은 매크로블록의 모드, 움직임 벡터, 그리고 차-영상 에너지 정보를 이용한 고속 모드 결정 방법을 제안한다. 제안한 고속 모드 결정 방법은 입력 정보들을 비교하여 재-부호화할 매크로블록의 가능한 모드 종류를 제한하여, 모드 결정 과정에서 소모되는 시간을 단축시키는 방법이다. 실험 결과는 영상에 따라 약간의 차이는 있으나 제안한 방법이 일반 부호화 과정에 비해 평균적으로 PSNR은 약 0.04dB 손실이 발생하고 비트율은 약 1.6% 증가하나, 부호화 속도에서는 약 2.66배 빨라짐을 보여준다.