• 제목/요약/키워드: adaptive motion search

검색결과 119건 처리시간 0.031초

시공간 적응적인 예측에 기초한 다시점 위너-지브 비디오 부호화 기법 (Multi-View Wyner-Ziv Video Coding Based on Spatio-temporal Adaptive Estimation)

  • 이범용;김진수
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.9-18
    • /
    • 2016
  • 본 논문에서는 시공간 적응적인 예측에 기초한 다시점 위너-지브 비디오 부호화 기법을 제안한다. 제안하는 알고리즘은 기존 움직임 추정 방법을 보완하여 가중치를 부여한 결합 양방향 움직임 추정을 수행하고, 각 시점 영상의 에지 검출 및 합성을 통해 관심영역을 효과적으로 분류하여 움직임 벡터 분석을 통해 최종 참조 프레임을 선택하여 보간 한다. 제안하는 알고리즘은 단일 시점 내의 움직임 정보와 인접 카메라 프레임의 정보를 적응적으로 이용함으로써 영상 내 다양한 폐색, 반사 영역에 대해 효율적으로 처리하고 더 나은 성능을 갖는다. 다양한 다시점 영상 시퀀스에 대한 실험을 통하여, 제안하는 알고리즘은 보조정보 생성하는 기존 알고리즘에 비해 평균 비트율 감소와 더불어 우수한 객관적 화질 향상을 얻었다.

Efficient Mode Decision Algorithm Based on Spatial, Temporal, and Inter-layer Rate-Distortion Correlation Coefficients for Scalable Video Coding

  • Wang, Po-Chun;Li, Gwo-Long;Huang, Shu-Fen;Chen, Mei-Juan;Lin, Shih-Chien
    • ETRI Journal
    • /
    • 제32권4호
    • /
    • pp.577-587
    • /
    • 2010
  • The layered coding structure of scalable video coding (SVC) with adaptive inter-layer prediction causes noticeable computational complexity increments when compared to existing video coding standards. To lighten the computational complexity of SVC, we present a fast algorithm to speed up the inter-mode decision process. The proposed algorithm terminates inter-mode decision early in the enhancement layers by estimating the rate-distortion (RD) cost from the macroblocks of the base layer and the enhancement layer in temporal, spatial, and inter-layer directions. Moreover, a search range decision algorithm is also proposed in this paper to further increase the motion estimation speed by using the motion vector information from temporal, spatial, or inter-layer domains. Simulation results show that the proposed algorithm can determine the best mode and provide more efficient total coding time saving with very slight RD performance degradation for spatial and quality scalabilities.

트랜스코더의 해상도 변환 모듈과 움직임 추정 모듈의 공동 최적화 (Joint Optimization of the Motion Estimation Module and the Up/Down Scaler in Transcoders television)

  • 한종기;곽상민;전동산;김재곤
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.270-285
    • /
    • 2005
  • 해상도 변환모듈과 움직임 예측모듈은 트랜스코더를 이루는 중요한 모듈이다. 본 논문에서는 트랜스코더 시스템의 이 두 가지 모듈을 공동 최적화하는 기법을 제안한다. 제안하는 기법은 먼저 주어진 움직임 벡터에 대해 해상도 변환모듈을 최적화한 후, 최적화된 해상도 변환모듈에 대해 최적의 움직임 벡터를 결정한다. 기존 해상도 변환 기법들은 한 영상에 대해 변환함수를 최적화하여 사용한다. 본 논문에서는 해상도 변환 최적화를 위하여 적응적 3차 회선 변환기를 제안한다 제안된 방법은 3차 회선 변환기의 인자값을 각 매크로블록 단위로 영상의 지역적 특성을 고려하여 적응적으로 조절한다. 움직임 예측모듈에서는 기존의 고속 트랜스코더 알고리듬에서 많이 연구된 움직임 벡터의 재사용 기법을 사용하였다. 입력 영상의 움직임 벡터를 재사용 함으로써 연산량을 줄일 수 있고 이를 기본 움직임 벡터로 사용해 작은 영역에서 재탐색해 움직임벡터를 결정할 경우 전역탐색기법과 거의 동일한 화질의 영상을 얻을 수 있다. 해상도 변환모듈과 움직임 예측모듈의 공동 최적화를 통해서 트랜스코딩된 영상의 화질 열화를 최소화할 수 있는 알고리듬을 제안한다. 실험 결과 본 논문에서 제안하는 공동 최적화 기법이 기존에 연구 되었던 다른 기법에 비해 화질의 열화가 적은 것을 알 수 있었고, 이를 통해 다른 기법과 비교해 해상도 변환으로 인한 정보의 손실이 가장 적음을 알 수 있다.

칼라 및 모션 특징 기반 비디오 씬 분할 기법 (Video Scene Segmentation Technique based on Color and Motion Features)

  • 송창준;고한석;권용무
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.102-112
    • /
    • 2000
  • 기존의 비디오 구조화 기법은 주로 샷 또는 샷 그룹 레벨에서 이루어져 왔다. 그러나 이러한 샷 레벨 구조는 사용자에게 의미(semantics)를 충분히 전달할 수 없는 단점이 있다. 이런 단점을 극복하기 위해, 최근 샷 보다 상위 레벨 구조인 비디오 씬 분할에 관한 연구가 진행되고 있다. 본 논문에서는 이러한 샷 레벨 구조의 단점을 극복하기 위해서 칼라와 모션 특징을 기반으로 한 비디오 씬 분할 기법을 제안한다. 샷 내의 다양한 칼라 분포를 반영하기 위해서 각 샷을 sub-shot으로 재분할하고, 이를 이용해 대표 프레임을 추출한다. 샷 내의 모션 특징은 MPEG-1 비디오 내의 모션 벡터를 이용한다. 유사한 컨텐트를 가지고 있는 샷을 찾기 위해서 탐색 구간내의 모션 특성을 반영한 적응적 가중치를 칼라와 모션 특징에 적용한다. 실험 결과 비교를 통해 씬의 과다 분할이나 의미 반영 면에서 기존의 씬 분할 기법보다 우수함을 보였다. 제안된 기법은 비디오를 의미 있는 계층 구조로 분할해서, 사용자에게 의미를 반영하는 씬 단위로의 브라우징이나 검색을 가능케 한다.

  • PDF

GOP 구조 변환을 포함하는 MPEG-2에서 H.264/AVC로의 트랜스코딩 (Transcoding MPEG-2 to H.264/AVC in the GOP Structure Conversion)

  • 이강준;하창우;정제창
    • 방송공학회논문지
    • /
    • 제14권1호
    • /
    • pp.3-14
    • /
    • 2009
  • 최근에 H.264/AVC 베이스라인 프로파일은 많은 멀티미디어 응용기기에 사용되고 있다. 또한 양방향 예측을 위한 B 픽쳐를 지원하는 MPEG-2 메인 프로파일은 HDTV, DVD와 같은 많은 멀티미디어 응용기기에 적용되어 왔다. 따라서 MPEG-2 메인 프로파일에서 H.264 베이스라인 프로파일로의 트랜스코딩은 콘텐츠의 범용성을 높이기 위해 필요한 작업이다. 양방향 움직임 추정을 지원하지 않는 H.264/AVC 베이스라인 프로파일로의 전환을 위해 Group of Pictures 구조 변환은 필수적이다. 이러한 Group of Pictures 구조 변환을 포함하는 트랜스코딩 구조에 있어서 제안한 알고리듬은 예측된 움직임 벡터의 선형성 검사를 통한 적응적인 탐색 범위선택과 참조 영역 복잡성 정보를 이용한 적응적 모드 선택 방법을 통해 화질 열화를 최소화하며 계산상의 복잡성을 획기적으로 줄였다.

적외선영상에서 배경모델링 기반의 실시간 객체 탐지 시스템 (Real-Time Object Detection System Based on Background Modeling in Infrared Images)

  • 박장한;이재익
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.102-110
    • /
    • 2009
  • 본 논문은 적외선영상(infrared image)에서 배경모델링 기반의 실시간 객체 탐지 기법과 고속 PPC(PowerPC) & FPGA(Field Programmable Gate Array) 기반 개방형 구조의 하드웨어 설계 방법을 제안한다. 개방형 구조는 하드웨어 및 소프트웨어의 이식이 용이하고, 확장, 호환성, 관리 및 유지보수 등이 편리한 장점이 있다. 제안된 배경모델링 방법을 개방형 구조에 탑재하기 위하여 입력영상에서 검색영역 템플릿을 성긴 블록으로 구성하여 탐색영역의 크기를 줄인다. 또한, 이전 프레임과 현재 프레임에서 영상의 흔들림이 발생했을 때 보정하기 위해 전역움직임 보상방법을 적용한다. 배경과 객체를 분리는 픽셀 밝기의 시간 분석을 통해 적응적 값을 적용한다. 분리된 객체주변에 발생하는 클러터 제거 방법은 중앙값 필터를 적용한다. 설계된 임베디드 시스템에서 배경모델링, 객체탐지, 중앙값 필터, 라벨링, 합병 등의 방법은 PPC에서 구현하였다. 실험결과 제안된 임베디드 시스템에서 전역 움직임 보정과 배경예측을 통해 실시간으로 객체가 탐지될 수 있음을 보였다.

다양한 커널을 이용한 이진 블록 정합 움직임 추정 (1BT Motion Estimation using Adaptive Kernels)

  • 신욱진;이혁;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.244-247
    • /
    • 2010
  • 현대 사회에서 영상 콘텐츠 (contents)의 사용량이 급증함에 따라 영상압축 기술은 이동통신이나 DMB 등의 시스템에 필수적인 기술이 되었으며 이에 따라 MPEG-x와 H.26x 등 국제적인 표준들이 존재한다. 전역 탐색 알고리듬은 주어진 검색 범위(search range) 내에서 모든 후보들의 변위의 에러 기준에 따라 최솟값을 이용해 위치를 검색하는 알고리듬이다. 그러나 전역 탐색 알고리듬은 각 화소에 대해 엄청난 양의 계산 로드를 가지며 이로 인해 심각한 문제를 발생시키는 단점이 있다. 1비트 변환 (one-bit transform) 을 이용한 고속 움직임 추정 알고리듬은 참조 프레임과 현재 프레임을 1비트, 즉 0 또는 1만 갖는 값으로 변환하는데, 이에는 exclusive-OR 연산을 통해 블록 매칭 에러 (block matching error)를 계산하는 과정과 변환하는 과정이 포함된다. 본 논문에서는 다양한 커널 (kernel)들을 이용한 1비트 변환과 움직임 추정에 대해 다루었으며, 기존에 있었던 1비트 변환에 이용된 커널과는 다른 다양한 커널을 이용한 움직임 추정 결과들을 비교해봄으로써 화질열화를 최소로 하는 커널을 찾는 것에 대해 연구했다.

  • PDF

TEMPORAL ERROR CONCEALMENT ALGORITHM BASED ON ADAPTIVE SEACH RANGE AND MULTI-SIDE BOUNDARY INFORMATION FOR H.264/AVC

  • Kim, Myoung-Hoon;Jung, Soon-Hong;Kang, Beum-Joo;Sull, Sang-Hoon
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.273-277
    • /
    • 2009
  • A compressed video stream is very sensitive to transmission errors that may severely degrade the reconstructed image. Therefore, error resilience is an essential problem in video communications. In this paper, we propose novel temporal error concealment techniques for recovering lost or erroneously received macroblock (MB). To reduce the computational complexity, the proposed method adaptively determines the search range for each lost MB to find best matched block in the previous frame. And the original corrupted MB split into for $8{\times}8$ sub-MBs, and estimates motion vector (MV) of each sub-MB using its boundary information. Then the estimated MVs are utilized to reconstruct the damaged MB. In simulation results, the proposed method shows better performance than conventional methods in both aspects of PSNR.

  • PDF

블록 정합 알고리즘을 이용한 움직임 추정의 적응적 탐색 영역 조정 기법 (An adaptive search area adjustment of the block-matching algorithm for motion estimation)

  • 오황석;서영호;이흥규
    • 한국통신학회논문지
    • /
    • 제26권8B호
    • /
    • pp.1109-1118
    • /
    • 2001
  • 움직임 추정 및 보상 기법은 비디오 코딩 응용 분야에서 일반적으로 많이 사용되는 방법이나 많은 계산량으로 인하여 실시간 움직임 추정이 쉽지 않다. 본 논문에서는 낮은 비트율 비디오 코딩을 위한 전역 탐색 기법의 블록 정합 알고리즘의 복잡도를 줄이기 위하여 탐색 영역을 적응적으로 줄여주는 기법을 제안한다. 제안된 기법은 연속한 비디오 프레임에서 변위된 블록의 차이(displaced block difference)와 블록 구분 정보(block classification information) 등과 같은 상관성을 이용하여 탐색 영역의 범위를 적응적으로 조정한다. 실험을 통하여 제안된 기법이 전역 탐색 영역 기법과 비교하여 계산량에서 1/2의 계산량 이득이 있으며, 비슷한 MSE(mean square error) 성능을 가짐을 보인다.

  • PDF

실시간 객체기반 비디오 서비스를 위한 MPEG-4 Encoder 분석 (Analysis of MPEG-4 Encoder for Object-based Video)

  • 김민훈;이선영;문석주;장의선
    • 대한전자공학회논문지SP
    • /
    • 제41권1호
    • /
    • pp.13-20
    • /
    • 2004
  • 본 논문에서는 현재 MPEG-4 비디오의 인코더를 분석하고 인코더의 복잡함을 줄일 수 있는 효율적인 압축기술을 제안하였다. 지금까지의 객체기반 비디오에서는 유/무선 저 전송률 부호화환경에 맞추기 위하여 형상부호화(Shape coding)를 제외한 인코더 최적화가 주를 이루었다. 최근에 본 연구팀이 수행한 형상부호화의 복잡도를 줄이기 위한 실험을 통하여 객체기반 부호화에서 형상부호화가 차지하는 계산비중이 상대적으로 높다는 것을 밝혀냈다 본 논문에서는 최근까지의 영상부호화 분야와 형상부호화 분야의 최적화 기술이 성공적으로 결합되어 최적의 객체기반 부호화 기술을 유도할 수 있는지 실험하였다 먼저 영상부호화 부분에서는 기존의 MEMC(Motion Estimation Motion Compensation)에서 사용된 검색 방법인 나선형 검색 대신에 MVFAST(Motion Vector Field Adaptive Search Technique) 기술을 채택하였고, 형상부호화 부분에서는 복잡함을 줄이기 위해 기존의 MEMC에서 사용된 나선형 검색을 생략하고 IVOPF(Intelligent VOP Formation) 대신 TRB(Tightest Rectangular Boundary)을 채택하여 최적화에 적용해 보았다. 실험결과, 객체기반 부호화를 위한 제안된 최적화 방식이 기존의 reference software 보다 $57.3\%$ 향상되었음을 알 수 있었다. 아울러, 본 논문에서 제안된 기술은 형상부호화 부분에만 적용된 최적화 기술보다 $50.8\%$ 향상된 실험결과를 보여주었다.