• 제목/요약/키워드: MPEG-4/AVC

검색결과 123건 처리시간 0.025초

얼굴 인식과 추적을 이용한 ROI 기반 영상 통화 코덱 설계 및 구현 (ROI-based Encoding using Face Detection and Tracking for mobile video telephony)

  • 이유선;김창희;나태영;임정연;주영호;김기문;변재완;김문철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.77-78
    • /
    • 2008
  • With advent of 3G mobile communication services, video telephony becomes one of the major services. However, due to a narrow channel bandwidth, the current video telephony services have not yet reached a satisfied level. In this paper, we propose an ROI (Region-Of-Interest) based improvement of visual quality for video telephony services with the H.264|MPEG-4 Part 10 (AVC: Advanced Video Coding) codec. To this end, we propose a face detection and tracking method to define ROI for the AVC codec based video telephony. Experiment results show that our proposed ROI based method allowed for improved visual quality in both objective and subjective perspectives.

  • PDF

Fast Quadtree Structure Decision for HEVC Intra Coding Using Histogram Statistics

  • Li, Yuchen;Liu, Yitong;Yang, Hongwen;Yang, Dacheng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권5호
    • /
    • pp.1825-1839
    • /
    • 2015
  • The final draft of the latest video coding standard, High Efficiency Video Coding (HEVC), was approved in January 2013. The coding efficiency of HEVC surpasses its predecessor, H.264/MPEG-4 Advanced Video Coding (AVC), by using only half of the bitrate to encode the same sequence with similar quality. However, the complexity of HEVC is sharply increased compared to H.264/AVC. In this paper, a method is proposed to decrease the complexity of intra coding in HEVC. Early pruning and an early splitting strategy are applied to the quadtree structure of coding tree units (CTU) and residual quadtree (RQT). According to our experiment, when our method is applied to sequences from Class A to Class E, the coding time is decreased by 44% at the cost of a 1.08% Bjontegaard delta rate (BD-rate) increase on average.

H.264 복호기를 위한 스케일러블 인트라 예측기 구조 설계 (Design of Scalable Intra-prediction Architecture for H.264 Decoders)

  • 이찬호
    • 대한전자공학회논문지SD
    • /
    • 제45권11호
    • /
    • pp.77-82
    • /
    • 2008
  • H.264는 ITU-T와 ISO/IEC의 최신 동영상 압축 코덱 규격으로 MPEG-2보다 2배 이상의 압축률과 고화질로 최근 그 적용 영역을 급격히 넓혀 가고 있다. H.264는 QVGA급의 작은 영상부터 HD 크기의 넓은 영상까지 다양하게 적용되므로 응용 분야에 따라 그 구조가 달라진다. 본 논문에서는 H.264 복호기의 인트라 예측기에 대해 응용 분야에 따라 구조를 쉽게 확장할 수 있는 스케일러블(scalable) 구조를 제안하고 이 구조에 따라 인트라 예측기를 설계하여 동작과 성능을 검증하였다. 제안된 구조는 인트라 예측기 내부의 연산기 수를 $1{\sim}4$개까지 변화시키면서 성능을 4배까지 향상시킬 수 있다. 또한 효율적인 버퍼 관리를 통해 메모리 접근을 최소화 하여 전력 소모를 줄였다 제안된 인트라 예측기는 Verilog-HDL을 이용하여 설계하고 FPGA상에서 동작을 검증하였다. 이를 바탕으로 연산기 수에 따른 인트라 예측기의 성능을 분석하였다.

움직임 추정기의 병렬처리 구조 하드웨어 구현시비유효 데이터의 효율적인처리 방법 (Efficient Processing Technique for Unavailable Data in Hardware Implementation of Motion Estimator with Parallel Processing Architecture)

  • 박종화;강현수
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.1-9
    • /
    • 2009
  • 본 논문은 H.264/AVC 부호화기의 실시간 동영상 부호화를 위한 하드웨어 구현과정 중 파이프라인 구조의 병렬 처리로 인한 데이터 부재문제의 해결방안을 제시하였다. 참조 소프트웨어(JM)의 움직임 추정 연산은 순차적인 처리가 가능하기 때문에 모든 데이터가 유효하지만, 파이프라인 구조로 하드웨어를 구현시 데이터가 병렬적으로 처리되므로 이전데이터가 유효하지 않은 경우가 발생한다. 본 논문에서는 MVp 연산시의 부재되는 데이터 문제를 해결하였다. 제안된 방법은 유효하지 않은 주변블록의 데이터(MV)로 인한 화질저하를 최소화하기 위하여 유효하지 않은 MV를 대신하여, 정수화소 움직임벡터, MVp(Motion Vector Predictor), MVcol(Motion vector of the Co-located block)을 사용하는 방법이다. BDPSNR로 실험 결과 같은 주제로 이전에 연구된 Huang[7]의 실험결과에 비하여 최대 QCIF영상에서 0.555dB, CIF 영상에서 0.834dB의 성능향상을 나타내고 있다.

DTV-to-DMB 비디오 변환을 위한 Center Average 축소 방식 (Center Average Shrink Method for DTV-to-DMB video transcoding)

  • 유원혁;정원식;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.185-188
    • /
    • 2005
  • DTV-to-DMB 비디오 변환을 위해서는 기본적으로 MPEG-2 MP@HL의 HDTV/SDTV급 영상을 MPEG-4 AVC BP@1.3의 QCIF/QVGA/WDF/CIF급 영상으로 변환하는 과정이 필요하다. 본 논문에서는 DTV-to-DMB 비디오 변환을 위해 DTV의 고해상도 영상을 DMB의 저해상도 영상으로 축소하는 방식을 제안하고 있다. DTV-to-DMB 비디오 변환은 실시간 변환이 고려되어야 하며, 실시간 변환을 위해서는 축소 방식의 시간 복잡도가 고려 되어야 한다. 일반적으로 낮은 시간 복잡도를 갖는 영상 축소 방식으로는 대상 영상의 하나의 픽셀을 참조 영상 내 대응하는 픽셀들 중 한 픽셀을 선택하여 결정하는 방식(Just Get A Pixel)이 있으며, 참조 영상의 대응하는 픽셀들의 평균값을 선택하는 방식 (Average Shrink)과 중간값을 선택하는 방식 (Median Shrink)이 있다. 한편, DTV 영상은 인터레이스 방식을사용하며 DMB의 프로그레시브 방식 영상으로 변환 처리 과정에서, 움직임이 큰 영상에 대해 사물의 윤곽선이 계단 모양으로 보이는 재그 에지 (Jagged Edge) 현상이 나타난다. 본 논문에서는 대상 영상의 한 픽셀을 참조 영상의 대응하는 픽셀들 중 중간 위치의 몇 개 픽셀들과 주변 인접 픽셀들을 선출하여 그것들의 평균값 (Average)을 구하여 결정하는 Center Average 축소 방식을 제안한다. 제안된 방식은 기본적인 축소 방식을 기반으로 하여 낮은 시간 복잡도를 갖으며, 재그 에지 (Jagged Edge) 현상을 줄여 준다.

  • PDF

Fuzzy Logic Based Temporal Error Concealment for H.264 Video

  • Lee, Pei-Jun;Lin, Ming-Long
    • ETRI Journal
    • /
    • 제28권5호
    • /
    • pp.574-582
    • /
    • 2006
  • In this paper, a new error concealment algorithm is proposed for the H.264 standard. The algorithm consists of two processes. The first process uses a fuzzy logic method to select the size type of lost blocks. The motion vector of a lost block is calculated from the current frame, if the motion vectors of the neighboring blocks surrounding the lost block are discontinuous. Otherwise, the size type of the lost block can be determined from the preceding frame. The second process is an error concealment algorithm via a proposed adapted multiple-reference-frames selection for finding the lost motion vector. The adapted multiple-reference-frames selection is based on the motion estimation analysis of H.264 coding so that the number of searched frames can be reduced. Therefore the most accurate mode of the lost block can be determined with much less computation time in the selection of the lost motion vector. Experimental results show that the proposed algorithm achieves from 0.5 to 4.52 dB improvement when compared to the method in VM 9.0.

  • PDF

스케일러블 비디오 부호화에서 통계적 가설 검증 기법을 이용한 프레임 간 모드 결정 (Fast Intermode Decision of Scalable Video Coding using Statistical Hypothesis Testing)

  • 이범식;김문철;함상진;이근식;박근수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.111-115
    • /
    • 2006
  • 스케일러블 비디오 코딩(SVC, Scalable Video Coding)은 MPEG(Moving Picture Expert Group)과 VCEG (Video Coding Expert Group)의 JVT(Joint VIdeo Team)에 의해 현재 표준화 되고 있는 새로운 압축 표준 기술이며 시간, 공간 및 화질의 스케일러빌리티를 지원하기 위해 계층 구조를 가지고 있다. 특히 시간적 스케일러빌리티를 위해 계층적 B-픽처 구조를 채택하고 있다. 스케일러블 비디오 코딩의 기본 계층은 H.264|AVC와 호환적이므로, 모션 예측과 모드 결정과정에서 $16{\times}16,\;16{\times}8,\;8{\times}16,\;8{\times}8,\;8{\times}4,\;4{\times}8$ 그리고 $4{\times}4$와 같은 7개의 서로 다른 크기를 갖는 블록을 사용한다. 스케일러블 비디오 코딩에서 사용되고있는 계층적 B-픽처 구조는 키 픽처인 I와 P 픽처를 제외하고는 한 GOP (Group of Picture)내에서 모두 B-픽처를 사용하므로 H.264|AVC와 비교했을 때 연산량 증가와 함께 부호화 지연도 급격히 증가한다. B-픽처는 양방향 모션 벡터인 LIST0와 LIST1을 사용하고 양방향 모두에서 다중 참조 픽처를 사용하기 때문이다. 본 논문에서는 통계적 가선 검증을 이용하여 스케일러블 비디오 부호화에 적용 가능한 고속 프레임간 모드 결정 알고리듬 대해 소개한다. 제안된 방법은 $16{\times}16$ 매크로 블록과 $8{\times}8$ 서브 매크로 블록에 통계적 가설 감증 기법을 적용하여 실행되며, 현재 블록과 복원된 참조 블록간의 픽셀 값을 비교하여 RD(Rate Distortion) 최적화 기반 모드 결정을 빨리 완료함으로써 고속 프레임간 모드 결정을 가능하게 한다. 제안된 방법은 프레임 간 모드 결정을 고속화함으로써 스케일러블 비디오 부호화기의 연산량과 복잡도를 최대 57%감소시킨다. 그러나 연산량 감소에 따른 비트율의 증가나 화질의 열화는 최대 1.74% 비트율 증가 및 0.08dB PSNR 감소로 무시할 정도로 작다.

  • PDF

H.264에서 화소 변화량을 이용한 빠른 인트라 예측 (Fast Intra Prediction using Pixel Variation in H.264)

  • 이탁기;김성민;신광무;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.956-965
    • /
    • 2008
  • H.264는 가장 최근에 제정된 동영상 압축 표준으로 다양한 기법 등을 도입하여 기존의 표준들에 비해 동일한 화질을 유지하면서도 높은 압축 효율을 보여준다. 하지만 이러한 기법들은 처리과정이 복잡해, 계산 과정을 간소화시킨 효율적인 기법들이 요구된다. 따라서 본 논문에서는 새롭게 도입된 기법 중에서 복잡한 처리가 요구되는 인트라 예측의 효율적인 처리를 위한 2단계의 빠른 인트라 예측 방법을 제안한다. 1단계에서는 매크로블록 내 작은 블록들($4{\times}4,\;8{\times}8,\;12{\times}12$ 크기)의 경계 부분의 화소 변화량을 조사하고, 이를 통해서 매크로블록의 평탄 여부를 판단하여 인트라 예측을 위한 블록 크기를 빠르게 선택한다. 2단계에서는 매크로 블록 내부의 대표성을 띄는 화소들을 이용하여 1단계에서 선택된 블록 크기의 여러 모드 중에서 최종 모드를 빠르게 결정한다. 제안한 인트라 예측 기법의 성능측정을 위해 다양한 테스트 동영상으로 화질, 비트율 및 처리시간을 확인한 결과, 관련기법 및 표준과 비교해서 동일한 화질과 비트율을 유지하면서 표준과 비교하여 41.5%, 관련기법과 비교하여 24.7%의 인트라 예측 처리 시간을 감소시켰다.

  • PDF

Adaptive Multiview Video Coding Scheme Based on Spatiotemporal Correlation Analyses

  • Zhang, Yun;Jiang, Gang-Yi;Yu, Mei;Ho, Yo-Sung
    • ETRI Journal
    • /
    • 제31권2호
    • /
    • pp.151-161
    • /
    • 2009
  • In this paper, we propose an adaptive multiview video coding scheme based on spatiotemporal correlation analyses using hierarchical B picture (AMVC-HBP) for the integrative encoding performances, including high compression efficiency, low complexity, fast random access, and view scalability, by integrating multiple prediction structures. We also propose an in-coding mode-switching algorithm that enables AMVC-HBP to adaptively select a better prediction structure in the encoding process without any additional complexity. Experimental results show that AMVC-HBP outperforms the previous multiview video coding scheme based on H.264/MPEG-4 AVC using the hierarchical B picture (MVC-HBP) on low complexity for 21.5%, on fast random access for about 20%, and on view scalability for 11% to 15% on average. In addition, distinct coding gain can be achieved by AMVC-HBP for dense and fast-moving sequences compared with MVC-HBP.

  • PDF

영상에 적응적인 디블로킹 필터 개발 (Adaptive Deblocking Filter based on Video Contents)

  • 이상래
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.65-68
    • /
    • 2003
  • 블록화 현상은 블록 기반의 부호화와 이에 따른 거친 양자화 계수를 적용할 때 나타날 뿐 아니라 블록화가 나타난 블록을 움직임 보상으로 가져와 적용할 때 이후 영상에 전파되게 된다. 이를 방지하기 위해 H.264/MPEG-4 AVC 표준은 부호화 및 복호화 과정에 동시에 포함된 형태의 루프 필터를 적용하였다. 필터는 블록 경계에서 경계 양쪽의 블록 예측 모드에 기반 한 필터의 세기를 결정하고 양자화 계수를 이용한 한계 값과 화소 값윽 비교하여 블록 경계에 적응적으로 적용한다. 이 때 필터의 특성을 결정하는 편차 값을 부호기에서 전송하게 되는데 이 값은 부호기 구현에 따라 달라질 수 있다. 본 논문은 부호화하는 각 영상의 특성을 정의하고 편차 값을 정함으로써 영상에 적응적인 디블로킹 필터 알고리즘을 구현 및 실험을 통하여 검증한다.

  • PDF