• 제목/요약/키워드: video CODEC

검색결과 315건 처리시간 0.026초

CR-DPCM을 이용한 HEVC 무손실 인트라 예측 방법 (CR-DPCM for Lossless Intra Prediction Method in HEVC)

  • 홍성욱;이영렬
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.307-315
    • /
    • 2014
  • 차세대 영상압축 표준인 HEVC(High Efficiency Video Coding)에 적용 가능한 무손실 인트라 예측 방법 CR-DPCM(Cross-Residual Difference Pulse Code Modulation)을 제안한다. HEVC는 공간상의 중복성을 줄이기 위해 다양한 방향의 예측을 하도록 만들어졌으며, 이를 위해 부호화 하려는 블록의 주변 화소들을 사용하고 있다. 본 논문에서 제안하는 HEVC 적용 가능한 무손실 인트라 예측 방법은, 예측을 위해 화소 단위 DPCM을 수행하면서도 잔차 변환과, 잔차 변환의 결과로 얻어지는 잔차 신호에 대해 2차로 진행하는 잔차 변환을 예측 방향에 맞추어 교차시키는 CR-DPCM 방법을 사용하며, 이는 기존 제안한 방법인 제 2차 잔차 변환(Secondary Residual Transform)보다 높은 성능 향상을 가진다. 제안하는 무손실 인트라 코딩 방식인 CR-DPCM 방법은 기존의 HEVC 표준 방법과 비교 하였을 때 bit-rate 평균 약 8.43%정도 감소시키며, JPEG2000 무손실 압축 방법과 비교해서도 높은 성능 향상을 가진다.

부화소 움직임 추정을 위한 고속 탐색 기법 (A Fast Search Algorithm for Sub-Pixel Motion Estimation)

  • 박동균;조성현;조효문;이종화
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.26-28
    • /
    • 2007
  • The motion estimation is the most important technique in the image compression of the video standards. In the case of next generation standards in the video codec as H.264, a high compression-efficiency can be also obtained by using a motion compensation. To obtain the accurate motion search, a motion estimation should be achieved up to 1/2 pixel and 1/4 pixel uiuts. To do this, the computational complexity is increased although the image compression rate is increased. Therefore, in this paper, we propose the advanced sub-pixel block matching algorithm to reduce the computational complexity by using a statistical characteristics of SAD(Sum of Absolute Difference). Generally, the probability of the minimum SAD values is high when searching point is in the distance 1 from the reference point. Thus, we reduced the searching area and then we can overcome the computational complexity problem. The main concept of proposed algorithm, which based on TSS(Three Step Search) method, first we find three minimum SAD points which is in integer distance unit, and then, in second step, the optimal point is in 1/2 pixel unit either between the most minimum SAD value point and the second minimum SAD point or between the most minimum SAD value point and the third minimum SAD point In third step, after finding the smallest SAD value between two SAD values on 1/2 pixel unit, the final optimized point is between the most minimum SAD value and the result value of the third step, in 1/2 pixel unit i.e., 1/4 pixel unit in totally. The conventional TSS method needs an eight.. search points in the sub-pixel steps in 1/2 pixel unit and also an eight search points in 1/4 pixel, to detect the optimal point. However, in proposed algorithm, only total five search points are needed. In the result. 23 % improvement of processing speed is obtained.

  • PDF

H.264/AVC을 위한 움직임 벡터 복원 방법 (Motion Vector Recovery Scheme for H.264/AVC)

  • 손남례
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.29-37
    • /
    • 2008
  • 무선채널과 같은 저 대역폭에 비디오 스트림을 전송하기 위해서 H.264와 같은 고압축 코덱이 등장하였다. 저 대역폭으로 고압축 비디오 스트림을 전송할 경우, 패킷 손실로 인하여 화질 열화를 초래한다. 본 논문에서는 H.264 부호화 영상이 전송될 때 손실된 움직임 벡터는 주변에 인접한 움직임 벡터와 높은 상관성을 갖는다는 사실에 착안하여 시-공간적 에러 은닉(temporal-spatial error concealment) 방법을 제안한다. 이때 손실된 블록의 후보 움직임 벡터들은 손실된 블록에 인접한 움직임 벡터들을 평균 연결 알고리즘의 단점을 보완하여 후보 벡터 군을 결정한다. 패킷이 손실되는 환경에서 실험한 결과, 제안한 에러 은닉 방법은 H.264 복호기에서 사용하는 기존 에러 은닉 방법에 비하여 후보 벡터 개수가 평균적으로 1/3정도 감소로 인하여 후보벡터에 대한 왜곡 측정 계산량이 크게 감소하였다. 또한 화질에 대한 객관적 평가 기준인 PSNR은 평균적으로 기존 방법들과 거의 비슷하였다.

초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기에 대한 연구 (A Fast and Low-complexity Motion Estimation for UHD HEVC)

  • 김성오;박찬식;전형주;김재문
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.808-815
    • /
    • 2013
  • 본 논문은 초고화질 영상처리를 위한 HEVC 표준에 적합한 고속 및 저복잡도 움직임 예측기 알고리즘을 제안하였다. 움직임 예측기는 HEVC 내의 연산양의 77~81%를 차지하고 있다. 결국 비디오 코덱 구현의 핵심은 이러한 움직임 예측기의 고속 및 저복잡도 알고리즘을 찾는 것이다. 본 논문에서는 기존의 움직임 예측기 알고리즘을 분석하였고 일반적인 움직임 탐색 점을 줄이는 방식이 아닌 움직임 벡터 예측과 선택적으로 움직임 탐색 점 개수를 조정하는 등의 HEVC 표준에 적합한 3가지 방식을 제안하였다. 이 제안된 알고리즘은 full search 알고리즘에 비교하여 0.36%의 연산양만을 사용하면서도 그 성능 열화는 1.1%에 불과하였다.

HEVC 화면 내 예측을 위한 계층적 고속 모드 결정 알고리즘 (Hierarchical Fast Mode Decision Algorithm for Intra Prediction in HEVC)

  • 김태선;선우명훈
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.57-61
    • /
    • 2015
  • 본 논문은 HEVC를 위한 고속의 화면 내 예측 알고리즘을 제안한다. HEVC 화면 내 예측은 DC, Planar와 35개의 각모드를 포함해 총 35개의 모드를 가지고 있다. 화면 내 예측의 연산량을 줄이고 고속의 모드 결정을 지원하기 위해 본 논문은 계층적 모드 결정 방법(HMD)를 제안한다. 제안하는 HMD는 주로 후보 모드를 줄이는데 중점을 두고 있다. 실험 결과는 제안하는 HMD가 39.17%의 인코딩 시간 감소에도 불구하고 아주 작은 BDBR 성능 열화만 있는 것을 보여준다. 제안하는 HMD는 기존의 알고리즘에 비해 아주 작은 0.01 ~ 0.42%의 BDBR 상승만을 가지고 인코딩 시간을 평균적으로 14,13% ~ 19.37% 감소시킨다.

저비트율 동영상 부호화에 적합한 웨이블릿 기반의 차영상 양자화기 (A differential image quantizer based on wavelet for low bit rate video coding)

  • 주수경;유지상
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.473-480
    • /
    • 2003
  • 본 논문에서는 차영상(differential image)에 대해 효율적으로 양자화 하기 위해 기존 쿼드 트리(Quadtree) 부호화의 단점을 개선한 새로운 쿼드트리 부호화 기법을 제안하였다. 제안된 기법에서는 실제 표준화되고 있는 영상의 크기에 대응하면서, 기존의 쿼드트리와 제로트리 기반의 앙자화기보다 계산량을 줄여 부호화 및 복호화 처리 시간을 줄이고, 영상의 화질을 높일 수 있다. 실제 동영상 코덱에 적용 가능하도록 차영상의 특징을 분석하였고, 임의의 크기를 갖는 영상을 처리할 수 있도록 블록단위로 처리하는 기존의 쿼드트리 부호화의 기능을 개선하였다. 또한 웨이블릿 변환된 차영상의 계수값을 스케일링(scaling)하여 화질을 향상시킬 수 있었다. 제안한 기법을 기존의 쿼드트리와 SPIHT 기법과 비교한 결과 부호화 시간 및 복호화 시간의 손실 없이 영상의 화질을 향상시킬 수 있었다.

IVC 코덱을 위한 선택적 암호화 및 복호화 방법 (Selective Encryption and Decryption Method for IVC Codec)

  • 이민구;김규태;장의선
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.1013-1016
    • /
    • 2020
  • 본 논문에서는 IVC 비트스트림의 시작 코드(Start Code)를 이용한 선택적 암호화 및 복호화 방식을 제안한다. 비디오를 위한 기존의 암호화 방식은 크게 전역 암호화 알고리즘(Naive Encryption Algorithm, NEA)과 선택적 암호화 알고리즘(Selective Encryption Algorithm, SEA)의 2가지 방식으로 분류한다. NEA 방식은 비트스트림의 모든 데이터를 암호화 하기 때문에 보안성이 높지만 계산 복잡도 역시 높은 문제가 있다. SEA 방식은 비트스트림의 일부를 암호화 하여 암호화 속도를 NEA 방식에 비해 개선하였지만 상대적으로 보안성이 낮아지는 문제가 있다. 제안 방식은 IVC 비트스트림의 시작코드를 이용하여 기존 SEA 방식의 보안성을 높이면서 암호화 속도를 개선하였다. 실험 결과 제안 방식은 NEA 방식에 비하여 평균적으로 암호화 속도는 96%, 복호화 속도는 98% 줄일 수 있었다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

저복잡도 비디오 코덱을 위한 블록 내부/경계 분리형 적응적 루프필터 (Boundary Region Adaptive Loop Filter for Low Complexity Video Codec)

  • 임웅;정광수;남정학;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.200-201
    • /
    • 2010
  • 블록 기반의 적응적 루프 필터(BALF : Block Adaptive Loop Filter)는 압축 성능에 있어서 상당히 높은 효율을 보이는 기술 중 하나이다. BALF는 복원된 영상을 원본 영상에 최대한 유사하게 만드는 Weiner 필터계수와 해당 필터가 적용될 영역에 대한 정보를 복원된 영상에 적용함으로써 화질을 높일 수 있다. 그러나 BALF는 단위블록 전체에 대해 하나의 필터를 생성하여 적용하는 방법으로, 블록 내부에서 구분되는 신호적 특성을 따로 분류하지 않는다. 그러므로 BALF는 높은 부호화 성능을 보이는 반면, 높은 복호화 복잡도를 요구한다는 단점이 있다. 본 논문에서는 필터가 적용될 블록을 내부와 경계 영역으로 나누어 경계 영역을 위한 필터를 구분하여 생성하는 루프필터를 제안한다. 제안하는 알고리즘은 기존의 BALF에 비해 부호화 성능이 저하되지만, 필터를 적용할 영역을 선택 가능하게 함으로써 복호화 복잡도를 조절할 수 있도록 하였다. 제안한 방법의 실험결과, 기존의 방법인 BALF에 대하여 블록의 경계 영역 필터를 사용할 경우, 약 3.77%의 부호화 성능 저하에 대하여 약 33.76%의 필터링 속도 향상을 보였다.

  • PDF

가스안전 상담용 H.263 코덱을 이용한 영상채팅시스템 구현 (Implementation of Video chatting System for the Consultation of Gas Safety using H.263 CODEC)

  • 정애정;박규태;한상인;권정락
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.503-504
    • /
    • 2008
  • 최근 정보통신 기술들이 빠르게 발전하고 있다. 다양한 통신 기술들 중에서도 업무의 효율을 높이고자 회사 및 가정, 학교 등에서 자주 사용되고 있는 영상채팅시스템을 구현해보고자 한다. 쿼타임 코덱 중 가장 보편적인 코덱으로 인코딩이 쉽고 저사양의 CPU만으로도 실시간 스트리밍이 가능한 H.263 코덱을 사용하여 영상채팅시스템을 Visual C++로 구현을 하였다. 전송로의 지연을 줄이기 위하여 영상, 음성, 텍스트 등을 압축하고 복원하는 데 걸리는 시간을 최소화기 위하여 데이터의 전송대역폭을 적절히 조절하는 알고리듬을 제안하여 전송지연을 최소화하였다. 또한 P2P 방식을 사용하여 다양한 영상 환경에 대하여 영상 및 텍스트 데이터의 안정성과 화질이 우수함을 보였으며, 실시간 가스안전관리 상담에 이용하여 업무의 효율을 높이고자 한다.

  • PDF