• 제목/요약/키워드: Video Compression

검색결과 775건 처리시간 0.023초

Gabor 코사인과 사인 변환의 기저함수 절단 효과 (Basis Function Truncation Effect of the Gabor Cosine and Sine Transform)

  • 이적식
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.303-308
    • /
    • 2004
  • Gabor 코사인과 사인 변환은 영상주파수 성분을 국부적으로 표현하므로 영상과 비디오 압축 알고리즘에 사용될 수 있다. 압축과 복원에 사용되는 순방향과 역방향 행렬 변환식의 계산 복잡도는 O($N^3$)이다. 이 논문에서는 기저함수들의 길이를 절단하여, 희소기저행렬을 생성하고, 영상압축과 복원에 적용하여 실시간 처리에 용이하게 변환 계산량을 감소시키고자 한다. 기저함수 길이가 감소함에 따라서, 기저함수 에너지에 미치는 절단의 영향을 조사하고 다른 여러 측정량의 변화를 살펴본다. 실험 결과로부터 약 1% 이하의 성능저하로 11배의 곱하기/더하기 수를 감소시킬 수 있음을 보았다.

패턴을 이용한 블록 절단 부호화 기반의 영상 압축 (BTC-based Image Compression using Pattern)

  • 김천식;오재환
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.77-83
    • /
    • 2015
  • 블록절단 코딩 또는 BTC(Block Truncation Coding)는 회색 영상을 위한 손실 영상 압축 기술의 일종이다. 이 방법은 원본 영상을 여러 개의 블록으로 나누고 각 블록에 대해서 평균과 표준편차를 계산하여 각 블록에서의 회색 레벨의 수를 줄인다. BTC는 비디오 압축에 적합하도록 만들어졌다. BTC의 변형된 것으로 AMBTC (Absolute Moment Block Truncation Coding)가 있다. AMBTC는 BTC보다 계산이 간편하다. 본 논문에서는 압축 성능과 이미지 해상도를 높이기 위해서 패턴을 활용한 BTC 기반의 이미지 압축방법을 제안하고자 한다. 이 방법은 여러 이미지의 BTC에 빈도수가 높은 패턴 36개와 64개를 추출하여 코드 북을 만든다. 이미지를 압축할 때 해당 블록과 패턴을 비교해서 일치하는 패턴의 인덱스를 압축에 이용하는 방법이다. 제안한 방법을 실험하였고 36개의 패턴을 활용할 경우 1.37bpp의 압축 성능을 보였다. 본 논문에서 제안한 방법은 BTC 압축보다 높은 성능을 보였다. 제안한 방법의 성능은 표준 이미지를 이용하여 실험하였다.

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

Overlapping method와 SPIHT Algorithm과 Lifting Steps을 이용한 3차원 손실 의료 영상 압축 방법 (3-D Lossy Volumetric Medical Image Compression with Overlapping method and SPIHT Algorithm and Lifting Steps)

  • 김영섭
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.263-269
    • /
    • 2003
  • 이 논문은 3차원 정수 웨이브릿 변환을 이용한 손실 의료 영상 압축에 대한 방법을 보여준다. 의료영상에 3차원 웨이브릿 분할법과 3차원 spatial dependence tree를 이용한 Set Partitioning in Hierarchical Trees(SPIHT) algorithm을 제공한다. 또한 3차원 웨이브릿 분할법에서 정수 웨이브릿 필터들을 이용한 lifting방법을 이용하고, unitary 변환을 만들기 위하여 정확한 scaling을 이용한다. 압축률이 증가하면 할수록 인접한 coding unit사이에선 boundary effect가 생긴다. Video와 같지 않아서 인접한 coding unit사이에서의 boundary artifact는 보여서는 안 된다. 이러한 현상을 제거하기 위해서 인접한 coding unit사이에 axial domain으로 overlapping방법을 사용한다. 또한 코딩 할 때 여러 종류의 정수 필터들을 사용한다. 결과로 어떤 특정한 필터를 사용할 때 좋은 결과를 얻었고 overlapping방법을 사용했기 때문에 ringing artifacts는 거의 찾아 볼 수가 없게 되었다. 그리고 어두운 면을 코딩 할 때도 좋은 결과를 얻었다.

  • PDF

APBT-JPEG Image Coding Based on GPU

  • Wang, Chengyou;Shan, Rongyang;Zhou, Xiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권4호
    • /
    • pp.1457-1470
    • /
    • 2015
  • In wireless multimedia sensor networks (WMSN), the latency of transmission is an increasingly problem. With the improvement of resolution, the time cost in image and video compression is more and more, which seriously affects the real-time of WMSN. In JPEG system, the core of the system is DCT, but DCT-JPEG is not the best choice. Block-based DCT transform coding has serious blocking artifacts when the image is highly compressed at low bit rates. APBT is used in this paper to solve that problem, but APBT does not have a fast algorithm. In this paper, we analyze the structure in JPEG and propose a parallel framework to speed up the algorithm of JPEG on GPU. And we use all phase biorthogonal transform (APBT) to replace the discrete cosine transform (DCT) for the better performance of reconstructed image. Therefore, parallel APBT-JPEG is proposed to solve the real-time of WMSN and the blocking artifacts in DCT-JPEG in this paper. We use the CUDA toolkit based on GPU which is released by NVIDIA to design the parallel algorithm of APBT-JPEG. Experimental results show that the maximum speedup ratio of parallel algorithm of APBT-JPEG can reach more than 100 times with a very low version GPU, compared with conventional serial APBT-JPEG. And the reconstructed image using the proposed algorithm has better performance than the DCT-JPEG in terms of objective quality and subjective effect. The proposed parallel algorithm based on GPU of APBT also can be used in image compression, video compression, the edge detection and some other fields of image processing.

부화소 움직임 추정을 위한 고속 탐색 기법 (A Fast Search Algorithm for Sub-Pixel Motion Estimation)

  • 박동균;조성현;조효문;이종화
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.26-28
    • /
    • 2007
  • The motion estimation is the most important technique in the image compression of the video standards. In the case of next generation standards in the video codec as H.264, a high compression-efficiency can be also obtained by using a motion compensation. To obtain the accurate motion search, a motion estimation should be achieved up to 1/2 pixel and 1/4 pixel uiuts. To do this, the computational complexity is increased although the image compression rate is increased. Therefore, in this paper, we propose the advanced sub-pixel block matching algorithm to reduce the computational complexity by using a statistical characteristics of SAD(Sum of Absolute Difference). Generally, the probability of the minimum SAD values is high when searching point is in the distance 1 from the reference point. Thus, we reduced the searching area and then we can overcome the computational complexity problem. The main concept of proposed algorithm, which based on TSS(Three Step Search) method, first we find three minimum SAD points which is in integer distance unit, and then, in second step, the optimal point is in 1/2 pixel unit either between the most minimum SAD value point and the second minimum SAD point or between the most minimum SAD value point and the third minimum SAD point In third step, after finding the smallest SAD value between two SAD values on 1/2 pixel unit, the final optimized point is between the most minimum SAD value and the result value of the third step, in 1/2 pixel unit i.e., 1/4 pixel unit in totally. The conventional TSS method needs an eight.. search points in the sub-pixel steps in 1/2 pixel unit and also an eight search points in 1/4 pixel, to detect the optimal point. However, in proposed algorithm, only total five search points are needed. In the result. 23 % improvement of processing speed is obtained.

  • PDF

H.264/AVC를 위한 CAVLC 엔트로피 부/복호화기의 VLSI 설계 (VLSI architecture design of CAVLC entropy encoder/decoder for H.264/AVC)

  • 이대준;정용진
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.371-381
    • /
    • 2005
  • 본 논문에서는 동영상의 실시간 부/복호화를 위한 하드웨어 기반의 CAVLC 엔트로피 부/복호화기 구조를 제안한다. H.264/AVC의 무손실 압축 기법인 내용기반 가변길이 부호화(Context-based Adaptive Variable Length Coding)는 이전 표준의 기법과 다른 알고리즘을 채용하여 높은 부호화 효율과 복잡도를 가지고 있다. 이를 하드웨어 구조로 설계하기 위하여 메모리 재사용 기법을 적용하여 리소스를 최적화 하였으며, 지금까지 제시된 여러 엔트로피 부/복호화 구조 중 휴대용 기기에 적합한 성능 대비 리소스를 가지는 구조를 선택하고 이를 병렬 처리 구조로 설계하여 부호화 성능을 향상시켰다. 구현된 전체 모듈은 Altera사의 Excalibur 디바이스를 이용하여 검증하고 삼성 STD130 0.18um CMOS Cell Library를 이용하여 합성 및 검증하였다. 이를 ASIC으로 구현할 경우 부호화기는 150Mhz 동작주파수에서 CIF 크기의 동영상을 초당 300프레임 이상 처리하며 복호화기는 140Mhz 동작주파수에서 CIF 크기의 동영상을 초당 250 이상 처리할 수 있다. 본 결과는 하드웨어 기반의 H.264/AVC 실시간 부호화기와 복호화기를 설계하기에 적합한 하드웨어 구조임을 보여준다.

HEVC기반의 디지털 워터마킹을 위한 인트라 예측의 분석 (Analysis of Intra Prediction for Digital Watermarking based on HEVC)

  • 서영호;김보라;김동욱
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1189-1198
    • /
    • 2015
  • 최근 디지털 방송기술의 비약적인 발전과 함께 초 고해상도 및 초 고화질 영상서비스에 관심이 높아지고 영상 서비스에 관한 수요가 늘어나고 있다. 따라서 기존의 Full HD 보다 4배 혹은 16배의 해상도가 크게 개선된 UHD나 Full HD를 지원하는 모바일 기기 등 영상기기의 보급이 이루어지고 있다. 이러한 큰 해상도의 콘텐츠가 보급이 됨에 따라 그에 해당하는 고효율의 비디오 압축 방법이 제시되고 있다. 따라서 새로운 압축방법에 적용할 수 있는 소유권/지적재산권 보호를 위한 워터마킹 기술 또한 필요하다. 본 논문에서는 새로운 압축 방법인 HEVC 기반의 재인코딩 과정시 인트라 프레임의 예측모드들을 분석하여 경향성을 분석해 HEVC 기반의 워터마킹 가능성 검토에 목적을 둔다. 인트라 프레임에서의 예측모드의 변화를 분석하고 나타나는 경향성의 분석을 통해 변화하지 않는 블록을 찾는 알고리즘을 제안한다.

H.264/AVC 감시 어플리케이션용 멀티 채널 트릭 모드 재생 알고리즘 및 하드웨어 구현 (A Multi-Channel Trick Mode Play Algorithm and Hardware Implementation of H.264/AVC for Surveillance Applications)

  • 조현수;홍유표
    • 한국통신학회논문지
    • /
    • 제41권12호
    • /
    • pp.1834-1843
    • /
    • 2016
  • DVR은 감시를 위한 가장 기본적인 저장 및 전송 장비다. 영상 압축은 DVR 저장 공간의 절약을 위해 중요한 역할을 하는데 영상 압축의 표준인 H.264/AVC가 최근 DVR을 위해 주로 선택 되고 있다. DVR은 빠른 순방향, 역방향 재생과 정지 같은 다양한 출력 모드를 요구하는데, 이러한 것들을 트릭 모드라고 한다. 정밀한 트릭 모드재생의 구현은 복잡한 연산을 처리하기 위한 매우 높은 디코딩 능력이나 지능적인 구조가 요구된다. 이 복잡 도는 하나 이상의 카메라를 사용하여 여러 장소를 모니터 하거나 하나의 장소를 다양한 각도에서 모니터하는 많은 감시 어플리케이션일 때 증가한다. 본 논문에는 여러 채널을 위한 하드웨어 기반의 H.264/AVC 코덱의 트릭 모드재생 구현과 프레임 버퍼 운용 기법을 제시하고 있다. 실험 결과는 비트스트림 크기의 증가를 대가로 키 프레임 인코딩 특성으로 H.264/AVC 비디오 코덱 표준을 사용한 정확한 트릭 모드 재생이 가능하다는 것을 보여준다.

MPEG-DASH 기반 3차원 포인트 클라우드 콘텐츠 구성 방안 (MPEG-DASH based 3D Point Cloud Content Configuration Method)

  • 김두환;임지헌;김규헌
    • 방송공학회논문지
    • /
    • 제24권4호
    • /
    • pp.660-669
    • /
    • 2019
  • 최근 3차원 스캐닝 장비 및 다차원 어레이 카메라의 발달로 AR(Augmented Reality)/VR(Virtual Reality), 자율 주행과 같은 응용분야에서 3차원 데이터를 다루는 기술에 관한 연구가 지속해서 이루어지고 있다. 특히, AR/VR 분야에서는 3차원 영상을 포인트 데이터로 표현하는 콘텐츠가 등장하였으나, 이는 기존의 2차원 영상보다 많은 양의 데이터가 필요하다. 따라서 3차원 포인트 클라우드 콘텐츠를 사용자에게 서비스하기 위해서는 고효율의 부호화/복호화와 저장 및 전송과 같은 다양한 기술 개발이 요구된다. 본 논문에서는 MPEG-I(MPEG-Immersive) V-PCC(Video based Point Cloud Compression) 그룹에서 제안한 V-PCC 부호화기를 통해 생성된 V-PCC 비트스트림을 MPEG-DASH(Dynamic Adaptive Streaming over HTTP) 표준에서 정의한 세그먼트로 구성하는 방안을 제안한다. 또한, 사용자에게 3차원 좌표계 정보를 제공하기 위해 시그널링 메시지에 깊이 정보 파라미터를 추가로 정의한다. 그리고 본 논문에서 제안된 기술을 검증하기 위한 검증 플랫폼을 설계하고, 제안한 기술의 알고리듬 측면에서 확인한다.