• 제목/요약/키워드: Video Compression

검색결과 775건 처리시간 0.03초

파노라마 동영상 스트리밍을 위한 적응적 스트립 압축 기법 (Adaptive Strip Compression for Panorama Video Streaming)

  • 김보연;장경호;구상옥;정순기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권1_2호
    • /
    • pp.137-146
    • /
    • 2006
  • 일반적인 동영상 스트리밍 시스템은 좁은 시각영역을 갖는 동영상을 원격의 사용자에게 제공한다. 서버 측에 팬/틸트(pan/tilt) 카메라를 부착한 시스템은 클라이언트가 카메라의 방향을 조작할 수 있도록 함으로써 보다 넓은 시각영역을 제공할 수 있다. 하지만, 하드웨어 팬/틸트 카메라를 이용한 스트리밍 시스템은 다수의 사용자가 동시에 접속할 경우, 모든 사용자에게 각자가 원하는 시점에서의 영상을 제공할 수 없으며, 카메라 이동에 의한 지연이 발생한다는 단점이 있다. 본 논문에서는 소프트웨어 팬/틸트 카메라를 구현하였으며, 이를 이용한 새로운 파노라마 동영상 스트리밍 시스템을 제안한다. 제안된 시스템은 넓은 시각영역을 가지는 파노라마 영상을 획득한 후, 각 사용자에게 원하는 부분영상을 제공함으로써 다수의 사용자에게 자유로운 시점 이동을 제공해 준다. 이때, 방대한 양의 파노라마 동영상을 원격의 사용자에게 전송하기 위해서는 효율적인 압축 방법이 요구된다. 본 논문에서는 전체 영상을 좁은 스트립 영상들로 분할하고, 클라이언트 측에서 원하는 시각영역에 해당하는 스트립 영상들만을 독립적으로 압축하는 적응성 스트립 압축 기법을 제안한다. 제안된 시스템은 적응성 스트립 압축 기법을 사용하여 파노라마 동영상을 압축, 전송함으로써 사용자의 시각영역 변화 및 새로운 사용자의 접속에 빠르게 대응할 수 있으며 클라이언트 전송 시 데이터 양을 효과적으로 감소시킬 수 있다.

잡음 모델 선택을 이용한 Wyner-Ziv 비디오 압축 (Wyner-Ziv Video Compression using Noise Model Selection)

  • 박천호;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.58-66
    • /
    • 2009
  • 최근 경량화 비디오 부호화를 위함 분산 비디오 부호화 기술 (DVC: Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있으며, Wyner-Ziv 부호화 기술은 이의 대표적인 기술로써 각광받고 있다. Wyner-Ziv (WZ) 부호화기는, 영상을, 기존의 인트라 부호화기를 이용하는 키 (Key) 프레임과 WZ 부호화를 하는 WZ 프레임으로 나누어 독립적으로 부호화 한다. WZ 복호화기로 전송된 키 프레임은 복원된 뒤 키 프레임 사이의 WZ 프레임을 추정하는데 사용되며 추정된 WZ 프레임을 보조정보 (Side Information)라고 한다. 보조정보는 WZ 프레임에 대한 정보가 없는 상태에서 추정되므로 필연적으로 WZ 프레임과 다르며 WZ 복호화기에서는 보조정보와 WZ 프레임과의 차이를 가상의 채널 잡음으로 간주한다. WZ 복호화 과정은 가상의 채널잡음을 WZ 복호화기 내에 존재하는 채널코드를 이용하여 제거함으로써 이루어지므로 채널 정보를 정확히 아는 것은 채널코드의 에러정정능력에 큰 영향을 미친다. WZ 복호화기에서는 추정된 WZ 영상만이 존재하므로 정확한 잡음의 양을 알 수 없으며, 일반적으로 선형 움직임에 근거한 키 프레임 간의 차를 하나의 예측 수단으로 사용한다. 또한 이와 같이 예측이 갖는 불확실성으로 채널코드의 효율이 저하되는 것을 막기 위하여 주변의 잡음과 비교를 통한 잘못된 잡음을 정정하는 방법도 제안되었다. 하지만 이런 방법들이 모든 프레임이나 비트 플레인에 존재하는 잡음을 제대로 측정한다고 할 수는 없다. 따라서 본 논문에서는 여러 개의 후보 잡음 모델을 생성한 후, 복호화 과정에서 가장 효율적인 모델을 선택하는 방법을 제안한다. 제안 방법에 대한 실험결과는 최대 0.8 dB의 PSNR이득을 보여준다.

모바일폰에서의 원격 영상 전송 기술에 관한 연구 (A study on remote video transmit technique of mobile phone)

  • 정종근;김철원
    • 한국정보통신학회논문지
    • /
    • 제10권10호
    • /
    • pp.1914-1919
    • /
    • 2006
  • 모바일에서의 영상전송의 문제점은 전송속도와 제어이다. 영상을 전송하기 위해서는 압축기법이 필요한데 압축을 위해서 H.263 코덱을 사용하였으며, 원격지에서 카메라를 효율적으로 제어하고, 실시간 접속 사용자 수를 증가시켰다. 본 연구에서는 통해 기존의 RF를 이용한 영상 전송시의 거리 제한 문제를 해결하였고, 최적의 영상과 오디오를 전송할 수 있었다.

Fast Motion Estimation Based on a Modified Median Operation for Efficient Video Compression

  • Kim, Jongho
    • Journal of information and communication convergence engineering
    • /
    • 제12권1호
    • /
    • pp.53-59
    • /
    • 2014
  • Motion estimation is a core part of most video compression systems since it directly affects the output video quality and the encoding time. The full search (FS) technique gives the highest visual quality but has the problem of a significant computational load. To solve this problem, we present in this paper a modified median (MMED) operation and advanced search strategies for fast motion estimation. The proposed MMED operation includes a temporally co-located motion vector (MV) to select an appropriate initial candidate. Moreover, we introduce a search procedure that reduces the number of thresholds and simplifies the early termination conditions for the determination of a final MV. The experimental results show that the proposed approach achieves substantial speedup compared with the conventional methods including the motion vector field adaptive search technique (MVFAST) and predictive MVFAST (PMVFAST). The proposed algorithm also improves the PSNR values by increasing the correlation between the MVs, compared with the FS method.

Approximate-SAD Circuit for Power-efficient H.264 Video Encoding under Maintaining Output Quality and Compression Efficiency

  • Le, Dinh Trang Dang;Nguyen, Thi My Kieu;Chang, Ik Joon;Kim, Jinsang
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제16권5호
    • /
    • pp.605-614
    • /
    • 2016
  • We develop a novel SAD circuit for power-efficient H.264 encoding, namely a-SAD. Here, some highest-order MSB's are approximated to single MSB. Our theoretical estimations show that our proposed design simultaneously improves performance and power of SAD circuit, achieving good power efficiency. We decide that the optimal number of approximated MSB's is four under 8-bit YUV-420 format, the largest number not to affect video quality and compression-rate in our video experiments. In logic simulations, our a-SAD circuit shows at least 9.3% smaller critical-path delay compared to existing SAD circuits. We compare power dissipation under iso-throughput scenario, where our a-SAD circuit obtains at least 11.6% power saving compared to other designs. We perform same simulations under two- and three-stage pipelined architecture. Here, our a-SAD circuit delivers significant performance (by 13%) and power (by 17% and 15.8% for two and three stages respectively) improvements.

Low-Complexity Sub-Pixel Motion Estimation Utilizing Shifting Matrix in Transform Domain

  • Ryu, Chul;Shin, Jae-Young;Park, Eun-Chan
    • Journal of Electrical Engineering and Technology
    • /
    • 제11권4호
    • /
    • pp.1020-1026
    • /
    • 2016
  • Motion estimation (ME) algorithms supporting quarter-pixel accuracy have been recently introduced to retain detailed motion information for high quality of video in the state-of-the-art video compression standard of H.264/AVC. Conventional sub-pixel ME algorithms in the spatial domain are faced with a common problem of computational complexity because of embedded interpolation schemes. This paper proposes a low-complexity sub-pixel motion estimation algorithm in the transform domain utilizing shifting matrix. Simulations are performed to compare the performances of spatial-domain ME algorithms and transform-domain ME algorithms in terms of peak signal-to-noise ratio (PSNR) and the number of bits per frame. Simulation results confirm that the transform-domain approach not only improves the video quality and the compression efficiency, but also remarkably alleviates the computational complexity, compared to the spatial-domain approach.

다시점 비디오 부호화를 위한 고속 계층적 탐색 기법 (Fast Hierarchical Search Method for Multi-view Video Coding)

  • 윤효순;김미영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권7호
    • /
    • pp.495-502
    • /
    • 2013
  • 영상 화질과 인코더의 속도에 영향을 주는 움직임 추정은 동영상 내에 존재하는 중복된 데이터를 제거하기 때문에 동영상 압축에서 중요한 역할을 하지만 높은 계산 복잡도를 요구한다. 다시점 비디오는 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상으로 다시점 비디오를 위한 움직임 추정은 카메라 수에 비례하여 많은 계산량을 필요로 한다. 본 논문에서는 다시점 비디오 부호화를 위한 움직임 추정의 계산량을 줄이면서 영상 화질을 유지하는 고속 움직임 추정 기법을 제안한다. 제안한 기법은 계층적인 탐색 기법으로 수정된 다이아몬드 탐색 패턴, 다중 다이아몬드 탐색 패턴, 그리고 래스터 탐색 패턴으로 구성된다. 이 탐색 패턴들은 국부적 최소화 문제를 해결하기 위하여 탐색 영역 내에 탐색 점들을 규칙적, 대칭적으로 배치하거나 움직임 벡터의 분포 특성을 이용하여 탐색 점들을 배치한다. 제안한 기법의 성능은 JMVC의 고속 움직임 추정 기법인 TZ 탐색 기법의 성능과 비교한 경우, 영상 화질과 비트량을 비슷하지만 계산량을 줄임으로서 움직임 추정 속도를 약 1.2~3배 향상시킨다.

실감형 미디어를 위한 3DoF+ 360 비디오 압축 시스템 구현 (Implementing 3DoF+ 360 Video Compression System for Immersive Media)

  • 정종범;이순빈;장동민;이상순;류은석
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.743-754
    • /
    • 2019
  • 사용자 움직임 적응적 360 비디오 스트리밍을 지원하는 three degrees of freedom plus (3DoF+), 6DoF를 위한 시스템은 여러 위치에서 촬영된 다수의 고화질 360 비디오 전송을 요구한다. 이를 위해 본 논문에서는 사용자 시점에 대응하는 고화질 360 비디오 제공을 위해 3DoF+ 360 비디오 중복성 제거 기법을 적용하고 잔여 비디오를 하나의 영상으로 병합하여 압축 후 전송하는 시스템을 구현한다. 3DoF+ 360 비디오 간 중복성 제거를 위한 3D warping을 기반으로 하는 뷰 간 중복성 제거 기술과 비디오 복원에 필요한 타일들만 추출 및 병합해주는 잔여 뷰 병합 기술에 대한 구현 내용을 설명한다. 제안된 시스템을 기반으로 3DoF+ 360 비디오 전송을 수행하면, 기존 high-efficiency video coding (HEVC)을 사용하여 전송했을 때 대비 최대 20.14%의 BD-rate 감소가 가능함을 확인하였다.

머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법 (Object-based Compression of Thermal Infrared Images for Machine Vision)

  • 이예지;김신;임한신;추현곤;정원식;서정일;윤경로
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.738-747
    • /
    • 2021
  • 오늘날 딥러닝 기술의 향상으로 영상 분류, 객체 탐지, 객체 분할, 객체 추적 등 컴퓨터 비전 분야 또한 큰 발전을 이루고 있다. 지능적 감시, 로봇, 사물 인터넷, 자율주행 자동차 등 딥러닝 기술이 결합된 다양한 응용 기술들은 실제 산업에 적용되고 있으며, 이에 따라 사람의 소비를 위한 영상 데이터 뿐만 아니라 머신 비전을 위한 영상 데이터의 효율적인 압축 방식에 대한 필요성이 대두되고 있다. 본 논문에서는 머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법을 제안한다. 효율적인 영상 압축과 신경망의 좋은 성능을 유지하기 위해 본 논문에서는 신경망의 객체 탐지 결과와 객체 크기에 따라 입력 영상을 객체 부분과 배경 부분으로 나누어 서로 다른 압축률로 부호화를 수행하는 방법을 제안한다. 제안하는 방법은 VVC로 영상 전체를 압축하는 방식보다 BD-rate 값이 최대 -19.83%로 압축 효율이 뛰어나다는 것을 확인할 수 있다.

Compression history detection for MP3 audio

  • Yan, Diqun;Wang, Rangding;Zhou, Jinglei;Jin, Chao;Wang, Zhifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.662-675
    • /
    • 2018
  • Compression history detection plays an important role in digital multimedia forensics. Most existing works, however, mainly focus on digital image and video. Additionally, the existed audio compression detection algorithms aim to detect the trace of double compression. In real forgery scenario, multiple compression is more likely to happen. In this paper, we proposed a detection algorithm to reveal the compression history for MP3 audio. The statistics of the scale factor and Huffman table index which are the parameters of MP3 codec have been extracted as the detecting features. The experimental results have shown that the proposed method can effectively identify whether the testing audio has been previously treated with single/double/triple compression.