• 제목/요약/키워드: Video Compression

검색결과 775건 처리시간 0.033초

Applications and Challenges of Deep Learning and Non-Deep Learning Techniques in Video Compression Approaches

  • K. Siva Kumar;P. Bindhu Madhavi;K. Janaki
    • International Journal of Computer Science & Network Security
    • /
    • 제23권6호
    • /
    • pp.140-146
    • /
    • 2023
  • A detailed survey, applications and challenges of video encoding-decoding systems is discussed in this paper. A novel architecture has also been set aside for future work in the same direction. The literature reviews span the years 1960 to the present, highlighting the benchmark methods proposed by notable academics in the field of video compression. The timeline used to illustrate the review is divided into three sections. Classical methods, conventional heuristic methods, and current deep learning algorithms are all used for video compression in these categories. The milestone contributions are discussed for each category. The methods are summarized in various tables, along with their benefits and drawbacks. The summary also includes some comments regarding specific approaches. Existing studies' shortcomings are thoroughly described, allowing potential researchers to plot a course for future research. Finally, a closing note is made, as well as future work in the same direction.

딥 러닝 기반의 이미지와 비디오 압축 기술 분석 (A Technical Analysis on Deep Learning based Image and Video Compression)

  • 조승현;김연희;임웅;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.383-394
    • /
    • 2018
  • 본 논문에서는 최근 활발히 연구되고 있는 딥 러닝 기반의 이미지와 비디오 압축 기술에 대해 살펴본다. 딥 러닝 기반의 이미지 압축 기술은 심층 신경망에 압축 대상 이미지를 입력하고 반복적 또는 일괄적 방식으로 은닉 벡터를 추출하여 부호화한다. 이미지 압축 효율을 높이기 위해 심층 신경망은 복원 이미지의 화질은 높이면서 부호화된 은닉 벡터가 보다 적은 비트로 표현될 수 있도록 학습된다. 이러한 기술들은 특히 저 비트율에서 기존의 이미지 압축 기술에 비해 뛰어난 화질의 이미지를 생성할 수 있다. 한편, 딥 러닝 기반의 비디오 압축 기술은 압축 대상 비디오를 직접 입력하여 처리하기 보다는 기존 비디오 코덱의 압축 툴 성능을 개선하는 접근법을 취하고 있다. 본 논문에서 소개하는 심층 신경망 기술들은 최신 비디오 코덱의 인루프 필터를 대체하거나 추가적인 후처리 필터로 사용되어 복원 영상의 화질 개선을 통해 압축 효율을 향상시킨다. 마찬가지로, 화면 내 예측 및 부호화에 적용된 심층 신경망 기술들은 기존 화면 내 예측 툴과 함께 사용되어 예측 정확도를 높이거나 새로운 화면 내 부호화 과정을 추가함으로써 압축 효율을 향상 시킨다.

네트워크 전송을 위한 H.264 비디오의 효율적인 계층화 방법 (Efficient scalable method of H.264 video coding for network transport)

  • 황정택;박승호;서덕영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.192-194
    • /
    • 2005
  • Acceptance of the international standards for video compression, such as H.261, MPEG-1 and MPEG-2, along with the developments in video codec hardware, has created an explosion of application. Among these, the long time quest for long-distance digital video transmission causes an increasing interest in transporting compressed video over networks which are nontraditional for this purpose, including asynchronous transfer mode networks, the Internet, and cellular and wireless channels. Transmission of compression video over packet network is improved for error resilience. And layered video coding techniques improves error resilience. We present a efficient method of scalable video coding for low bandwidth.

  • PDF

웨이브렛 변환에 의한 적응적 동영상 부호화 (Adaptive Video Coding by Wavelet Transform)

  • 김정일;김병천
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.141-146
    • /
    • 1999
  • 본 논문은 움직임 정보를 이용하여 기준 프레임 영상과 상관관계가 적은 프레임 영상에서는 화질을 보장하고, 기준 프레임 영상과 상관관계가 많은 프레임 영상에서는 전체 동영상의 비트율을 보장하는 픽쳐셋 필터를 제안하였다. 실험 결과, 제안한 동영상 부호화 방법은 기존의 전영역 탐색 블럭 정합 알고리즘에 비하여, 화질은 9dB이 항상되고, 압축률은 15배가 증가되었으며. 부호화시간은 70%나 단축되었다. 그리고, 차영상 알고리즘에 비하여, 화질은 25dB이 떨어졌으나, 압축률은 42배가 증가하였으며, 부호화시간은 0.9%가 단축되므로서 좋은 성능을 나타냄을 확인하였다.

  • PDF

계층적 깊이 영상으로 표현된 다시점 비디오에 대한 H.264 부호화 기술 (H.264 Encoding Technique of Multi-view Video expressed by Layered Depth Image)

  • 신종홍;지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.43-51
    • /
    • 2014
  • 깊이 영상을 고려한 다시점 비디오는 매우 많은 양의 데이터 때문에 저장과 전송을 위해서 새로운 부호화 압축 기술 개발이 요구된다. 계층적 깊이 영상은 다시점 비디오의 효과적인 표현방법이 된다. 이 방법은 다시점 칼라와 깊이 영상을 합성하는 데이터 구조를 만들어 준다. 이 새로운 콘텐츠를 효과적으로 압축하는 방법으로 3차원 워핑을 이용한 계층적 깊이 영상 표현과 비디오 압축 부호화를 적용하는 방법을 제안하였다. 이 논문은 계층적 영상 표현을 사용한 H.264/AVC 비디오 부호화 기술의 개선된 압축 방법을 제시하여 준다. 컴퓨터 모의시험으로 좋은 압축율과 좋은 성능의 회복 영상을 얻을 수 있음을 제시하였다.

영상 통신을 위한 웨이블릿 변환 부호화 (Wavelet Transform Coding for Image Communication)

  • 김용연
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.61-67
    • /
    • 2011
  • 본 논문은 동영상을 효과적으로 부호화하기 위한 새로운 방법에 관하여 연구한 것이다. 움직임 정보를 이용하여 기준 프레임 영상과 상관관계가 적은 프레임 영상에서는 화질을 보장하고, 기준 프레임 영상과 상관관계가 많은 프레임 영상에서는 전체 동영상의 비트율을 보장하는 픽쳐 셋 필터를 제안하였다. 실험 결과, 제안한 동영상 부호화 방법은 기존의 전영역 탐색 블럭 정합 알고리즘에 비하여, 화질은 8.99dB이 향상되고, 압축률은 14.85배가 증가되었으며, 부호화시간은 74.9%가 단축되었다. 그리고, 차영상 알고리즘에 비하여, 화질은 24.87dB이 떨어졌으나, 압축률은 41.94배가 증가하였으며, 부호화시간은 0.9%가 단축됨으로써 좋은 성능을 나타냄을 확인하였다.

강화학습 기반 몰입형 영상 압축 성능 향상 기법 (Improving immersive video compression efficiency by reinforcement learning)

  • 김동신;오병태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.33-36
    • /
    • 2021
  • 본 논문에서는 강화학습을 이용하여 몰입형 영상의 압축 효율을 향상시키는 기법을 제안한다. 몰입형 영상이란 3DOF+ 영상 혹은 Point Cloud 영상과 같이 사용자가 직접 체험할 수 있는 영상을 의미한다. 또한 몰입형 영상은 그 특성에 의해 방대한 양의 정보를 가지고 있다. 따라서 이를 압축하기 위한 압축 방법들이 연구되고 있으며, 일반적으로 3D 공간의 영상을 2D 공간으로 사영하는 방식을 사용한다. 하지만 이 과정에서 정보가 존재하지 않는 영역이 생성되며 이는 압축 효율 저하의 원인이 된다. 이러한 문제를 해결하기 위하여 영상의 특성을 반영할 수 있도록 강화학습을 통한 채우기 기법을 제안한다. 실험 결과 제안한 기법이 기존 기법에 비해 좋은 성능을 보임을 확인할 수 있다.

  • PDF

A Study on a Compensation of Decoded Video Quality and an Enhancement of Encoding Speed

  • Sir, Jaechul;Yoon, Sungkyu;Lim, Younghwan
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제6권3호
    • /
    • pp.35-40
    • /
    • 2000
  • There are two problems in H.26X compression technique. One is compressing time in encoding process and the other is degradation of the decoded video quality due to high compression rate. For transferring moving pictures in real-time, it is required to adopt massively high compression. In this case, there are a lot of losses of an original video data and that results in degradation of quality. Especially degradation called by blocking artifact may be produced. The blocking artifact effect is produced by DCT-based coding techniques because they operate without considering correlation between pixels in block boundaries. So it represents discontinuity between adjacent blocks. This paper describes methods of quality compensation for H.26x decoded data and enhancing encoding speed for real-time operation. Our goal of the quality compensation is not to make the decoded video identical to a original video but to make it perceived better through human eyes. We suggest an algorithm that reduces block artifact and clears decoded video in decoder. To enhance encoding speed, we adopt new four-step search algorithm. As shown in the experimental result, the quality compensation provides better video quality because of reducing blocking artifact. And then new four-step search algorithm with $MMX^{TM}$ implementation improves encoding speed from 2.5 fps to 17 fps.

  • PDF

기계를 위한 비디오 부호화 표준화 동향 (Standardization Trends in Video Coding for Machines)

  • 권형진;정세윤;최진수;이태진;서정일
    • 전자통신동향분석
    • /
    • 제35권5호
    • /
    • pp.102-111
    • /
    • 2020
  • An increase in high-quality video service continually leads to the standardization of high-performance video codecs such as the versatile video coding standard. Although such codecs have improved coding efficiency in terms of high fidelity, a tremendous increase in the amount of video data is required for more efficient compression, especially for efficiently recognizing and analyzing the target within the millions of objects/events captured every day, such as those by surveillance systems. Therefore, newly established MPEG standardization efforts have studied the new generation of video compression standards for machine vision-oriented video. This paper presents the standardization trends in video coding for machines and discusses further directions for improvement.

저비트율 동영상 전송을 위한 움직임 기반 동영상 분할 (The Motion-Based Video Segmentation for Low Bit Rate Transmission)

  • 이범로;정진현
    • 한국정보처리학회논문지
    • /
    • 제6권10호
    • /
    • pp.2838-2844
    • /
    • 1999
  • The motion-based video segmentation provides a powerful method of video compression, because it defines a region with similar motion, and it makes video compression system to more efficiently describe motion video. In this paper, we propose the Modified Fuzzy Competitive Learning Algorithm (MFCLA) to improve the traditional K-menas clustering algorithm to implement the motion-based video segmentation efficiently. The segmented region is described with the affine model, which consists of only six parameters. This affine model was calculated with optical flow, describing the movements of pixels by frames. This method could be applied in the low bit rate video transmission, such as video conferencing system.

  • PDF