• Title/Summary/Keyword: 비디오 부호화

Search Result 788, Processing Time 0.025 seconds

Joint Training of Neural Image Compression and Super Resolution Model (신경망 이미지 부호화 모델과 초해상화 모델의 합동훈련)

  • Cho, Hyun Dong;Kim, YeongWoong;Cha, Junyeong;Kim, DongHyun;Lim, Sung Chang;Kim, Hui Yong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1191-1194
    • /
    • 2022
  • 인터넷의 발전으로 수많은 이미지와 비디오를 손쉽게 이용할 수 있게 되었다. 이미지와 비디오 데이터의 양이 기하급수적으로 증가함에 따라, JPEG, HEVC, VVC 등 이미지와 비디오를 효율적으로 저장하기 위한 부호화 기술들이 등장했다. 최근에는 인공신경망을 활용한 학습 기반 모델이 발전함에 따라, 이를 활용한 이미지 및 비디오 압축 기술에 관한 연구가 빠르게 진행되고 있다. NNIC (Neural Network based Image Coding)는 이러한 학습 가능한 인공신경망 기반 이미지 부호화 기술을 의미한다. 본 논문에서는 NNIC 모델과 인공신경망 기반의 초해상화(Super Resolution) 모델을 합동훈련하여 기존 NNIC 모델보다 더 높은 성능을 보일 수 있는 방법을 제시한다. 먼저 NNIC 인코더(Encoder)에 이미지를 입력하기 전 다운 스케일링(Down Scaling)으로 쌍삼차보간법을 사용하여 이미지의 화소를 줄인 후 부호화(Encoding)한다. NNIC 디코더(Decoder)를 통해 부호화된 이미지를 복호화(Decoding)하고 업 스케일링으로 초해상화를 통해 복호화된 이미지를 원본 이미지로 복원한다. 이때 NNIC 모델과 초해상화 모델을 합동훈련한다. 결과적으로 낮은 비트량에서 더 높은 성능을 볼 수 있는 가능성을 보았다. 또한 합동훈련을 함으로써 전체 성능의 향상을 보아 학습 시간을 늘리고, 압축 잡음을 위한 초해상화 모델을 사용한다면 기존의 NNIC 보다 나은 성능을 보일 수 있는 가능성을 시사한다.

  • PDF

Coding Tools for Enhancing Coding Efficiency of MPEG Internet Video Coding (IVC) (MPEG 인터넷 비디오 코딩(IVC)의 부호화 효율 개선을 위한 부호화 툴)

  • Yang, Anna;Lee, Jae-Yung;Han, Jong-Ki;Kim, Jae-Gon
    • Journal of Broadcast Engineering
    • /
    • v.21 no.3
    • /
    • pp.319-329
    • /
    • 2016
  • Internet Video Coding (IVC) is a royalty-free codec currently being developed in MPEG. Coding efficiency of IVC codec has been steadily enhanced and it was reported that the performance of Committee Draft (CD) version is comparable to H.264/AVC High Profile (HP) in terms of objective and subjective qualities. In this paper, we present some coding tools that have been proposed for enhancing the coding efficiency of IVC during the developing process in MPEG along with brief overview of IVC codec architecture and coding algorithms. The coding tools include both of normative tools and informative tools such as non-reference P frame coding, DC mode intra prediction, Lagrange multiplier selection, and extension of chroma intra prediction modes. Improvement obtained by each tool is presented in terms of algorithm and coding gain based on the experiments. As a result of the experiment, the coding tools give the average bit saving of 8.8%, 0.4%, 0.4%, and 0.0%, respectively, in the low-delay coding mode.

Perceptual Video Coding using Deep Convolutional Neural Network based JND Model (심층 합성곱 신경망 기반 JND 모델을 이용한 인지 비디오 부호화)

  • Kim, Jongho;Lee, Dae Yeol;Cho, Seunghyun;Jeong, Seyoon;Choi, Jinsoo;Kim, Hui-Yong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.06a
    • /
    • pp.213-216
    • /
    • 2018
  • 본 논문에서는 사람의 인지 시각 특성 중 하나인 JND(Just Noticeable Difference)를 이용한 인지 비디오 부호화 기법을 제안한다. JND 기반 인지 부호화 방법은 사람의 인지 시각 특성을 이용해 시각적으로 인지가 잘 되지 않는 인지 신호를 제거함으로 부호화 효율을 높이는 방법이다. 제안된 방법은 기존 수학적 모델 기반의 JND 기법이 아닌 최근 각광 받고 있는 데이터 중심(data-driven) 모델링 방법인 심층 신경망 기반 JND 모델 생성 기법을 제안한다. 제안된 심층 신경망 기반 JND 모델은 비디오 부호화 과정에서 입력 영상에 대한 전처리를 통해 입력 영상의 인지 중복(perceptual redundancy)를 제거하는 역할을 수행한다. 부호화 실험에서 제안된 방법은 동일하거나 유사한 인지화질을 유지한 상태에서 평균 16.86 %의 부호화 비트를 감소 시켰다.

  • PDF

H.264 Encoding Technique of Multi-view Video expressed by Layered Depth Image (계층적 깊이 영상으로 표현된 다시점 비디오에 대한 H.264 부호화 기술)

  • Shin, Jong-Hong;Jee, Inn-Ho
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.14 no.2
    • /
    • pp.43-51
    • /
    • 2014
  • Multi-view video including depth image is necessary to develop a new compression encoding technique for storage and transmission, because of a huge amount of data. Layered depth image is an efficient representation method of multi-view video data. This method makes a data structure that is synthesis of multi-view color and depth image. This efficient method to compress new contents is suggested to use layered depth image representation and to apply for video compression encoding by using 3D warping. This paper proposed enhanced compression method using layered depth image representation and H.264/AVC video coding technology. In experimental results, we confirmed high compression performance and good quality of reconstructed image.

An Improved GoGOP Structure for Multi-view Video Coding in H.264/AVC (H.264/AVC에서 다시점 비디오 부호화를 위한 향상된 GoGOP 구조)

  • Shin, Kwang-Mu;Lee, Seo-Young;Kim, Sung-Min;Chung, Ki-Dong
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.3
    • /
    • pp.271-275
    • /
    • 2008
  • Corresponding recent continuous development of multimedia technology with improved desire of using various contents, a new realistic feeling media technology is being created. Of them all, multi-view video is being researched actively as foundation technology of 3D TV, free-view point video etc. But encoding time and bit-rate are increased as view numbers are increased. In this paper we propose improved GoGOP structure to enhance the coding efficiency of multi-view video by applying methods which are using techniques such as Key frame position adjustment, dynamically changing the number of I frame and B frame. As experimental results, technique proposed in this paper reduces bit-rate having similar PSNR value compared with Anchor structure.

Improved H.264/AVC $16{\times}16$ Intra Prediction Scheme (개선된 H.264/AVC $16{\times}16$ 인트라 예측 기술)

  • Yang, Hee-Chul;Yang, Jung-Youp;Jeon, Byeung-Woo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.285-286
    • /
    • 2010
  • 최근 HDTV, 블루레이 등 고해상도, 고품질 디지털 멀티미디어 응용 기술의 보급으로 인하여, 고해상도, 고품질 비디오 부호화 기술에 대한 중요성이 증가하고 있다. 현재 고해상도 비디오 부호화에 사용되는 H.264/AVC 표준의 인트라 부호화 기술은 인터 부호화 기술의 복잡도가 크게 증가하는 고해상도 영상에서 인터 부호화 기술에 비해 낮은 복잡도를 가진 부호화기 및 복호화기의 구현이 가능하다는 장점을 가지고 있다. 그러나 인트라 부호화 기술은 인터 부호화 기술에 비하여 압축 효율이 매우 낮다는 문제점이 있다. 본 논문에서는 고해상도 영상을 위한 새로운 $16{\times}16$ 블록의 인트라 예측 기술을 제안한다. 실험을 통하여 제안한 새로운 $16{\times}16$ 인트라 예측 기술을 사용할 경우, HD급 고해상도 영상에 대해 평균 2.8%의 부호화 효율을 증가시킬 수 있음을 보여준다.

  • PDF

Transmission Error Detection and Copyright Protection for MPEG-2 Video Based on Channel Coded Watermark (채널 부호화된 워터마크 신호에 기반한 MPEG-2 비디오의 전송 오류 검출과 저작권 보호)

  • Bae, Chang-Seok;Yuk, Ying-Chung
    • The KIPS Transactions:PartB
    • /
    • v.12B no.7 s.103
    • /
    • pp.745-754
    • /
    • 2005
  • This paper proposes an information hiding algorithm using channel coding technique which can be used to detect transmission errors and to protect copyright for MPEG-2 video The watermark signal is generated by applying copyright information of video data to a convolutional encoder, and the signal is embedded into macro blocks in every frame while encoding to MPEG-2 video stream In the decoder, the embedded signal is detected from macro blocks in every frame, and the detected signal is used to localize transmission errors in the video stream. The detected signal can also be used to claim ownership of the video data by decoding it to the copyright Information. In this stage, errors in the detected watermark signal can be corrected by channel decoder. The 3 video sequences which consist of 300 frames each are applied to the proposed MPEG-2 codec. Experimental results show that the proposed method can detect transmission errors in the video stream while decoding and it can also reconstruct copyright information more correctly than the conventional method.

Performance Analysis of 3D-HEVC Video Coding (3D-HEVC 비디오 부호화 성능 분석)

  • Park, Daemin;Choi, Haechul
    • Journal of Broadcast Engineering
    • /
    • v.19 no.5
    • /
    • pp.713-725
    • /
    • 2014
  • Multi-view and 3D video technologies for a next generation video service are widely studied. These technologies can make users feel realistic experience as supporting various views. Because acquisition and transmission of a large number of views require a high cost, main challenges for multi-view and 3D video include view synthesis, video coding, and depth coding. Recently, JCT-3V (joint collaborative team on 3D video coding extension development) has being developed a new standard for multi-view and 3D video. In this paper, major tools adopted in this standard are introduced and evaluated in terms of coding efficiency and complexity. This performance analysis would be helpful for the development of a fast 3D video encoder as well as a new 3D video coding algorithm.

Scalable Video Coding Using Large Block and its Performance Analysis (Large Block을 적용한 SVC 부호화 및 성능분석)

  • Park, Un-Ki;Choi, Haechul;Kang, Jung Won;Kim, Jae-Gon
    • Journal of Broadcast Engineering
    • /
    • v.18 no.2
    • /
    • pp.249-260
    • /
    • 2013
  • Recently, High-Efficiency Video Coding (HEVC) has been developed as a new video coding standard mainly focusing on the coding of ultra high definition (UHD) videos as the high resolution and high quality videos are getting more popular. Furthermore, the scalable extension of HEVC is being standardized for more efficient provision of HD and UHD services in the communications-broadcasting convergence environment. In this paper, we propose an improved scalable video coding method of H.264/AVC to achieve high coding efficiency particularly for UHD and HD videos. The basic idea is to allow large block size in H.264/AVC SVC, which results in more efficient inter-layer prediction and syntax elements coding. The experimental results show that it achieves an average 4.53% reduction in BD-rate relative to H.264/AVC SVC.

Control of Layered Encryption for SVC Video Streaming (SVC 비디오 스트리밍을 위한 계층적 암호화 제어 기법)

  • Hwang, Jae-Hyung;Seo, Kwang-Deok;Jung, Soon-Heung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.14 no.7
    • /
    • pp.1617-1625
    • /
    • 2010
  • Recently, the standardization of SVC technology which can provide adaptive video quality in diverse service environments has been completed. This paper proposes a layered encryption technique which takes into account the prioritized layer characteristics of SVC and control constant encryption complexity satisfying the target computational complexity. In particular, it analyzes the importance of NAL unit in the SVC video layer and suggests a method to apply appropriate encryption complexity proper for it. The effectiveness of the proposed method is proved through the comparison of time required for encryption and the reconstructed video quality using imperfect decryption key.