• Title/Summary/Keyword: 화면간 예측

Search Result 122, Processing Time 0.023 seconds

Fast Reference Frame Selection for H.264/AVC (H.264/AVC 고속 참조영상 결정 기법)

  • Lee, Sang Yong;Kim, Dong-Hyun;Kim, Jae-Gon;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.11a
    • /
    • pp.184-185
    • /
    • 2012
  • H.264/AVC 는 다중 참조영상을 사용하여 움직임 예측/보상을 수행함으로써 보다 높은 부호화 효율을 얻을 수 있지만 다중 참조영상에 대한 움직임 예측으로 인하여 부호화 복잡도 증가를 야기한다. 본 논문에서는 공간적 상관성을 이용하여 참조영상 수를 제한함으로써 부호화기의 복잡도를 줄이는 고속 참조영상 결정 기법을 제안한다. 즉, 주변 블록의 부호화 정보와 현재 부호화하는 매크로블록의 $16{\times}16$ 화면간 예측 결과를 적응적으로 이용하여 참조영상 후보의 수를 줄인다. 모의실험에서 제안한 알고리즘은 JM17.2 에 비해 0.67%의 평균 비트율 증가의 미미한 부호화 효율 감소에 평균 47% 정도의 부호화 시간을 감소하였으며, 기존의 고속 기법보다 우수한 성능을 보임을 확인하였다.

  • PDF

Spatial Correlation Based Fast Reference Frame Selection (공간적 상관성 기반 고속 참조영상 선택 방법)

  • Lee, Sang Yong;Kim, Jae-Gon;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.425-427
    • /
    • 2012
  • H.264/AVC 는 움직임 예측/보상을 수행할 때, 하나 이상의 다중 참조영상을 허용하여 예측 정확성을 높임으로써 높은 압축효율을 얻을 수 있지만, 부호화기가 높은 복잡도를 갖는 단점이 있다. 본 논문에서는 H.264/AVC 부호화기의 높은 복잡도를 줄이기 위하여 이미 부호화된 주변 블록의 부호화 정보와 현재 부호화하는 매크로블록(MB)의 $16{\times}16$ 화면간 예측 결과를 적응적으로 이용하여 현재 부호화하는 매크로블록의 참조영상 후보의 수를 줄이는 고속 부호화 알고리즘을 제안한다. 모의실험을 통하여 제안한 알고리즘은 JM17.2 에 비해 평균 47% 정도의 부호화 시간을 감소시키며, 이때 평균 비트율은 1.4%로 부호화 효율의 감소가 미미함을 확인 하였다.

  • PDF

Luma Noise Reduction using Deep Learning Network in Video Codec (Deep Learning Network를 이용한 Video Codec에서 휘도성분 노이즈 제거)

  • Kim, Yang-Woo;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.272-273
    • /
    • 2019
  • VVC(Versatile Video Coding)는 YUV 입력 영상에 대하여 Luma 성분과 Chroma 성분에 대하여 각각 다른 최적의 방법으로 블록분할 후 해당 블록에 대해서 화면 내 예측 또는 화면 간 예측을 수행하고, 예측영상과 원본영상의 차이를 변환, 양자화하여 압축한다. 이 과정에서 복원영상에는 블록화 노이즈, 링잉 노이즈, 블러링 노이즈 발생한다. 본 논문에서는 인코더에서 원본영상과 복원영상의 잔차신호에 대한 MAE(Mean Absolute Error)를 추가정보로 전송하여 이 추가정보와 복원영상을 이용하여 Deep Learning 기반의 신경망 네트워크로 영상의 품질을 높이는 방법을 제안한다. 복원영상의 노이즈를 감소시키기 위하여 영상을 $32{\times}32$블록의 임의로 분할하고, DenseNet기반의 UNet 구조로 네트워크를 구성하였다.

  • PDF

Construction of Liver Cirrhosis Diagnosis System Using Web Based Machine Learning (웹기반 머신러닝 기술을 이용한 간 경화증 진단 시스템 구축)

  • Noh, Si-Hyeong;Kim, Ji-Eon;Lee, Chungsub;Kim, Tae-Hoon;Yoon, Kwon-Ha;Jeong, Chang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.19-21
    • /
    • 2021
  • 인공지능 기술을 도입한 의료분야에서 진단 및 예측을 위한 관련 연구가 활발하게 진행되고 있다. 특히, 인공지능 기술 적용에 가장 많이 활용되고 있는 의료영상기반 질환 진단 및 예측 연구결과가 다양한 제품으로 출시되고 있다. 의료영상이 활용되는 다양한 질환 중 간 질환은 통증이 적어 조기진단이 어렵다. 본 논문에서는 인공지능을 기반 간 경화증 환자의 판독을 돕기 위한 웹 서비스기반 시스템을 구축하고 진단결과를 보인다. 이를 위해 웹서비스 프로세스를 보이고 각 프로세스의 구동 화면과 최종 결과화면을 보인다. 제안한 서비스를 통해 간 경화증을 조기에 진단하고, 빠른 치료를 통해 환자의 회복에 도움을 줄 수 있을 것으로 기대한다.

A Real-Time Video Stitching Algorithm in H.264/AVC Compressed Domain (실시간 H.264/AVC 압축 영역에서의 영상 합성 알고리즘)

  • Gankhuyag, Ganzorig;Hong, Eun Gi;Kim, Giyeol;Kim, Younghwan;Choe, Yoonsik
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.39C no.6
    • /
    • pp.503-511
    • /
    • 2014
  • In this paper, a novel, real-time video stitching algorithm in an H.264/AVC compressed domain is proposed. This enables viewers to watch multiple video contents using a single device. The basic concept of this paper is that the server is asked to combine multiple streams into one bit-stream based in a compressed domain. In other words, this paper presents a new compressed domain combiner that works in boundary macroblocks of input videos with re-calculating intra prediction mode, intra prediction MVD, a re-allocation of the coefficient table, and border extension methods. The rest of the macroblocks of the input video data are achieved simply by copying them. Simulation experiments have demonstrated the possibility and effectiveness of the proposed algorithm by showing that it is able to generate more than 103 frames per second, stitching four 480p-sized images into each frame.

Fast Inter CU Partitioning Algorithm using MAE-based Prediction Accuracy Functions for VVC (MAE 기반 예측 정확도 함수를 이용한 VVC의 고속 화면간 CU 분할 알고리즘)

  • Won, Dong-Jae;Moon, Joo-Hee
    • Journal of Broadcast Engineering
    • /
    • v.27 no.3
    • /
    • pp.361-368
    • /
    • 2022
  • Quaternary tree plus multi-type tree (QT+MTT) structure was adopted in the Versatile Video Coding (VVC) standard as a block partitioning tool. QT+MTT provides excellent coding gain; however, it has huge encoding complexity due to the flexibility of the binary tree (BT) and ternary tree (TT) splits. This paper proposes a fast inter coding unit (CU) partitioning algorithm for BT and TT split types based on prediction accuracy functions using the mean of the absolute error (MAE). The MAE-based decision model was established to achieve a consistent time-saving encoding with stable coding loss for a practical low complexity VVC encoder. Experimental results under random access test configuration showed that the proposed algorithm achieved the encoding time saving from 24.0% to 31.7% with increasing luminance Bjontegaard delta (BD) rate from 1.0% to 2.1%.

Fast Intra-Mode Decision for H.264/AVC using Inverse Tree-Structure (H.264/AVC 표준에서 역트리 구조를 이용하여 고속으로 화면내 모드를 결정하는 방법)

  • Ko, Hyun-Suk;Yoo, Ki-Won;Seo, Jung-Dong;Sohn, Kwang-Hoon
    • Journal of Broadcast Engineering
    • /
    • v.13 no.3
    • /
    • pp.310-318
    • /
    • 2008
  • The H.264/AVC standard achieves higher coding efficiency than previous video coding standards with the rate-distortion optimization (RDO) technique which selects the best coding mode and reference frame for each macroblock. As a result, the complexity of the encoder have been significantly increased. In this paper, a fast intra-mode decision algorithm is proposed to reduce the computational load of intra-mode search, which is based on the inverse tree-structure edge prediction algorithm. First, we obtained the dominant edge for each $4{\times}4$ block from local edge information, then the RDO process is only performed by the mode which corresponds to dominant edge direction. Then, for the $8{\times}8$ (or $16{\times}16$) block stage, the dominant edge is calculated from its four $4{\times}4$ (or $16{\times}16$) blocks' dominant edges without additional calculation and the RDO process is also performed by the mode which is related to dominant edge direction. Experimental results show that proposed scheme can significantly improve the speed of the intra prediction with a negligible loss in the peak signal to noise ratio (PSNR) and a little increase of bits.

Adaptive Reference Structure Decision Method for HEVC Encoder (HEVC 부호화기의 적응적 참조 구조 변경 방법)

  • Mok, Jung-Soo;Kim, JaeRyun;Ahn, Yong-Jo;Sim, Donggyu
    • Journal of Broadcast Engineering
    • /
    • v.22 no.1
    • /
    • pp.1-14
    • /
    • 2017
  • This paper proposes adaptive reference structure decision method to improve the performance of HEVC (High Efficiency Video Coding) encoder. When an event occurs in the input sequence, such as scene change, scene rotation, fade in/out, or light on/off, the proposed algorithm changes the reference structure to improve the inter prediction performance. The proposed algorithm divides GOP (Group Of Pictures) into two sub-groups based on the picture that has such event and decides the reference pictures in the divided sub-groups. Also, this paper proposes fast encoding method which changes the picture type of first encoded picture in the GOP that has such event to CRA (Clean Random Access). With the statistical feature that intra prediction is selected by high probability for the first encoded picture in the GOP carrying such event, the proposed fast encoding method does not operate inter prediction. The experimental result shows that the proposed adaptive reference structure decision method improves the BD-rate 0.3% and reduces encoding time 4.9% on average under the CTC (Common Test Condition) for standardization. In addition, the proposed reference structure decision method with the picture type change reduces the average encoding time 12.2% with 0.11% BD-rate loss.

Adaptive chroma scanning order decision using correlation of luma with chroma (휘도성분과 색차성분의 유사성을 이용한 색차성분의 적응적 스캐닝 오더 결정 방법)

  • Yoo, Sung-Eun;Sim, Dong-Gyu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.592-594
    • /
    • 2011
  • 본 논문에서는 휘도성분과 색차성분의 유사성을 이용하여 부호화 성능을 향상시키기 위한 방법을 제안한다. 하나의 영상을 구성하는 휘도성분과 색차성분은 유사성이 높아 그 유사성을 이용하여 부호화 효율을 높이는 것이 가능하다. 현재 CU(Coding Unit)를 압축할 때 화면 내 예측방법을 사용한다면, 색차성분의 화면 내 예측모드가 휘도성분의 정보를 이용하는 경우에 본 논문의 알고르듬을 적용한다. 색차성분이 휘도성분의 정보를 이용하는 경우에는 휘도성분과 색차성분 간 유사도가 높다는 것을 의미하기 때문에 휘도성분의 스캔방법을 기본으로 중요한 변환계수의 위치정보를 이용하여 색차성분의 스캔 방법을 적응적으로 결정한다. 현재 배포된 HEVC의 레퍼런스 소프트웨어인 HM 3.1을 이용하여 실험한 결과 색차성분에 대해 0.39%의 부호화 효율을 있음을 확인할 수 있었다.

  • PDF

H.264/AVC Fast Encoding Mode Decision by Motion Activity of Macroblock (매크로블록의 움직임 특성을 고려한 H.264/AVC 고속 부호화 모드 결정)

  • Ahn, Yong-Jo;Nam, Jung-Hak;Sim, Dong-Gyu
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.343-345
    • /
    • 2010
  • H.264/AVC는 율-왜곡 계산에 기반한 화면 내 예측과 화면 간 예측을 통하여 높은 압축효율을 나타낸다. 그러나 모든 예측 모드의 율-왜곡 값을 계산하여 하나의 최적의 모드를 구하는 기존의 방법은 높은 계산량을 가지며 부호화에 걸리는 시간을 현저히 증가시킨다. 이러한 높은 계산량을 갖는 모든 예측모드의 율-왜곡 계산을 보완하기 위하여, 본 논문에서는 매크로블록의 움직임 특성 을 고려한 고속 부호화 모드 결정 방법을 제안한다. 각각의 매크로블록을 부호화하기 위해 미리 계산되는 SKIP모드에 대한 율-왜곡 값을 바탕으로 두 가지 문턱 값을 사용하여 움직임의 특성을 판단한다. 움직임의 특성에 따라 매크로블록은 3가지 분류로 나뉘게 되며, 각 분류에 따라 경쟁 모드를 적응적으로 선별하여 최적의 모드를 선택한다. 이러한 움직임 특성을 고려한 선택적 부호화 모드 결정을 통하여 부호화 효율의 큰 손실 없이 계산량을 감소시킴으로서 H.264/AVC의 고속 부호화가 가능한 x.264 대비 MMX를 사용하였을 때 16%, MMX를 사용하지 않았을 때 22%의 속도향상을 가져왔다.

  • PDF