• 제목/요약/키워드: Prediction Mode

검색결과 848건 처리시간 0.03초

Rough Mode Decision과 Most Probable Mode에 기반을 둔 HEVC 고속 인트라 예측 모드 결정 방법 (Fast Intra Prediction Mode Decision based on Rough Mode Decision and Most Probable Mode in HEVC)

  • 이승호;박상효;장의선
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.158-165
    • /
    • 2014
  • 최신 동영상 압축 표준 기술인 HEVC (High Efficiency Video Coding)는 기존의 AVC/H.264와 비교하여 동일 화질 대비 약 2배의 높은 압축률을 보여준다. 하지만 이러한 성능을 얻기 위하여 복잡한 연산이 필요한 기법들을 많이 도입한 결과, HEVC의 시간 복잡도는 AVC/H.264보다 더욱 증가하게 되었다. 이러한 문제를 해결하기 위하여 다양한 고속 알고리즘 연구가 진행되고 있다. 본 논문에서는 HEVC에 구현된 RMD (Rough Mode Decision)의 결과와 MPM (Most Probable Mode)을 활용하여 고속화된 최적 예측 모드 결정 방법을 제안한다. 제안한 방법은 RMD 과정에서 계산한 예측 방향과 MPM 도출 과정에서 계산한 예측 방향을 비교하여 최적 예측 방향을 선정한다. 이 방법을 All-Intra 환경에서 실험한 결과, 평균 0.8%의 BD-rate 손실이 발생하였고 전체 부호화 실행 시간은 평균 26% 감소하였다.

개선된 H.264/AVC 인트라 예측 방법 (Improved H.264/AVC intra prediction method)

  • 전주일;김재민;강현수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.993-994
    • /
    • 2008
  • There are nine modes of the intra prediction for $4{\times}4$ luma blocks in H.264/AVC, each of which is identified by the prediction direction and reference pixels. Especially, mode 8 is modified to enhance coding efficiency, considering that the mode does not use left-bottom pixels although they are available. That is, we propose a modified intra prediction method of mode 8 which uses left-bottom pixels if available.

  • PDF

Error Concealment Using Intra-Mode Information Included in H.264/AVC-Coded Bitstream

  • Kim, Dong-Hyung;Jeong, Se-Yoon;Choi, Jin-Soo;Jeon, Gwang-Gil;Kim, Seung-Jong;Jeong, Je-Chang
    • ETRI Journal
    • /
    • 제30권4호
    • /
    • pp.506-515
    • /
    • 2008
  • The H.264/AVC standard has adopted new coding tools such as intra-prediction, variable block size, motion estimation with quarter-pixel-accuracy, loop filter, and so on. The adoption of these tools enables an H.264/AVC-coded bitstream to have more information than was possible with previous standards. In this paper, we propose an effective spatial error concealment method with low complexity in H.264/AVC intra-frame. From information included in an H.264/AVC-coded bitstream, we use prediction modes of intra-blocks to recover a damaged block. This is because the prediction direction in each prediction mode is highly correlated to the edge direction. We first estimate the edge direction of a damaged block using the prediction modes of the intra-blocks adjacent to a damaged block and classify the area inside the damaged block into edge and flat areas. Our method then recovers pixel values in the edge area using edge-directed interpolation, and recovers pixel values in the flat area using weighted interpolation. Simulation results show that the proposed method yields better video quality than conventional approaches.

  • PDF

주관적 관심영역 중요도를 고려한 화면내 예측 간소화 방법 (A Simplification Method of Intra Prediction Considering Importance of Subjective Interest Region)

  • 이호영;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제12권7호
    • /
    • pp.922-928
    • /
    • 2009
  • 최신 비디오 부호화 표준인 H.264에서는 화면내 예측으로 화소블록의 신호값을 예측하기 위하여 9개의 모드를 사용한다. 이러한 과정을 거쳐 화면내 부호화신호에서 우수한 압축율을 가져을 수 있으나 9가지 예측 모드 전체 사용은 인접화소 비교로 인해 발생되는 연산량 또는 탐색건수로 복잡도가 증가되는 비효율성을 내재하고 있다. 본 논문에서는 주관적 관심영역을 고려한 화면내 예측모드의 간소화 방법을 제안한다. 비디오 신호의 각 화면에는 관심이 주어지는 특정영역이 존재한다. 이러한 영역은 다른 영역에 비하여 더 좋은 주관적화질 제공이 필요하다. 제안된 방법은 주관적 관심이 높은 영역에 비하여 주관적 관심이 낮은 영역에는 9개의 모드중에 필수모드만을 제공하여 예측모드 간소화를 높여준다. 예측특성만을 고려하여 화면 전체에 간소화를 주는 기존 방법에 비하여 제안된 방법은 추가적으로 11%$\sim$15%의 예측모드 간소화가 가능하다.

  • PDF

3차원 비디오 압축에서의 다시점 부호화를 위한 적응적 시공간적 예측 부호화 (Adaptive Spatio-Temporal Prediction for Multi-view Coding in 3D-Video)

  • 성우철;이영렬
    • 방송공학회논문지
    • /
    • 제9권3호
    • /
    • pp.214-224
    • /
    • 2004
  • 본 논문에서는 차세대 실감형 3차원 영상 처리와 3차원 TV 3차원 화상회의 등과 같은 3차원 실감 미디어의 부호화에 적합한 H.264 기반의 적응적 시공간적 예측 부호화를 제안한다. 첫 번째로, 두 가지의 IPPP와 IBBP GOP(group of picture) 구조에서 기존의 동시방송(simulcast) 방식과 다르게 same-view와 inter-view 영상의 적응적 시공간적 예측 부호화를 제안한다. 두 번째로, GOP 구조가 IBBP에서 제안된 inter-view 방식의 예측 부호화시 B(hi-predictive) 화면이 MB(macroblock) 모드중 하나인 시간적 직접방식(temporal direct mode)을 수행하려고 할 때 참조 화면이 inter-view 영상을 참조하는 경우 현재의 시간적 직접 방식을 효율적으로 수행하기 위해서 2차원 inter-view 직접 방식을 제안한다. 제안된 방식은 실험결과에서 기존의 동시방송 방식과 비교되었으며 각각의 GOP 구조 모두 화질 면에서 우수한 결과를 확인할 수 있었다.

통계적 확률 기반의 효율적인 고속 화면 내 모드 예측 방법 (Efficient High-Speed Intra Mode Prediction based on Statistical Probability)

  • 임웅;남정학;정광수;심동규
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.44-53
    • /
    • 2010
  • H.264/AVC는 공간적 중복성을 제거하기 위하여 9개의 화면 내 예측모드를 사용하도록 설계되었다. 또한, 모드 정보의 전송을 위하여 이웃한 블록의 모드간의 높은 상관도를 사용한다. 모드를 표현할 때, 더 높은 확률을 가진 모드에 더 적은 비트가 할당되며, 이웃한 두 개 블록의 예측모드 간에 최소값을 취하여 예측함으로써 압축된다. 본 논문에서는, 몇 개의 테스트 비디오 시퀀스를 사용하여 왼쪽과 위쪽의 이웃한 두 블록의 모드에 따라서 발생하는 현재 블록의 예측모드에 대한 통계적 확률을 구하였다. 다음으로 왼쪽과 위쪽의 이웃한 두 블록의 예측모드의 모든 조합에 대하여 현재 블록에서 결정될 확률이 가장 높은 5개 모드를 후보 예측모드로 하여 테이블로 구성한다. 이 확률 테이블을 사용하여, 선택된 5개의 후보 모드들만 율-왜곡 최적화를 수행함으로써 부호화 과정을 고속화하고, 각각의 경우에서 가장 높은 발생 확률을 갖는 모드를 most probable mode로 사용하여 모드 정보를 줄임으로써 부호화 성능을 높이는 방법을 제안한다. 제안한 알고리즘의 부호화 성능은 5개 후보 모드의 발생확률의 합이 90%, 85%, 80%이상인 경우에 대하여 JM14.2 대비 각각 1.17%, 1.50%, 1.19% 향상되었으며 부호화 속도는 18.46%, 27.97%, 36.03% 향상되었다.

코딩 모드 영상 특성기반의 고속 직접모드 결정 알고리즘 (A Coding Mode Image Characteristics-based Fast Direct Mode Decision Algorithm)

  • 최영호;한수희;김낙교
    • 전기학회논문지
    • /
    • 제61권8호
    • /
    • pp.1199-1203
    • /
    • 2012
  • H.264 adopted many compression tools to increase image data compression efficiency such as B frame bi-directional predictions, the direct mode coding and so on. Despite its high compression efficiency, H.264 can suffer from its long coding time due to the complicated tools of H.264. To realize a high performance H.264, several fast algorithms were proposed. One of them is adaptive fast direct mode decision algorithm using mode and Lagrangian cost prediction for B frame in H.264/AVC (MLP) algorithm which can determine the direct coding mode for macroblocks without a complex mode decision process. However, in this algorithm, macroblocks not satisfying the conditions of the MLP algorithm are required to process the complex mode decision calculation, yet suffering a long coding time. To overcome the problem, this paper proposes a fast direct mode prediction algorithm. Simulation results show that the proposed algorithm can determine the direct mode coding without a complex mode decision process for 42% more macroblocks and, this algorithm can reduce coding time by up to 23%, compared with Jin's algorithm. This enables to encode B frames fast with a less quality degradation.

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

  • Yeo, Woon-Ha;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제8권3호
    • /
    • pp.147-158
    • /
    • 2021
  • Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.

Runoff Prediction from Machine Learning Models Coupled with Empirical Mode Decomposition: A case Study of the Grand River Basin in Canada

  • Parisouj, Peiman;Jun, Changhyun;Nezhad, Somayeh Moghimi;Narimani, Roya
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.136-136
    • /
    • 2022
  • This study investigates the possibility of coupling empirical mode decomposition (EMD) for runoff prediction from machine learning (ML) models. Here, support vector regression (SVR) and convolutional neural network (CNN) were considered for ML algorithms. Precipitation (P), minimum temperature (Tmin), maximum temperature (Tmax) and their intrinsic mode functions (IMF) values were used for input variables at a monthly scale from Jan. 1973 to Dec. 2020 in the Grand river basin, Canada. The support vector machine-recursive feature elimination (SVM-RFE) technique was applied for finding the best combination of predictors among input variables. The results show that the proposed method outperformed the individual performance of SVR and CNN during the training and testing periods in the study area. According to the correlation coefficient (R), the EMD-SVR model outperformed the EMD-CNN model in both training and testing even though the CNN indicated a better performance than the SVR before using IMF values. The EMD-SVR model showed higher improvement in R value (38.7%) than that from the EMD-CNN model (7.1%). It should be noted that the coupled models of EMD-SVR and EMD-CNN represented much higher accuracy in runoff prediction with respect to the considered evaluation indicators, including root mean square error (RMSE) and R values.

  • PDF

A Hilbert-Huang Transform Approach Combined with PCA for Predicting a Time Series

  • Park, Min-Jeong
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.995-1006
    • /
    • 2011
  • A time series can be decomposed into simple components with a multiscale method. Empirical mode decomposition(EMD) is a recently invented multiscale method in Huang et al. (1998). It is natural to apply a classical prediction method such a vector autoregressive(AR) model to the obtained simple components instead of the original time series; in addition, a prediction procedure combining a classical prediction model to EMD and Hilbert spectrum is proposed in Kim et al. (2008). In this paper, we suggest to adopt principal component analysis(PCA) to the prediction procedure that enables the efficient selection of input variables among obtained components by EMD. We discuss the utility of adopting PCA in the prediction procedure based on EMD and Hilbert spectrum and analyze the daily worm account data by the proposed PCA adopted prediction method.