• 제목/요약/키워드: Intra/Inter prediction

검색결과 80건 처리시간 0.023초

VVC 화면내 예측 및 부호화 주요 기술

  • 한희지;최재륜;권대혁;최해철
    • 방송과미디어
    • /
    • 제24권4호
    • /
    • pp.39-54
    • /
    • 2019
  • VVC(Versatile Video Coding)는 국제 표준화 단체인 JVET(Joint Video Exports Team)에서 표준화가 진행되고 있는 새로운 국제 비디오 부호화 표준이다. 이 표준화에서는 기존 최신 비디오 부호화 표준인 HEVC(High Efficiency Video Coding)/H.265 대비 2배 이상의 부호화 성능을 목표로 다양한 부호화 방법들이 논의되고 있다. 본 고에서는 VVC의 새로운 부호화 모드 중 화면내 예측(intra prediction) 부호화 방법에 대해 소개한다. 화면내 예측은 현재 부호화를 진행하려는 블록의 주변에 이미 재구성된 샘플들을 참조하여 현재 블록을 예측하는 방법이다. 이 화면내 부호화 방법은 화면간 예측(inter prediction) 부호화 방법과 함께 부호화 효율 향상에 기여할 뿐만 아니라, 임의 접근(random access)을 가능하게 하고 부호화된 비트스트림의 에러 내성을 높인다. VVC는 화면내 부호화 예측 모드 종류를 최대 87개까지 확장하고 다양한 화면내 부호화 방법을 채택함으로써 기존 비디오 부호화 표준에 비해 높은 부호화 효율을 갖는다. 본 고에서는 VVC에 채택된 주요 화면내 부호화 방법들을 소개한다.

Shuffled Discrete Sine Transform in Inter-Prediction Coding

  • Choi, Jun-woo;Kim, Nam-Uk;Lim, Sung-Chang;Kang, Jungwon;Kim, Hui Yong;Lee, Yung-Lyul
    • ETRI Journal
    • /
    • 제39권5호
    • /
    • pp.672-682
    • /
    • 2017
  • Video compression exploits statistical, spatial, and temporal redundancy, as well as transform and quantization. In particular, the transform in a frequency domain plays a major role in energy compaction of spatial domain data into frequency domain data. The high efficient video coding standard uses the type-II discrete cosine transform (DCT-II) and type-VII discrete sine transform (DST-VII) to improve the coding efficiency of residual data. However, the DST-VII is applied only to the Intra $4{\times}4$ residual block because it yields relatively small gains in the larger block than in the $4{\times}4$ block. In this study, after rearranging the data of the residual block, we apply the DST-VII to the inter-residual block to achieve coding gain. The rearrangement of the residual block data is similar to the arrangement of the basis vector with a the lowest frequency component of the DST-VII. Experimental results show that the proposed method reduces the luma-chroma (Cb+Cr) BD rates by approximately 0.23% to 0.22%, 0.44% to 0.58%, and 0.46% to 0.65% for the random access, low delay B, and low delay P configurations, respectively.

움직임 적응적인 무손실 영상 압축 알고리즘 (Motion Adaptive Lossless Image Compression Algorithm)

  • 김영로;박현상
    • 한국산학기술학회논문지
    • /
    • 제10권4호
    • /
    • pp.736-739
    • /
    • 2009
  • 영상 내의 움직임 적응적인 효과적인 무손실 영상 압축 알고리즘을 제안한다. 이 알고리즘은 비선형 예측기를 토대로 움직임에 적응하는 단계와, 예측기에 의한 차분 데이터를 압축하는 단계로 구성된다. 제안한 비선형 예측기는 과거의 예측 오차로부터 화면간 혹은 화면내 예측치를 선택하며, 움직임 적응 단계를 진행되면서 주변 화소들의 예측 오차를 고려하여, 현재 화소에 대한 예측 오차를 줄이는 능력을 가진다. 예측 오차는 기존의 문맥 적응적인 코딩 기법에 의해서 압축된다. 실험결과는 제안한 알고리즘이 FELICS, CALC, JPEG-LS와 같은 문맥 모델링에 기반을 둔 무손실 압축 기법보다 우수한 압축률을 보여준다.

H.264/AVC 부호기에서 움직임 벡터 맵을 이용한 적응적인 부호화 모드 결정 방법 (Adaptive Coding Mode Decision Algorithm using Motion Vector Map in H.264/AVC Video Coding)

  • 김태정;고만근;서재원
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.48-56
    • /
    • 2009
  • 우리는 H.264/AVC의 비디오 부호화에서 조기 인트라 모드 생략을 결정하기 위한 알고리즘을 제안한다. 새롭게 추가된 다양한 예측 방법들에 의한 매크로블록 부호화 방법은 압축의 효율의 증가를 가져오지만, 모든 부호화 가능한 모드에 대해 율-왜곡 함수를 계산하여 가장 효율이 좋은 모드를 선택하기 때문에 상당한 계산량을 요구한다. 이 논문에서는 인터 프레임에 대한 부호화 시간을 감소시키기 위해서, 적응적인 움직임 벡터 맵(AMVM)을 이용한 모드 결정 방법을 H.264/AVC 비디오 부호화기에서 제안한다. 제안한 알고리즘은 PSNR과 Bit rate 그리고 부호화 처리시간에 대해서 일반적으로 좋은 성능을 가진다.

Endolichenic Fungal Community Analysis by Pure Culture Isolation and Metabarcoding: A Case Study of Parmotrema tinctorum

  • Yang, Ji Ho;Oh, Seung-Yoon;Kim, Wonyong;Hur, Jae-Seoun
    • Mycobiology
    • /
    • 제50권1호
    • /
    • pp.55-65
    • /
    • 2022
  • Lichen is a symbiotic mutualism of mycobiont and photobiont that harbors diverse organisms including endolichenic fungi (ELF). Despite the taxonomic and ecological significance of ELF, no comparative investigation of an ELF community involving isolation of a pure culture and high-throughput sequencing has been conducted. Thus, we analyzed the ELF community in Parmotrema tinctorum by culture and metabarcoding. Alpha diversity of the ELF community was notably greater in metabarcoding than in culture-based analysis. Taxonomic proportions of the ELF community estimated by metabarcoding and by culture analyses showed remarkable differences: Sordariomycetes was the most dominant fungal class in culture-based analysis, while Dothideomycetes was the most abundant in metabarcoding analysis. Thirty-seven operational taxonomic units (OTUs) were commonly observed by culture-and metabarcoding-based analyses but relative abundances differed: most of common OTUs were underrepresented in metabarcoding. The ELF community differed in lichen segments and thalli in metabarcoding analysis. Dissimilarity of ELF community intra lichen thallus increased with thallus segment distance; inter-thallus ELF community dissimilarity was significantly greater than intra-thallus ELF community dissimilarity. Finally, we tested how many fungal sequence reads would be needed to ELF diversity with relationship assays between numbers of lichen segments and saturation patterns of OTU richness and sample coverage. At least 6000 sequence reads per lichen thallus were sufficient for prediction of overall ELF community diversity and 50,000 reads per thallus were enough to observe rare taxa of ELF.

MPEG-2의 GOP 구조를 이용한 I 프레임의 시공간적 오류 은닉 (Spatio-Temporal Error Concealment of I-frame using GOP structure of MPEG-2)

  • 강민정;류철
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.72-82
    • /
    • 2004
  • 본 논문은 MPEG-2 인트라 (I) 프레임의 더욱 강화된 오류 은닉 기술을 제안한다. MPEG-2 소스 부호화 알고리즘은 가변장 부호화를 사용하기 때문에 채널 오류에 매우 민감하다. 채널에서 발생된 전송 오류는 오류 정정 기술을 사용하여 보정되지만 제대로 보정되지 않은 오류는 디코더에서 오류 은닉 기술을 사용함으로써 시각적 왜곡이 최소화될 수 있다. 또한 GOP의 시작 프레임인 I 프레임의 오류는 움직임 보상 예측 부호화 방식으로 인하여 다른 인터 프레임에 전달되어 더욱 심각한 화질 저하를 가져온다. 본 논문에서 제안하는 오류 은닉 방식은 I 프레임에 발생된 연속적인 슬라이스 오류를 인접한 인터 프레임의 시공간적 정보를 이용하여 기존 방식보다 효과적으로 처리하는 방식이다. 이 방식은 기존의 방식들이 갖는 시간적 그리고 공간적에서 발생하는 단점을 효율적으로 개선할 수 있으며, 전송 오류가 심한 망에서 발생되는 극심한 슬라이스 오류에서도 좋은 시각적 효과를 얻을수 있다. 알고리즘은 MPEG-2 비디오 코덱 범위에서 수행되었으며 모의실험을 통하여 제안된 방식이 다른 방식들보다 높은 PSNR과 개선된 시각적 효과를 확인할 수 있었다.

H.264/AVC에서 PSNR 예측을 이용한 고속 매크로블록 모드 결정 방법 (A Fast Macroblock Mode Decision Method using PSNR Prediction for H.264/AVC)

  • 박성재;명진수;심동규;오승준
    • 방송공학회논문지
    • /
    • 제13권1호
    • /
    • pp.137-151
    • /
    • 2008
  • H.264/AVC는 새로운 부호화 기술을 이용하여 기존의 비디오 표준보다 높은 압축 효율을 나타내고 있다. 특히 다양한 블록 크기의 움직임 예측 방법과 비트율-왜곡 최적화 기법은 H.264/AVC에서 중요한 부호화 기술로써 높은 압축 효율을 나타내고 있지만 부호화기의 높은 복잡도를 보이는 단점이 있다. 본 논문에서는 H.264/AVC 부호화기의 높은 복잡도를 줄이기 위하여 조기 SKIP 모드 결정 방법과 선택적 인터/인트라 예측 모드 결정 방법을 제안한다. 실험결과 제안방법은 JM10.2에 비해 전체적인 영상에서 평균적으로 약 30%의 부호화 시간을 감소시켰으며, 부호화 효율의 손실은 무시할 정도로 작았다. 또한 제안 방법은 이전에 제안되었던 고속의 모드 결정 방법(FCMS)[5]과 비교하여 2배 이상의 속도 이득을 나타내었다.

3D-Distortion Based Rate Distortion Optimization for Video-Based Point Cloud Compression

  • Yihao Fu;Liquan Shen;Tianyi Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권2호
    • /
    • pp.435-449
    • /
    • 2023
  • The state-of-the-art video-based point cloud compression(V-PCC) has a high efficiency of compressing 3D point cloud by projecting points onto 2D images. These images are then padded and compressed by High-Efficiency Video Coding(HEVC). Pixels in padded 2D images are classified into three groups including origin pixels, padded pixels and unoccupied pixels. Origin pixels are generated from projection of 3D point cloud. Padded pixels and unoccupied pixels are generated by copying values from origin pixels during image padding. For padded pixels, they are reconstructed to 3D space during geometry reconstruction as well as origin pixels. For unoccupied pixels, they are not reconstructed. The rate distortion optimization(RDO) used in HEVC is mainly aimed at keeping the balance between video distortion and video bitrates. However, traditional RDO is unreliable for padded pixels and unoccupied pixels, which leads to significant waste of bits in geometry reconstruction. In this paper, we propose a new RDO scheme which takes 3D-Distortion into account instead of traditional video distortion for padded pixels and unoccupied pixels. Firstly, these pixels are classified based on the occupancy map. Secondly, different strategies are applied to these pixels to calculate their 3D-Distortions. Finally, the obtained 3D-Distortions replace the sum square error(SSE) during the full RDO process in intra prediction and inter prediction. The proposed method is applied to geometry frames. Experimental results show that the proposed algorithm achieves an average of 31.41% and 6.14% bitrate saving for D1 metric in Random Access setting and All Intra setting on geometry videos compared with V-PCC anchor.

Empirical ground motion model for Vrancea intermediate-depth seismic source

  • Vacareanu, Radu;Demetriu, Sorin;Lungu, Dan;Pavel, Florin;Arion, Cristian;Iancovici, Mihail;Aldea, Alexandru;Neagu, Cristian
    • Earthquakes and Structures
    • /
    • 제6권2호
    • /
    • pp.141-161
    • /
    • 2014
  • This article presents a new generation of empirical ground motion models for the prediction of response spectral accelerations in soil conditions, specifically developed for the Vrancea intermediate-depth seismic source. The strong ground motion database from which the ground motion prediction model is derived consists of over 800 horizontal components of acceleration recorded from nine Vrancea intermediate-depth seismic events as well as from other seventeen intermediate-depth earthquakes produced in other seismically active regions in the world. Among the main features of the new ground motion model are the prediction of spectral ordinates values (besides the prediction of the peak ground acceleration), the extension of the magnitudes range applicability, the use of consistent metrics (epicentral distance) for this type of seismic source, the extension of the distance range applicability to 300 km, the partition of total standard deviation in intra- and inter-event standard deviations and the use of a national strong ground motion database more than two times larger than in the previous studies. The results suggest that this model is an improvement of the previous generation of ground motion prediction models and can be properly employed in the analysis of the seismic hazard of Romania.

HEVC 부호화기의 적응적 참조 구조 변경 방법 (Adaptive Reference Structure Decision Method for HEVC Encoder)

  • 목정수;김재련;안용조;심동규
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.1-14
    • /
    • 2017
  • 본 논문에서는 HEVC (High Efficiency Video Coding) 부호화기의 성능 향상을 위한 적응적 참조 구조 변경 방법을 제안한다. 제안하는 방법은 입력 영상 내에 장면 전환, 장면 회전, Light on/off, Fade in/out 등의 이벤트 발생 시 저하되는 화면 간 예측의 성능을 향상시키기 위해 참조 픽쳐 리스트를 수정하여 참조 구조를 변경한다. GOP (Group Of Pictures) 단위로 한정된 계층적 참조 구조에서 영상 이벤트가 발생한 픽쳐를 기준으로 두 개의 서브 그룹으로 분할하고 각각의 서브 그룹 내에서 참조 픽쳐를 결정한다. 이를 통해, 시간적 중복성이 높은 참조 픽쳐를 화면 간 예측에서 사용하여 부호화 효율을 향상시킨다. 또한, HEVC의 계층적 부호화 구조 특징을 이용하여 이벤트 발생 후 처음으로 부호화되는 픽쳐를 CRA (Clean Random Access) 픽쳐로 변경하여 부호화 속도를 향상시키는 방법을 제안한다. 제안하는 방법은 이벤트 발생 후 처음으로 부호화되는 프레임은 화면 내 예측이 매우 높은 확률로 선택된다는 통계적 특징을 기반으로 화면 간 예측을 수행하지 않는다. 실험 결과 본 논문에서 제안하는 적응적 참조 구조 변경 방법은 HM 16.0 대비 CTC (Common Test Condition)에서 평균 0.3%의 BD-rate를 개선하였으며 부호화 속도는 평균 4.9% 향상시켰다. 또한, 이벤트 발생에 따른 픽쳐 타입 변경 방법은 평균 0.11%의 BD-rate 저하가 있었지만 부호화 속도를 평균 12.2% 향상시킬 수 있었다.