• 제목/요약/키워드: video CODEC

검색결과 315건 처리시간 0.027초

IVC의 저지연 부호화 모드를 위한 비참조 P 프레임의 부호화 기법 (Non-Reference P Frame Coding for Low-Delay Encoding in Internet Video Coding)

  • 김동현;김진수;김재곤
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.250-256
    • /
    • 2014
  • 현재 MPEG에서 무료(royalty-free) 비디오 코덱으로 표준화 중인 IVC(Internet Video Coding)에서는 저지연(low-delay) 모드 부호화 구조에서 비참조 P 프레임 부호화 기법을 사용하여 부호화 성능 이득을 얻고 있다. IVC 시험모델 ITM(IVC Test Model) 4.0에 채택되어 있던 기존의 비참조 P 프레임 기법은 움직임 벡터(MV)의 크기를 이용하여 적응적으로 고정된 부호화 구조의 비참조 P 프레임을 적용하였으나 시퀀스에 따라서 오히려 부호화 성능이 크게 떨어지는 단점이 있었다. 본 논문에서는 이러한 기존의 적응적 비참조 P 프레임 부호화 성능을 개선하기 위하여 기존의 고정된 비참조 P 프레임의 구조를 변경하는 기법과 MV와 함께 참조 프레임 대비 비참조 프레임의 발생 비트량 비를 함께 사용하는 적응적 기법을 제시한다. 실험결과 제안된 기법은 시퀀스에 따른 큰 성능 저하 없이 ITM 7.0 대비 6.6% 정도의 비트율 감소를 얻음을 확인하였다.

지각적 동영상 부호화를 위한 선형 부 대역 분해 기반 전처리 기법 (Linear Sub-band Decomposition based Pre-processing Algorithm for Perceptual Video Coding)

  • 최광연;송병철
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.80-87
    • /
    • 2017
  • 본 논문에서는 선형 부 대역 분해를 이용하여 입력 영상을 분해하고 시각적 민감도가 낮은 고주파 영역만을 효과적으로 억제하여 지각적 동영상 부호화의 효율을 향상시킬 수 있는 전처리 기법을 제안한다. 먼저 소정의 선형 부 대역 분해로 각 입력영상을 여러 주파수 대역들로 나눈다. 그런 다음 인간의 시각적 구조에서 거의 인지가 되지 않는 고주파 대역들에만 1보다 작은 이득 값들을 적용하여 해당 주파수 대역 정보를 억제시킨다. 이와 같이 고주파가 억제된 영상들을 소정의 비디오 인코더로 압축한다. 모의 실험을 통해 제안 기법의 적용 전후 압축 결과를 비교하여 시각적 차이 없음을 확인하였다. 또한, 제안 기법을 H.264 인코더의 전처리로 적용하였을 때 적용 전 대비 평균 13.12%의 데이터 감소 효과를 얻었다.

차세대 비디오 부호화 실험모델(JEM)의 화면내 예측 모드 부호화 기법 (A Method of Intra Mode Coding for Joint Exploration Model (JEM))

  • 박도현;이진호;강정원;김재곤
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.495-502
    • /
    • 2018
  • HEVC(High Efficiency Video Coding) 보다 뛰어난 압축 성능을 갖는 차세대 비디오 부호화 표준 후보 기술에 대한 탐색과 검증을 진행한 JVET(Joint Video Exploration Team)은 기술 검증을 위한 참조 SW 코덱인 JEM(Joint Exploration Model)을 공개하였다. JEM은 HEVC의 35개 보다 증가한 67개의 화면내 예측 모드를 사용하고 있으며, 이에 따른 예측 모드 부호화에 대한 부담으로 부호화 성능 개선에 제한이 따른다. 본 논문에서는 화면내 예측 모드의 선택 확률을 분석하고, 이를 바탕으로 보다 효율적인 화면내 예측 모드 부호화 기법과 그 기법의 효율적인 엔트로피 부호화를 위한 문맥 모델링 기법을 제안한다. 실험결과 제안 기법은 AI(All Intra) 부호화 구조에서 JEM 7.0 대비 0.02%의 BD-rate 이득을 보였으며, 향후 추가적인 성능 향상을 위한 문맥 모델링 최적화에 대한 연구가 필요하다.

모바일 양방향 화상 교육시스템 개발에 관한 연구 (Mobile Interactive Broadcasting Learning Solution Study on Development of Education)

  • 김태달;이병권
    • 인터넷정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.57-63
    • /
    • 2012
  • 최근, 초고속 인터넷망의 발전으로 실시간으로 화상회의 시스템 구축이 가능하게 되었다. 아직도 SD 급의 소프트웨어 코덱을 사용한 화상시스템이 존재하며 모바일 시스템을 이용한 양 방향 시스템이 있지만 대부분 화상시스템으로 영상만 주고받는 실정이다. 본 연구에서는 HD 웹-캠을 사용하여 양 방향 실시간 방송교육 시스템을 구축하고 모바일 시스템에서도 동시에 청취 가능한 시스템을 개발했다. 이를 위해 H.264 표준 영상 압축 기술을 이용한 고대역 압축 기술을 적용하였고, 스마트폰 방송을 위한 스트리밍 서버를 개발하여 적용했다. 영상공유, 문서, 웹-공유가 실시간으로 가능하게 되었다. 또한, WiFi 존에서 사용되는 사설 IP를 언제 어디서나 사용 가능하게 공인 IP로 변환 가능한 기술인 IP 터널링 기술을 적용했다.

HEVC 고성능 압축 도구들의 성능 분석을 통한 스크린 콘텐츠 응용 최적 부호화 모델 (Optimal Coding Model for Screen Contents Applications from the Coding Performance Analysis of High Efficient Coding Tools in HEVC)

  • 한찬희;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.544-554
    • /
    • 2012
  • 카메라에 의해 촬영되는 자연 영상과 달리 컴퓨터나 스마트폰 등과 같은 다양한 전자기기에 의해 생성/랜더링(rendering)된 영상이나 동영상을 스크린 콘텐츠라 한다. 스크린 콘텐츠는 자연영상과는 구별되는 통계적 특성을 가지고 있기 때문에 자연 영상 혹은 동영상을 대상으로 하는 지금까지의 압축표준을 이용하는 경우 압축효율이 저하될 수밖에 없다. 스크린 콘텐츠의 효율적인 압축을 위한 연구가 최근 들어 활발히 이루어지고 있으며, 특히 현재 진행 중인 고효율 동영상 부호화(HEVC : High Efficiency Video Coding)의 표준을 위한 JCT-VC(Joint Collaborative Team on Video Coding) 회의에서 스크린 콘텐츠가 가지는 특성에 적합한 압축 방식들이 지속적으로 논의 되고 있다. 본 논문에서는 HEVC 참조 소프트웨어인 HM(HEVC Test Model)의 고성능 압축 도구들에 대해 스크린 콘텐츠 압축 효율성을 분석하고, 분석을 통해 얻어진 결과를 기반으로 스크린 콘텐츠 응용에 최적화된 부호화 모델을 제시한다. 또한, 스크린 콘텐츠가 자연동영상과 구별되는 특성들과 스크린 콘텐츠 응용에서의 HEVC 적용을 위한 앞으로의 연구쟁점을 제시한다.

어텐션 알고리듬 기반 양방향성 LSTM을 이용한 동영상의 압축 표준 예측 (Video Compression Standard Prediction using Attention-based Bidirectional LSTM)

  • 김상민;박범준;정제창
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.870-878
    • /
    • 2019
  • 본 논문에서는 어텐션 알고리듬 (attention algorithm) 기반의 양방향성 LSTM (bidirectional long short-term memory; BLSTM) 을 동영상의 압축 표준을 예측하기 위해 사용한다. 자연어 처리 (natural language processing; NLP) 분야에서 순환적 신경망 (recurrent neural networks; RNN) 의 구조를 이용하여 문장의 다음 단어를 예측하거나 의미에 따라 문장을 분류하거나 번역하는 연구들은 계속되어왔고, 이는 챗봇, 음성인식 스피커, 번역 애플리케이션 등으로 상용화되었다. LSTM 은 RNN에서 gradient vanishing problem 을 해결하고자 고안됐고, NLP 분야에서 유용하게 사용되고 있다. 제안한 알고리듬은 BLSTM과 특정 단어에 집중하여 분류할 수 있는 어텐션 알고리듬을 자연어 문장이 아닌 동영상의 비트스트림에 적용해 동영상의 압축 표준을 예측하는 것이 가능하다.

딥러닝 기반 컨텐츠 적응적 영상 압축 기술 동향 (Survey on Deep learning-based Content-adaptive Video Compression Techniques)

  • 한창우;김홍일;강현구;권형진;임성창;정승원
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.527-537
    • /
    • 2022
  • 멀티미디어 컨텐츠의 수요와 공급이 증가함에 따라 전 세계의 인터넷 트래픽이 증가하는 가운데 이를 완화하기 위해 여러 표준화 그룹에서는 더 효율적인 압축 표준을 제정하는데 노력을 기울이고 있다. 이러한 노력 중 압축 표준에 딥러닝 기술을 도입하고자 하는 연구들이 활발히 진행되고 있다. 그러나 딥러닝 기반 압축 기술은 학습 데이터와 특성이 다른 영상을 압축할 때 압축 효율이 저하되는 문제를 갖는다. 이를 해결하기 위해 컨텐츠에 적응적으로 딥러닝 기술을 도입하는 시도들이 있었다. 본 논문에서는 이들을 크게 코덱 정보 사용, 모델 선택, 추가 정보 전송의 세 가지로 나누어 살펴보고자 한다.

HEVC 기반 초해상화를 이용한 비디오 부호화 효율 성능 분석 (Performance Analysis of Super-Resolution based Video Coding for HEVC)

  • 기세환;김대은;전기남;백승호;최증원;김동현;김문철
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.306-314
    • /
    • 2019
  • 영상의 해상도가 빠른 속도로 증가하기 때문에 계속된 전송 대역폭의 증가에도 불구하고 여전히 효과적인 영상 압축 방법에 대한 연구의 요구가 계속 되고 있다. 이와 같은 요구를 충족하기 위해서 영상의 해상도를 줄인 뒤 압축하여 전송한 뒤에 복원 시에 초해상화 기법을 사용하여 원 해상도로 복원하는 방법에 대한 연구가 제안되었다. 이 방법은 입력 영상의 해상도를 낮추기 때문에 동일한 크기로 압축한다고 할 때, 픽셀 당 비트의 수가 증가되어 영상 압축에서 발생되는 손실을 줄여 복원 영상을 화질을 높일 수 있다. 하지만, 이러한 초해상화를 이용한 비디오 압축 방법의 경우 모든 목표 전송 대역에서 효과적인 것이 아니다. 영상 해상도를 줄이면서 발생되는 손실의 크기와 압축에서 발생되는 손실의 크기를 비교해서 영상 압축에서 발생되는 왜곡이 더 큰 경우에만 기존 압축 성능보다 향상된 결과를 얻을 수 있다. 특히, HEVC의 경우 이전의 표준 압축에 비해 상당히 높은 압축 성능을 가지고 있기 때문에 압축 왜곡이 더 커지는 경우가 상당히 저 대역폭 전송 에서만 생기는 것을 실험적으로 확인할 수 있었다. 본 논문에서는 다양한 영상에서 HEVC 기반 초해상화를 이용한 비디오 코딩을 적용해보고 효과적으로 적용될 수 있는 목표 대역폭을 측정해보았다.

차세대 비디오 코덱(JEM)의 고속 QTBT 분할 깊이 결정 기법 (A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.541-547
    • /
    • 2017
  • 차세대 비디오 부호화 표준 기술 탐색을 진행하고 있는 JVET(Joint Video Exploration Team)의 참조 SW 코덱인 JEM(Joint Exploration Model)은 재귀적 QTBT(Quadtree plus Binary Tree) 분할 구조의 부호화단위(CU)를 제공한다. QTBT를 통하여 새로운 블록 형태를 추가하여 부호화 효율 이득을 얻을 수 있는 반면, 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 JEM 부호화기의 복잡도 감소를 위해 상위 분할 깊이(depth)와 현재 분할 깊이의 율-왜곡(Rate-Distortion: RD) 비용을 사용하는 고속 블록 분할 깊이 결정 기법을 제안한다. 실험결과 JEM 5.0 대비 AI(All Intra) 부호화 구조에서 0.7%의 BD-rate 증가에 21.6%의 부호화 시간 감소를 보였고, RA(Random Access)에서는 1.2%의 BD-rate 증가에 11.0%의 시간 감소 효과를 얻을 수 있었다.

GPU를 이용한 실시간 양안식 영상 생성 방법 (Real-time Stereo Video Generation using Graphics Processing Unit)

  • 신인용;호요성
    • 방송공학회논문지
    • /
    • 제16권4호
    • /
    • pp.596-601
    • /
    • 2011
  • 양안식 3차원 방송의 경우 좌우 두 시점에 해당하는 영상을 동시에 전송해야 하기 때문에 전송 대역폭의 부담이 매우 크다. 이러한 부담을 줄이기 위해 좌우 시점의 두 영상을 전송하는 대신에 좌영상과 이에 해당하는 깊이맵을 부호화하여 전송하는 방법이 있다. 이러한 3차원 방송 시스템의 수신단에서는 좌영상과 깊이맵을 복호한 뒤에 우영상을 만들어 좌우 영상을 실시간으로 출력한다. 본 논문에서는 좌영상과 깊이맵을 이용하여 가상시점 영상을 생성할 때 생기는 빈 공간을 효율적으로 채우는 기법을 제안하고, 전 과정의 실시간 처리를 위해 이를 GPU상에서 병렬로 처리되도록 구현했다. 그 결과 효과적으로 홀 채움을 수행하면서 CPU 대비 15배 이상 빠르게 양안식 영상을 생성할 수 있었다.