• 제목/요약/키워드: 미디어 AI

검색결과 349건 처리시간 0.024초

차세대 비디오 코덱(JEM)의 고속 QTBT 분할 깊이 결정 기법 (A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.541-547
    • /
    • 2017
  • 차세대 비디오 부호화 표준 기술 탐색을 진행하고 있는 JVET(Joint Video Exploration Team)의 참조 SW 코덱인 JEM(Joint Exploration Model)은 재귀적 QTBT(Quadtree plus Binary Tree) 분할 구조의 부호화단위(CU)를 제공한다. QTBT를 통하여 새로운 블록 형태를 추가하여 부호화 효율 이득을 얻을 수 있는 반면, 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 JEM 부호화기의 복잡도 감소를 위해 상위 분할 깊이(depth)와 현재 분할 깊이의 율-왜곡(Rate-Distortion: RD) 비용을 사용하는 고속 블록 분할 깊이 결정 기법을 제안한다. 실험결과 JEM 5.0 대비 AI(All Intra) 부호화 구조에서 0.7%의 BD-rate 증가에 21.6%의 부호화 시간 감소를 보였고, RA(Random Access)에서는 1.2%의 BD-rate 증가에 11.0%의 시간 감소 효과를 얻을 수 있었다.

차세대 비디오 부호화 실험모델(JEM)의 화면내 예측 모드 부호화 기법 (A Method of Intra Mode Coding for Joint Exploration Model (JEM))

  • 박도현;이진호;강정원;김재곤
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.495-502
    • /
    • 2018
  • HEVC(High Efficiency Video Coding) 보다 뛰어난 압축 성능을 갖는 차세대 비디오 부호화 표준 후보 기술에 대한 탐색과 검증을 진행한 JVET(Joint Video Exploration Team)은 기술 검증을 위한 참조 SW 코덱인 JEM(Joint Exploration Model)을 공개하였다. JEM은 HEVC의 35개 보다 증가한 67개의 화면내 예측 모드를 사용하고 있으며, 이에 따른 예측 모드 부호화에 대한 부담으로 부호화 성능 개선에 제한이 따른다. 본 논문에서는 화면내 예측 모드의 선택 확률을 분석하고, 이를 바탕으로 보다 효율적인 화면내 예측 모드 부호화 기법과 그 기법의 효율적인 엔트로피 부호화를 위한 문맥 모델링 기법을 제안한다. 실험결과 제안 기법은 AI(All Intra) 부호화 구조에서 JEM 7.0 대비 0.02%의 BD-rate 이득을 보였으며, 향후 추가적인 성능 향상을 위한 문맥 모델링 최적화에 대한 연구가 필요하다.

VVC의 기울기 기반 화면내 예측모드 결정 및 블록분할 고속화 기법 (Gradient-Based Methods of Fast Intra Mode Decision and Block Partitioning in VVC)

  • 윤용욱;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.338-345
    • /
    • 2020
  • 차세대 비디오 부호화 표준으로 진행중인 VVC(Versatile Video Coding)는 HEVC(High Efficiency Video Coding)보다 두 배 이상의 압축 성능을 달성하기 위해 다양한 기술들을 채택하고 있다. 최근 배포된 VVC 참조 SW 코덱인 VTM(VVC Test Model)은 HEVC 대비 38% 이상의 BD-rate 부호화 성능 향상을 보이는 반면 부호화와 복호화 복잡도가 각각 9배, 2배 정도 증가를 보인다. 특히, 재귀적 MTT(Multi-Type Tree) 분할 구조와 HEVC 대비 2배로 증가한 화면내 예측모드 수로 인해 상당한 부호화기의 복잡도가 증가하였으며, 이를 감소시키기 위한 다양한 기법들이 연구되고 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위하여 블록내 화소의 기울기를 이용한 고속 화면내 예측모드 결정 및 블록분할 기법을 제시한다. 실험결과 VTM6.0 대비 AI(All Intra) 부호화 구조에서 3.54%의 부호화 성능 감소와 65%의 부호화 시간 절감 효과를 얻었다.

VVC의 화면 내 예측에서 적응적 TBC를 사용하는 방법 (Adaptive TBC in Intra Prediction on Versatile Video Coding)

  • 이원준;박광훈
    • 방송공학회논문지
    • /
    • 제25권1호
    • /
    • pp.109-112
    • /
    • 2020
  • VVC는 화면 내 예측에서 67가지의 모드를 사용한다. 이때 화면 내 예측 모드 표현을 위한 데이터를 감소시키기 위하여 MPM(Most Probable Mode)을 사용한다. 시그널링 되는 모드가 MPM 후보 내에 존재하는 경우 MPM 리스트의 해당 index를 송신하는 방법을 사용하고 MPM 후보 내에 존재하지 않는 경우에는 TBC 부호화를 적용한다. 화면 내 예측에서 TBC가 적용될 때 MPM 후보를 제외하고 낮은 번호의 모드 순서대로 3가지가 선택되어 5비트로 부호화되고 나머지 모드는 6비트로 부호화된다. 본 논문에서는 VVC의 화면 내 예측에서 사용하는 TBC 기술의 한계점을 알아보고 화면 내 예측에서 TBC를 사용할 때 기존의 방법보다 효율적으로 부호화 할 수 있는 적응적인 방법을 제안한다. 그 결과 기존의 부호화 방법과 비교해서 overall 부호화 성능이 AI와 RA에서 각각 0.01%, 0.04%의 부호화 효율이 증대되었다.

OTT 플랫폼 비즈니스 모델 개발을 통한 OTT 사업자 경쟁력 분석 (An analysis of OTT operator competitiveness via OTT platform business model development)

  • 김소현;임춘성
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.303-317
    • /
    • 2021
  • 본 연구는 OTT 산업에 특화된 분석틀을 개발하여 OTT 사업자들의 경쟁력 분석을 하는 데에 목적이 있다. 비즈니스 모델, 플랫폼 비즈니스 모델, OTT 특성에 관한 기존연구를 바탕으로 OTT 플랫폼 비즈니스 모델 프레임워크를 개발하였고 관련 자료, 문헌, 내부자료의 데이터를 토대로 사례 분석을 하여 국내 OTT 사업자들이 나아가야 할 방향을 제시하였다. 연구 결과, 국내 OTT 사업자들은 발전된 AI와 빅데이터 기술을 활용해 오리지널 콘텐츠를 제작하고 플랫폼의 인프라 및 서비스의 질을 향상해야 한다. 또한, 보유한 콘텐츠를 맞춤화된 추천 시스템을 통해 충분히 활용할 수 있어야 하고 이용자들이 선호할 해당 플랫폼만의 오리지널 콘텐츠에 아낌없는 투자가 지속되어야 한다. 본 연구는 급변하는 미디어 산업 속에서 OTT 사업자들이 자신만의 경쟁전략을 수립할 수 있는 분석틀을 제공하고 사례 적용을 통해 국내 OTT 사업자들이 나아가야 할 방향성을 제시했다는 점에서 의의가 있다.

문맥적응적 화면내 예측 모델 학습 및 부호화 성능분석 (Context-Adaptive Intra Prediction Model Training and Its Coding Performance Analysis)

  • 문기화;박도현;김재곤
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.332-340
    • /
    • 2022
  • 최근 딥러닝을 적용하는 비디오 압축에 대한 연구가 활발히 진행되고 있다. 특히, 화면내 예측 부호화의 성능 한계를 극복할 수 있는 방안으로 딥러닝 기반의 화면내 예측 부호화 기술이 연구되고 있다. 본 논문은 신경망 기반 문맥적응적 화면내 예측 모델의 학습기법과 그 부호화 성능분석을 제시한다. 즉, 본 논문에서는 주변 참조샘플의 문맥정보를 입력하여 현재블록을 예측하는 기존의 합성곱 신경망(CNN: Convolutional Neural network) 기반의 화면내 예측 모델을 학습한다. 학습된 화면내 예측 모델을 HEVC(High Efficiency Video Coding)의 참조 소프트웨어인 HM16.19에 추가적인 화면내 예측모드로 구현하고 그 부호화 성능을 분석하였다. 실험결과 학습한 예측 모델은 HEVC 대비 AI(All Intra) 모드에서 0.28% BD-rate 부호화 성능 향상을 보였다. 또한 비디오 부호화 블록분할 구조를 고려하여 학습한 경우의 성능도 확인하였다.

VVC 인코더에서 합성 곱 신경망의 어텐션 맵을 이용한 휘도 매핑 함수 생성 방법 (Luma Mapping Function Generation Method Using Attention Map of Convolutional Neural Network in Versatile Video Coding Encoder)

  • 권나성;이종석;변주형;심동규
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.441-452
    • /
    • 2021
  • 본 논문에서는 VVC의 LMCS에서 휘도 신호 매핑 방법의 부호화 효율을 향상시키기 위한 휘도 신호 매핑 함수 생성 방법을 제안한다. 본 논문에서 제안하는 방법은 기존 LMCS에서 지역적 특징을 반영하기 위하여 사용하는 지역적 공간 분산에 합성 곱 신경망의 어텐션 맵을 곱하여 인지 지각적 특징을 추가적으로 반영한다. 제안하는 방법의 성능 평가를 위하여 AI (All Intra) 조건에서 VVC 표준 실험 영상의 A1, A2, B, C, D 클래스를 이용하여 VTM-12.0과 BD-rate 성능을 비교한다. 실험 결과로서 본 논문에서 제안하는 방법이 VTM-12.0 대비 BD-rate 성능 관점에서 휘도 성분이 평균 -0.07%의 성능 향상을 보이고, 부/복호화 시간은 거의 동일하다.

AI 얼굴정보처리기술을 활용한 체온측정 및 지능형 출입관리 시스템 서비스플랫폼 고도화 연구 (Temperature Measurement and Intelligent Access Management System Service Platform Advancement Research using AI Facial Recognition Technology)

  • 김병완
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권7호
    • /
    • pp.249-257
    • /
    • 2021
  • 최근 세계적 감염질환 확산 방지 및 사회적 대처 방안으로 다중이용시설의 필수적 환경개선인 스마트기기를 활용한 비대면 본인인증, 출입관리서비스 제공이 가능한 얼굴정보처리기술에 대한 관심과 요구가 증가하고 있다. 본 연구는 지속적인 출입관리체계를 수립하기 위한 다중이용시설분류체계 및 적용서비스분야를 정의하고 이원화된 출입관리 시스템, 개인·측정정보 유형 분석을 통해 확장성을 고려한 서비스플랫폼의 사용성 개선방안과 이에 따른 서비스 로드맵을 제안하고자 한다. 또한 활용도에 따른 일회성, 다회성으로 인증해야하는 다중이용시설 적용서비스분야인 물리적 출입관리 시스템 서비스플랫폼 개선을 목표로 한다. 향후 본 연구의 방법론이 논리적 출입관리 시스템 유형의 서비스플랫폼으로 적용될 수 있을 것으로 기대한다.

곱셈 연산을 고려한 고속 역변환 방법 (Fast Inverse Transform Considering Multiplications)

  • 송현주;이영렬
    • 방송공학회논문지
    • /
    • 제28권1호
    • /
    • pp.100-108
    • /
    • 2023
  • 하이브리드 블록 기반 비디오 압축에서 변환 부호화는 공간 영역의 잔차 신호를 주파수 영역으로 변환하여 낮은 주파수 대역에 에너지를 집중시켜 이후 엔트로피 코딩 과정에서 높은 압축률을 달성할 수 있게 한다. 최신 비디오 압축 표준인 VVC(Versatile Video Coding)는 DCT-2(Discrete Cosine Transform type 2), DST-7(Discrete Sine Transform type 7), DCT-8(Discrete Cosine Transform type 8)를 사용하여 주변환을 수행한다. 본 논문에서는 DCT-2, DST-7, DCT-8이 모두 선형 변환임을 고려하여, 선형 변환의 선형성을 이용하여 역변환 시 곱셈 연산량을 줄이는 역변환 방법을 제안한다. 제안하는 역변환 방법은 VVC의 참조 소프트웨어인 VVC Test Model-8.2 (VTM-8.2) 대비 비트율의 증가 없이 부호화 시간과 복호화 시간이 AI(All Intra)에서 평균 26%, 15%, RA(Randon Access)에서 평균 4%, 10% 감소하였다.

웹 3.0 시대 음악 생태계 활성을 위한 메타버스 비즈니스연구: 음악 플랫폼의 발전 양상 및 구축 전략을 중심으로 (Metaverse business research for revitalizing the music ecosystem in the web 3.0 era: Focusing on strategies for building music platform)

  • 김지원;원유선
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.787-800
    • /
    • 2023
  • 본 논문은 웹 3.0 시대에 도래할 메타버스 음악 플랫폼의 학술적 이해를 도모하고 생산적인 구축 방안을 모색한 연구이다. 본 연구에서는 메타버스 음악 플랫폼이 현 시점에 지니는 의미를 입체적으로 짚어보고자 디지털 음악의 발전을 웹 1.0부터 3.0까지의 플랫폼 형성과정을 중심으로 살펴본다. 전반부에서는 메타버스 음악 플랫폼이 현재 향유하는 음악문화와 단절된 것이 아니라, 1990년대부터 지금까지 진화되어온 웹 플랫폼 환경과 밀접하게 연결되어 있다는 것을 보여주고자 했다. 또한 메타버스 플랫폼의 부상을 웹 2.0의 한계를 극복하는 동시에 웹 3.0으로의 전환과 연계된 변화로 가정하고, 최근 거론되는 1. 기술적(XR기술, 웨어러블 디바이스, 생성형 AI), 2. 문화적(디지털 아바타, 팬덤), 3. 경제적(NFT) 논의들을 현재까지 발전된 메타버스 음악 플랫폼의 발전방안과 연계시켜 논의하였다. 본 연구를 통해 '메타버스 음악 플랫폼'에 대한 합의된 개념이나 공식적인 정론이 확립되지 않은 상황에서 해당 개념에 대한 이해를 증진시키고 향후 발전방안에 대한 모색에 참고가 될 수 있기를 기대한다.