통합 검색 | Korea Science

VVC 인코더에서 합성 곱 신경망의 어텐션 맵을 이용한 휘도 매핑 함수 생성 방법 (Luma Mapping Function Generation Method Using Attention Map of Convolutional Neural Network in Versatile Video Coding Encoder)

권나성;이종석;변주형;심동규
- 방송공학회논문지
- /
- 제26권4호
- /
- pp.441-452
- /
- 2021
본 논문에서는 VVC의 LMCS에서 휘도 신호 매핑 방법의 부호화 효율을 향상시키기 위한 휘도 신호 매핑 함수 생성 방법을 제안한다. 본 논문에서 제안하는 방법은 기존 LMCS에서 지역적 특징을 반영하기 위하여 사용하는 지역적 공간 분산에 합성 곱 신경망의 어텐션 맵을 곱하여 인지 지각적 특징을 추가적으로 반영한다. 제안하는 방법의 성능 평가를 위하여 AI (All Intra) 조건에서 VVC 표준 실험 영상의 A1, A2, B, C, D 클래스를 이용하여 VTM-12.0과 BD-rate 성능을 비교한다. 실험 결과로서 본 논문에서 제안하는 방법이 VTM-12.0 대비 BD-rate 성능 관점에서 휘도 성분이 평균 -0.07%의 성능 향상을 보이고, 부/복호화 시간은 거의 동일하다.
https://doi.org/10.5909/JBE.2021.26.4.441 인용 PDF KSCI KPUBS

스크린 콘텐츠 코딩 툴을 이용한 라이트필드 렌즈렛 영상 부호화 (Light Field Lenslet Video Compression using Screen Content Coding tool)

이순빈;정종범;김인애;류은석
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.49-52
- /
- 2020
MPEG-I(Immersive) 그룹에서는 몰입형 미디어 영상처리 표준화의 일환으로 마이크로렌즈를 통한 다시점 영상 처리 기술인 Dense Light Field에 대한 성능 탐색을 진행하고 있다. 본 논문에서는 MPEG-I에서 정의된 라이트 필드 시퀀스에 대해 versatile video codec(VVC)에 대한 압축 성능 분석을 시행하였으며, 또한 렌즈렛(Lenslet) 형태의 특정적인 이미지 정보를 효율적으로 압축하기 위한 스크린 콘텐츠 코딩 툴의 효율 비교를 진행하였다. 또한 렌즈렛 영상에서의 화면 내 블록 카피(intra block copy) 기법이 선택되는 비율을 확인하고, 화면 내 블록 카피 기법을 통해 렌즈렛 영상이 효율적으로 압축될 수 있음을 보였다.
PDF

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

도지훈;이주영;김연희;최진수;정세윤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.7-9
- /
- 2021
본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.
PDF

DM 모드로 부호화된 색차블록에 대응하는 휘도 블록의 개수에 대한 분석 (Analysis for the Number of Luma Blocks Corresponding to DM Chroma Block)

이유진;김범윤;전병우
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.359-360
- /
- 2021
본 논문에서는 차세대 비디오 부호화 기술인 VVC (Versatile Video Coding)의 색차 성분 화면 내 예측 기술인 DM (Derived Mode) 가 분할 구조가 이중 트리일 때 색차 블록에 대응하는 휘도 블록을 선택하는 기존 방식의 효율성을 분석하기 위해 색차 블록에 대응하는 휘도 영역 내 휘도 블록의 개수를 측정하였다. 실험 결과, 하나의 색차 블록에 대응하는 휘도 영역 내에 평균적으로 4.408 개의 휘도 블록이 존재함을 확인하였다. 따라서 DM 을 통한 부호화 시 대응하는 휘도 영역 내 복수개의 휘도 블록을 고려하여, 유도되는 최적의 예측 모드를 잘 선정하는 방법에 대한 연구가 필요하다.
PDF

ECM 의 적응적 병합후보 재배열(ARMC) 기반 효율적인 병합후보 구성 (Construction of Merge Candidate List Based on Adaptive Reordering of Merge Candidates (ARMC) in ECM)

문기화;김주현;박도현;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1239-1240
- /
- 2022
JVET 은 VVC(Versatile Video Coding) 표준화 완료 이후 보다 높은 압축 성능을 갖는 차세대 비디오 코덱의 표준 기술을 탐색하고 있으며 ECM(Enhanced Compression Model) 참조 소프트웨어를 통해 제안된 알고리즘의 성능을 검증하고 있다. 현재 ECM 에서는 정해진 순서에 의해 병합(Merge) 후보를 구성하고 템플릿 매칭(template matching)을 통하여 후보들의 순서를 재배열하는 ARMC(Adaptive Reordering of Merge Candidate) 기법을 채택하고 있다. 본 논문은 ARMC 의 병합 후보의 선택 빈도 분석을 바탕으로 정규 병합(regular merge) 후보 수를 확장하여 구성하고, 실제 탐색에 사용되는 최종 후보의 수를 제한하는 효율적인 ARMC 후보 구성 기법을 제안한다. 실험결과 ECM 4.0 대비 Cb 와 Cr 에서 0.12%, 0.19% 비디오 부호화 성능을 확인하였다.
PDF

RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교 (Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision)

이예지;김신;윤경로
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.146-149
- /
- 2022
기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.
PDF

검색결과 76건 처리시간 0.02초

VVC 인코더에서 합성 곱 신경망의 어텐션 맵을 이용한 휘도 매핑 함수 생성 방법 (Luma Mapping Function Generation Method Using Attention Map of Convolutional Neural Network in Versatile Video Coding Encoder)

스크린 콘텐츠 코딩 툴을 이용한 라이트필드 렌즈렛 영상 부호화 (Light Field Lenslet Video Compression using Screen Content Coding tool)

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

DM 모드로 부호화된 색차블록에 대응하는 휘도 블록의 개수에 대한 분석 (Analysis for the Number of Luma Blocks Corresponding to DM Chroma Block)

ECM 의 적응적 병합후보 재배열(ARMC) 기반 효율적인 병합후보 구성 (Construction of Merge Candidate List Based on Adaptive Reordering of Merge Candidates (ARMC) in ECM)

RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교 (Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)