• 제목/요약/키워드: video coding for machine

검색결과 29건 처리시간 0.028초

CNN 기반 동영상의 프레임 삭제 검출 기법 (Detection of Frame Deletion Using Convolutional Neural Network)

  • 홍진형;양윤모;오병태
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.886-895
    • /
    • 2018
  • 본 논문에서는 동영상의 압축 과정에서 발생하는 규칙성을 이용하여 동영상의 조작 여부를 검출하는 기법에 대해 소개한다. 제안방식은 동영상의 이중 압축과 일부 영상의 조작에 의해 잃어버린 계층적 규칙성을 이용한다. 이러한 불규칙성을 추출하기 위해 HEVC의 기본 단위인 CU와 TU의 분할정보를 이용한다. 성능 향상을 위해 지역적인 정보를 활용하여 CU와 TU의 분할 지도를 제작한 뒤, GoP 단위로 묶어 입력 데이터를 제작한다. 효과적인 분류를 위하여 3차원 합성곱 신경망을 이용하여 동영상의 이중 압축 및 조작 여부를 판단한다. 실험 결과, 기존의 기계학습 알고리즘을 이용한 연구 결과에 비해 더욱 효과적으로 동영상의 조작 여부를 판단함을 확인하였다.

VCM 을 위한 FPN 다중 스케일 특징 압축 (Compression of Multiscale Features of FPN for VCM)

  • 김동하;윤용욱;이주영;정세윤;김재곤;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.143-145
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machine)은 입력된 비디오 특징(feature)를 압축하는 Track1 과 입력 영상을 직접 압축하는 Track2 로 나뉘어 표준화가 진행중이다. 본 논문은 VCM Track 1 에 해당하는 Detectron2 FPN(Feature Pyramid Network)에서 추출한 다중 스케일 특징맵을 VVC 로 압축하는 MSFC(Multi-Scale Feature Compression)을 구조를 제안한다. 본 논문의 MSFC 에서는 다중 스케일 특징을 결합하여 부호화/복호화하는 기존의 구조에서 특징맵의 해상도를 줄여 압축하는 개선된 MSFC 를 제시한다. 제안 방법은 VCM 의 Track2 의 영상 앵커(image anchor) 보다 우수한 BPP-mAP 성능을 보이고 최대 -84.98%의 BD-rate 성능향상을 보인다.

  • PDF

VCM 의 바텀-업 MSFF 를 이용한 MSFC 기반 멀티-스케일 특징 압축 네트워크 개선 (Enhancement of MSFC-Based Multi-Scale Features Compression Network with Bottom-UP MSFF in VCM)

  • 김동하;한규웅;차준석;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.116-118
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machine)은 입력된 이미지/비디오의 특징(feature)를 압축하는 Track 1 과 입력 이미지/비디오를 직접 압축하는 Track 2 로 나뉘어 표준화가 진행 중이다. 본 논문은 Track 1 의 비전임무 네트워크로 사용하는 Detectron2 의 FPN(Feature Pyramid Network)에서 추출한 멀티-스케일 특징을 효율적으로 압축하는 MSFC 기반의 압축 모델의 개선 기법을 제시한다. 제안기법은 해상도를 줄여서 단일-스케일 압축맵을 압축하는 기존의 압축 모델에서 저해상도 특징맵을 고해상도 특징맵에 바텀-업(Bottom-Up) 구조로 합성하여 단일-스케일 특징맵을 구성하는 바텀-업 MSFF 를 가지는 압축 모델을 제시한다. 제안방법은 기존의 모델 보다 BPP-mAP 성능에서 1 ~ 2.7%의 개선된 BD-rate 성능을 보이며 VCM 의 이미지 앵커(image anchor) 대비 최대 -85.94%의 BD-rate 성능향상을 보인다.

  • PDF

오토인코더를 이용한 CNN 이미지 분류 네트워크의 feature 압축 방안 (Compression method of feature based on CNN image classification network using Autoencoder)

  • 고성영;권승욱;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.280-282
    • /
    • 2020
  • 최근 사물인터넷(IoT), 자율주행과 같이 기계 간의 통신이 요구되는 서비스가 늘어감에 따라, 기계 임무 수행에 최적화된 데이터의 생성 및 압축에 대한 필요성이 증가하고 있다. 또한, 사물인터넷과 인공지능(AI)이 접목된 기술이 주목을 받으면서 딥러닝 모델에서 추출되는 특징(feature)을 디바이스에서 클라우드로 전송하는 방안에 관한 연구가 진행되고 있으며, 국제 표준화 기구인 MPEG에서는 '기계를 위한 부호화(Video Coding for Machine: VCM)'에 대한 표준 기술 개발을 진행 중이다. 딥러닝으로 특징을 추출하는 가장 대표적인 방법으로는 합성곱 신경망(Convolutional Neural Network: CNN)이 있으며, 오토인코더는 입력층과 출력층의 구조를 동일하게 하여 출력을 가능한 한 입력에 근사시키고 은닉층을 입력층보다 작게 구성하여 차원을 축소함으로써 데이터를 압축하는 딥러닝 기반 이미지 압축 방식이다. 이에 본 논문에서는 이러한 오토인코더의 성질을 이용하여 CNN 기반의 이미지 분류 네트워크의 합성곱 신경망으로부터 추출된 feature에 오토인코더를 적용하여 압축하는 방안을 제안한다.

  • PDF

Neural Network 기반 VCM의 성능평가 (Performance Evaluation of VCM based on Neural Network)

  • 박성욱;이해림;이주영;정세윤;조승현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.172-175
    • /
    • 2020
  • 최근 스마트시티, 자율 주행 자동차 등 기계에 의해 소비되는 영상 데이터의 양이 증가함에 따라 기계의 임무 수행 능력을 향상시킬 수 있는 압축기술이 필요하게 되었다. 그런데, 전통적 방식의 영상 코덱은 사람의 인지 화질 특성을 고려해 개발된 기술이기 때문에 기계의 임무 수행에 필수적인 정보 외에도 불필요한 정보가 존재한다. 따라서 사람이 아닌 기계의 임무 수행에 대해 효율적으로 영상을 압축하기 위한 비디오 코덱 기술이 필요하다. 이와 관련하여, 최근 MPEG에서 Video Coding for Machines라는 영상 압축기술에 대한 표준화가 논의되고 있다. 본 논문에서는 기계를 위한 영상 압축기술의 연구배경과 연구를 통해 전통적인 영상 압축 코덱 방식과 neural network 기반 압축 코덱 방식에 대해 각각의 방식이 머신비전 임무를 수행한 정확도를 기준으로 영상 압축성능을 비교해 효율적인 압축 코덱 방식에 대해 분석한다.

  • PDF

VCM 의 MSFC 기반 특징 압축을 위한 Min-Max 시그널링을 제외한 특징맵 생성 기법 (A Feature Map Generation Method for MSFC-Based Feature Compression without Min-Max Signaling in VCM)

  • 김동하;윤용욱;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.79-81
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machines)에서는 머신비전(machine vision) 네트워크의 백본(backbone)에서 추출된 이미지/비디오 특징 압축을 위한 표준화를 진행하고 있다. 현재 VCM 표준기술 탐색 과정에서 가장 좋은 압축 성능을 보이는 MSFC(Multi-Scale Feature compression) 기반 압축 네트워크 모델은 추출된 멀티-스케일 특징을 단일-스케일 특징으로 변환하여 특징맵으로 구성하고 이를 VVC 로 압축한다. 본 논문에서는 MSFC 기반 압축 모델에서 Min-Max 값 시그널링을 제외한 최소-최대(Min-Max) 정규화를 포함한 개선된 특징맵 생성 기법을 제시한다. 즉, 제안기법은 VCM 디코더에서의 특징맵 복원을 위한 Min-Max 값을 학습 기반으로 생성함으로써 Min-Max 시그널링의 비트 오버헤드 절감뿐만 아니라 별도의 시그널링 기제를 생략한 보다 단순한 전송 비트스트림 구성을 가능하게 한다. 실험결과 제안기법은 이미지 앵커(Anchor) 대비 BPP-mAP 성능에서 83.24% BD-rate 이득을 보이며, 이는 기존 MSFC 보다 1.74%정도 다소 떨어지지만 별도의 Min-Max 시그널링 없이도 기존의 성능을 유지할 수 있음을 보인다.

  • PDF

우편물 이미지 획득 시스템 개발 (Development of Postal Image Acquisition System for Sequence Sorting)

  • 송재관;임길택;김두식;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1217-1220
    • /
    • 2001
  • 우편물의 자동구분은 우편물을 OVIS(OCR-Video coding Integrated System)에 자동으로 공급하고 우편물의 수취인 주소영역을 카메라를 이용하여 획득한 다음 우편번호를 인식하여 바코드로 변환하여 인쇄하게 되고, 이 우편물은 LSM(Letter Sorting Machine)으로 보내져 BCR(Bar Code Reader)에 의해 인쇄된 바코드를 판독하여 행선지별로 구분하는 과정을 거친다. 주소의 번지 이하 부분은 배달원의 수작업에 의해 최종 배달지점 순서대로 정렬한 다음 배달하게 된다. 이 부분의 작업에 소요되는 시간은 배달원 일일 평균 4 시간에 달하며 원가절감 대상으로 지적되고 있다. 이 부분을 자동화하여 우편물 처리시간을 단축하고 생산성을 향상하는 방안이 대두되고 있으며, 이를 해결하기 위해 번지 부분까지 OCR을 이용, 인식하여 우편번호 및 순로 데이터 베이스에서 인식결과에 해당하는 코드를 추출하여 해당 구분 칸으로 우편물을 분류하는 방식을 택하면 집배원이 우편물을 배달하는 순로까지 자동으로 정렬할 수 있게 된다. 본 논문은 수취인 주소영역의 주소부분을 자동판독하기 위한 시스템을 개발한 내용을 다루고자 한다.

  • PDF

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.