• 제목/요약/키워드: 객체 기반 부호화

검색결과 89건 처리시간 0.02초

모바일 영상통화 환경에 적합한 하이브리드 변환을 이용한 객체 기반 비디오 코덱 설계 (Design of Object-based Video CODEC for the Mobile Video Telephony Using Hybrid Transform)

  • 전성혜;서용수;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제13권4호
    • /
    • pp.560-574
    • /
    • 2010
  • 3G 통신 기술의 상용화로 모바일 단말기 상에서 영상통화 서비스가 활발히 제공되고 있다. 하지만, 단말기 상에서 비디오 시스템은 안정성과 성능 면에서 사용자들의 요구를 충족시키지 못하고 있으며, 이 때문에 영상통화 서비스에 대한 사용자들의 불만이 증가하는 것이 현 실정이다. 따라서 본 논문에서는 기존의 제한된 모바일 영상통화 환경에서 향상된 품질의 영상통화 서비스를 제공하기 위한 비디오 압축 방법을 제안한다. 제안한 방법에서는 매 프레임마다 중요 객체와 비중요 객체를 분리하며, 분리된 객체는 다른 비트율과 화질을 갖도록 각 객체에 적합한 변환 커널을 적용하여 부호화 절차를 달리한다. 중요 객체는 고화질을 가지도록 부호화하며, 비중요 객체에 대해서는 저화질을 가지도록 부호화함으로써 제한된 대역폭 내에서 중요 객체에 대한 화질을 보장하도록 한다. 실험 결과에서 동일 비트율에서 제안한 방법이 기존 방법보다 중요객체 영역에 대한 화질이 우수한 것을 확인할 수 있었다.

실시간 고압축 MPEG-4 부호화를 위한 비디오 객체 분할과 프레임 전처리 (Video object segmentation and frame preprocessing for real-time and high compression MPEG-4 encoding)

  • 김준기;이호석
    • 한국통신학회논문지
    • /
    • 제28권2C호
    • /
    • pp.147-161
    • /
    • 2003
  • 비디오 객체 분할(Video Object Segmentation)은 MPEG-4 부호화의 핵심기술로 실시간 요구사항을 위해 빠르고 정확하여야 한다. 그러나 대부분의 존재하는 알고리즘은 계산량이 많으며 실시간 응용을 위해 적합하지 않다. 또한 이전 MPEG-4 VM(Verification Model) 기본 모델은 MPEG-4 부호화 처리를 위한 기본 알고리즘을 제공하였으나 실시간 요구사항을 위한 카메라 입력 시스템, 실용적인 소프트웨어 개발, 비디오 객체 분할 그리고 압축효율에 많은 제한이 있다. 이에 본 논문은 기본 MPEG-4 VM모델에 내용 기반 비디오 코딩의 핵심인 VOP 추출알고리즘, 실시간 카메라 입력 시스템, 압축율을 높일 수 있는 움직임 감지 알고리즘을 추가하여 최대 180:1의 압축율을 보여주는 실시간 고압축 MPEG-4 전처리 시스템을 개발하였다.

깊이정보 기반의 혼합 가우시안 분포 히스토그램과 Mean Shift Filter를 이용한 깊이정보 맵 부호화 전처리 (Depth Map coding pre-processing using Depth-based Mixed Gaussian Histogram and Mean Shift Filter)

  • 박성희;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.175-177
    • /
    • 2010
  • 본 논문에서는 MPEG 의 3차원 비디오 시스템의 표준 깊이정보 맵에 대한 효율적인 부호화를 위하여 전처리 방법을 제안한다. 현재 3차원 비디오 부호화(3DVC)에 대한 표준화가 진행 중에 있지만 아직 깊이정보 맵의 부호화 방법에 대한 표준이 확정되지 않은 상태이다. 제안하는 기법에서는 우선, 입력된 깊이정보 맵에 대하여 원래의 히스토그램 분포를 가우시안 혼합모델(GMM)기반의 EM 군집화 기법에 의한 방법으로 분리 후, 분리된 히스토그램을 기반으로 깊이정보 맵을 여러 개의 영상으로 분리한다. 그 후 분리된 각각의 영상을 배경과 객체에 따라 다른 조건의 mean shift filter로 필터링한다. 결과적으로 영상내의 각 영역 경계는 최대한 살리면서 영역내의 화소 값에 대해서는 평균 연산을 취하여 부호화시 효율을 극대화 하고자 하였다. 실험조건은 $1024{\times}768$ 영상에 대해서 50 프레임으로 H.264/AVC base 프로파일로 부호화를 진행하였다. 최종 실험결과 bit rate는 대략 23% ~ 26% 정도 감소하고 부호화 시간도 다소 줄어드는 것을 확인 할 수 있었다.

  • PDF

시공간 화질의 절충을 고려한 MPEG-4 비트율 제어 알고리즘 (MPEG-4 Rate Control Method with Spatio-Temporal Trade-Offs)

  • 이정우;호요성
    • 대한전자공학회논문지SP
    • /
    • 제41권1호
    • /
    • pp.47-56
    • /
    • 2004
  • 본 논문에서는 여러 개의 비디오 객체를 부호화할 때 기존의 MPEC-4 VM5알고리즘에 비해 부호화 성능을 향상시키면서 고정 비트율을 지원하는 새로운 알고리즘을 기술한다. 특히, 부호화되는 객체와 건너뛰어지는 객체의 왜곡을 예측하는 비트율-왜곡 모델을 제시하고, 부호화 성능을 향상시키기 위해 시간적-공간적 절충을 고려한 부호화 모드와 버퍼를 제어하는 방법을 제안한다. 본 논문에서 제안된 객체 기반의 비트율 제어 방법은 넓은 범위의 비트율에서 향상된 성능을 보이며, 목표 비트율에 근접한 압축 비트열을 발생하고, 버퍼 상태를 안정적으로 조절하기 때문에 버퍼 넘침과 버퍼 결핍 현상이 발생하지 않는다.

객체 분할 기법을 이용한 다시점 영상 부호화에서의 예측 모드 선택 기법 (A Mode Selection Algorithm using Scene Segmentation for Multi-view Video Coding)

  • 이서영;신광무;정기동
    • 한국정보과학회논문지:정보통신
    • /
    • 제36권3호
    • /
    • pp.198-203
    • /
    • 2009
  • 최근 멀티미디어 기술의 발달과 더불어 3차원 영상에 대한 연구가 활발하게 이루어지고 있다. 이 중 다시점 영상은 사실감 넘치는 화면을 사용자에게 제공하지만, 대역폭의 급격한 증가는 풀어야 할 주요 문제이다. 본 논문은 부호화 과정의 복잡도와 시간 소요를 줄일 수 있는 빠른 예측모드 결정 알고리즘을 제안한다. 이것은 빠르게 움직이는 전경 객체를 효과적으로 구분할 수 있는 객체 분할을 기반으로 한다. 빠른 움직임을 가진 전경 객체가 시점 방향 예측 모드로 부호화 될 가능성이 더 높기 때문에 움직임 보상 과정을 사전에 제한할 수 있다. 제안한 기법을 적용한 결과, 기존의 부호화 과정과 비교하여 화질의 큰 저하 없이 평균 45% 연산량이 감소하였다.

객체기반 부호화에서 혼합형 부호화방식을 이용한 MF(Model Failure) 객체의 색신호 부호화 (Color coding of MF(model failure) object using hybrid coding method in object based coding)

  • 김동하;이지훈;고성제;이태원
    • 전자공학회논문지S
    • /
    • 제34S권5호
    • /
    • pp.45-51
    • /
    • 1997
  • To trnsmit moving image signals by using an object vased coding technique at the rate of 8kbps~11kbps, it is very important to minimize the bit rates used for the compression of the color information of MF-objects. This paper proposes a hybrid coding method which uses the shpae adaptive coding method and the interframe reference method selectively. Gilge's shape adaptive orthogonal coidng method is utilized for shpae adaptive coding. The interfarame reference method approximates the low-passed signals of the image by gilge's shpae adaptive orthogonalization method and then refers the approximation error signals from the high frequency signal components of th eprevious frame. The proposed method achives the bit rates reduction of 17% compared to the gilge's shape adaptive orthogonalization method and 30% rduction compared to the shape adaptive DCT in average.

  • PDF

Multi-task 수행을 위한 압축 심층신경망 기반 VCM (VCM based on Compression Neural Network for Multi-task)

  • 이해림;이주영;조승현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.43-46
    • /
    • 2021
  • 최근 기계 임무수행에 사용되는 데이터양이 증가함에 따라 기계를 위한 효율적인 영상 압축방식의 필요성이 높아졌다. 기존의 비디오 코덱은 HVS (Human Visual System) 특성을 고려한 기술이기 때문에 부호화 과정에서 기계 임무수행에 필요하지 않은 정보를 효과적으로 제거할 수 없다. 반면 심층신경망 기반 압축네트워크의 경우, 원본 영상으로부터 기계 임무수행에 필수적인 데이터만을 추출하여 부호화 하도록 학습할 수 있는 장점이 있다. 본 논문에서는 압축 심층신경망과 기계 임무수행 네트워크로 구성되는 VCM (Video Coding for Machine) 프레임워크를 제안하고 학습에 의한 압축효율 향상을 검증한다. 이를 위해 압축 심층신경망을 객체탐지 임무수행 네트워크와 함께 학습시킨 결과, VVC (Versatile Video Coding) 대비 평균 61.16%의 BD-rate 감소가 확인되었다. 뿐만 아니라, 학습된 압축 심층신경망은 객체분할 임무수행에서도 VVC 대비 평균 58.43%의 BD-rate 감소를 보여 다중 기계 임무의 효율적 수행이 가능함을 확인할 수 있었다.

  • PDF

비트량-왜곡을 고려한 효율적인 다각형 근사화 기법 (An Efficient Polygonal Approximation Method in the Rate-Distorion Sense)

  • 윤병주;고윤호;김성대
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.114-123
    • /
    • 2003
  • 본 논문에서는 영상 객체 (object) 의 모양 정보를 효율적으로 부호화 하는 기법을 제안한다. 다각 근사화 기법은 손실 부호화 기법으로써 객체의 모양을 근사화 하는데 가장 널리 사용되고 있다. 제안된 기법은 최대 허용 오차를 만족하면서 정점을 선택할 때 기존의 순환 정점 선택 (IRM: iterated refinement method) 이나 순차적 정점 선택 (PVS: progressive vertex selection) 보다 적은 수의 정점을 선택함으로써 비트량을 줄인다. 기존의 순차적인 정점 선택 기법을 기반으로 하여 새로운 정점 선택 조건을 제안하여 비트량-왜곡면에서 우수한 성능을 가지는 부호화기를 구현하였다. 실험 결과에서 제안된 기법이 기존의 정점 선택 기법들에 비해 우수한 성능을 나타냄을 알 수 있다.

RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교 (Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision)

  • 이예지;김신;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.146-149
    • /
    • 2022
  • 기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.

  • PDF