• 제목/요약/키워드: object-based coding

검색결과 134건 처리시간 0.034초

Experiment on Intermediate Feature Coding for Object Detection and Segmentation

  • Jeong, Min Hyuk;Jin, Hoe-Yong;Kim, Sang-Kyun;Lee, Heekyung;Choo, Hyon-Gon;Lim, Hanshin;Seo, Jeongil
    • 방송공학회논문지
    • /
    • 제25권7호
    • /
    • pp.1081-1094
    • /
    • 2020
  • With the recent development of deep learning, most computer vision-related tasks are being solved with deep learning-based network technologies such as CNN and RNN. Computer vision tasks such as object detection or object segmentation use intermediate features extracted from the same backbone such as Resnet or FPN for training and inference for object detection and segmentation. In this paper, an experiment was conducted to find out the compression efficiency and the effect of encoding on task inference performance when the features extracted in the intermediate stage of CNN are encoded. The feature map that combines the features of 256 channels into one image and the original image were encoded in HEVC to compare and analyze the inference performance for object detection and segmentation. Since the intermediate feature map encodes the five levels of feature maps (P2 to P6), the image size and resolution are increased compared to the original image. However, when the degree of compression is weakened, the use of feature maps yields similar or better inference results to the inference performance of the original image.

Visual Modeling and Content-based Processing for Video Data Storage and Delivery

  • Hwang Jae-Jeong;Cho Sang-Gyu
    • Journal of information and communication convergence engineering
    • /
    • 제3권1호
    • /
    • pp.56-61
    • /
    • 2005
  • In this paper, we present a video rate control scheme for storage and delivery in which the time-varying viewing interests are controlled by human gaze. To track the gaze, the pupil's movement is detected using the three-step process : detecting face region, eye region, and pupil point. To control bit rates, the quantization parameter (QP) is changed by considering the static parameters, the video object priority derived from the pupil tracking, the target PSNR, and the weighted distortion value of the coder. As results, we achieved human interfaced visual model and corresponding region-of-interest rate control system.

Region-based H.263 Video Codec with Effective Rate Control Algorithm for Low VBR Video

  • Song, Hwangjun
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1755-1766
    • /
    • 1999
  • A region-based video codec based on the H.263+ standard is examined and its associated novel rate control scheme is proposed in this work. The region-based coding scheme is a hybrid method that consists of the traditional block DCT coding and the object-based coding. Basically, we adopt H.263+ as the platform, and develop a fast macroblock-based segmentation method to implement the region-based video codec. The proposed rate control solution includes rate control in three levels: encoding frame selection, frame-layer rate control and macroblock-layer rate control. The goal is to enhance the visual quality of decoded frames at low bit rates. The efficiency of proposed rate control scheme applied to the region-based video codes is demonstrated via several typical test sequences.

  • PDF

ARCS 모형을 적용한 컴퓨팅사고력 기반 코딩 프로젝트 개발 (Development of computational thinking based Coding_Projects using the ARCS model)

  • 남충모;김종우
    • 정보교육학회논문지
    • /
    • 제23권4호
    • /
    • pp.355-362
    • /
    • 2019
  • 초등학생을 위한 소프트웨어교육에서 파이썬과 같은 텍스트 기반 프로그래밍언어를 사용해 코딩을 교육하려는 연구가 활발히 이루어지고 있다. 일반적으로 블록 기반의 프로그래밍언어에 비하여 이러한 고급언어는 피지컬 컴퓨팅용 키트 또는 다양한 프로그래밍언어와 결합해 수행하는 학습 활동을 지원하고 있다. 본 연구는 텍스트 기반 언어의 어려움을 극복하기 위해 ARCS 모형을 적용한 컴퓨팅사고력 기반의 코딩 프로젝트를 수행하였다. 실험 결과에서 학생들은 전반적으로 동기유발 측면에서 프로그래밍에 대한 자신감 및 흥미를 나타나고 있으며, 특히 컴퓨팅사고력의 변화에서 반복, 함수, 객체에 대한 이해가 높게 나타났는데, 이러한 경향은 텍스트 기반 언어 사용과 파이썬 모듈의 효과로 여겨진다.

1차원 정점과 정점 재배열 이용한 효율적 정점기반 모양정보 부호화 (Efficient Vertex-based Shape Coding using One-dimensional Vertex and Vertex Reordering)

  • 정재원;문주희;김재균
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.94-104
    • /
    • 1997
  • 본 논문에서는 1차원 정점의 선택 및 부호화와 정점 재배열을 이용하는 정점기반 이진 모양정보 부호화기를 제안한다. 기존의 물체 적응형 정점 부호화 방식과는 달리, 제안 방식에서는 추출된 정점들을 특성이 서로 다른 1차원 정점과 2차원 정점으로 분리한다. 1차원 정점은 제안된 부호화 방식을 2차원 정점은 정점 재배열과 물체 적응형 정점 부호화 방식을 이용하여 수신단에 전송한다. 모의 실험 결과는 제안된 방식이 기존의 방식에 비해, 재현 오차의 변화 없이 부호화 비트 수를 최대 12% 감소시키며, 부호화 이득이 모양정보 특성에 의존함을 보여준다.

  • PDF

A Fast Algorithm for Region-Oriented Texture Coding

  • Choi, Young-Gyu;Choi, Chong-Hwan;Cheong, Ha-Young
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.519-525
    • /
    • 2016
  • This paper addresses the framework of object-oriented image coding, describing a new algorithm, based on monodimensional Legendre polynomials, for texture approximation. Through the use of 1D orthogonal basis functions, the computational complexity which usually makes prohibitive most of 2D region-oriented approaches is significantly reduced, while only a slight increment of distortion is introduced. In the aim of preserving the bidimensional intersample correlation of the texture information as much as possible, suitable pseudo-bidimensional basis functions have been used, yielding significant improvements with respect to the straightforward 1D approach. The algorithm has been experimented for coding still images as well as motion compensated sequences, showing interesting possibilities of application for very low bitrate video coding.

비트량-왜곡을 고려한 효율적인 다각형 근사화 기법 (An Efficient Polygonal Approximation Method in the Rate-Distorion Sense)

  • 윤병주;고윤호;김성대
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.114-123
    • /
    • 2003
  • 본 논문에서는 영상 객체 (object) 의 모양 정보를 효율적으로 부호화 하는 기법을 제안한다. 다각 근사화 기법은 손실 부호화 기법으로써 객체의 모양을 근사화 하는데 가장 널리 사용되고 있다. 제안된 기법은 최대 허용 오차를 만족하면서 정점을 선택할 때 기존의 순환 정점 선택 (IRM: iterated refinement method) 이나 순차적 정점 선택 (PVS: progressive vertex selection) 보다 적은 수의 정점을 선택함으로써 비트량을 줄인다. 기존의 순차적인 정점 선택 기법을 기반으로 하여 새로운 정점 선택 조건을 제안하여 비트량-왜곡면에서 우수한 성능을 가지는 부호화기를 구현하였다. 실험 결과에서 제안된 기법이 기존의 정점 선택 기법들에 비해 우수한 성능을 나타냄을 알 수 있다.

Multiresolution Wavelet-Based Disparity Estimation for Stereo Image Compression

  • Tengcharoen, Chompoonuch;Varakulsiripunth, Ruttikorn
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1098-1101
    • /
    • 2004
  • The ordinary stereo image of an object consists of data of left and right views. Therefore, the left and right image pairs have to be transmitted simultaneously in order to display 3-dimentional video at the remote site. However, due to the twice data in comparing with a monoscopic image of the same object, it needs to be compressed for fast transmission and resource saving. Hence, it needs an effective coding algorithm for compressing stereo image. It was found previously that compressing left and right frames independently will achieve the compression ratio lower than compressing by utilizing the spatial redundancy between both frames. Therefore, in this paper, we study the stereo image compression technique based on the multiresolution wavelet transform using varied disparity-block size for estimation and compensation. The size of disparity-block in the stereo pair subbands are scaling on a coarse-to-fine wavelet coefficients strategy. Finally, the reference left image and residual right image after disparity estimation and compensation are coded by using SPIHT coding. The considered method demonstrates good performance in both PSNR measures and visual quality for stereo image.

  • PDF

객체지향 분석-함성 부호화를 위한 효율적 움직임 파라미터 추정 알고리듬 (Efficient Algorithms for Motion Parameter Estimation in Object-Oriented Analysis-Synthesis Coding)

  • 이창범;박래홍
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.653-660
    • /
    • 2004
  • 객체지향 분석-합성 부호화는 일련의 영상들을 여러 개의 동 객체로 분할한 후 각 객체의 움직임을 추정하고 보상한다. 그것은 각 객체에 있는 움직임 정보를 추정하기 위해 변환 파라미터 기법을 적용하는데 이때 변환 파라미터 기법은 그레디언트 연산자를 사용하기 때문에 매우 복잡한 계산이 요구된다. 본 논문의 목적은 객체지향 분석-합성 부호화에서 계층적 구조를 사용한 효율적인 변환파라미터 기법을 개발하는 것이다. 이러한 목표를 달성하기 위해 본 논문은 계층적 구조를 사용한 하이브리드 변환파라미터 추정 방법과 적응형 변환 파라미터 방법의 두 가지 알고리듬을 제안한다. 전자는 파라미터 검증 방법을 사용하는데 원 영상을 1/4로 축소한 저해상도 영상에서 파라미터 검증 처리 방법에 의해 6-파라미터 또는 8-파라미터로 추정한다. 후자는 동일한 계층적 방법을 적용한 다음 변환 파라미터를 적응적으로 추정하기 위해 temporal co-occurrence 행렬에 기반 한 움직임 량을 측정하는 움직임 판단기준을 사용한다. 이러한 방법은 고속이며, 병렬처리 기법을 사용할 경우 쉽게 하드웨어로 구현할 수 있는 이점이 있다. 이론 분석 및 모의시험 결과 제안한 방법이 기존 방법에 비해 약 1/4 정도로 월등한 계산량 감축을 얻을 수 있었으며, 아울러 제안한 방법들에 의해 복원된 신호대 잡음비는 6-파라미터와 8-파라미터 추정 방법에 의해 복원된 결과들 사이에 있음을 보여 준다.

H.264 표준에서 가중된 다중 참조 블록을 이용한 효율적인 VLC 표 예측 방법 (An Efficient VLC Table Prediction Scheme for H.264 Using Weighting Multiple Reference Blocks)

  • 허진;오관정;호요성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.39-42
    • /
    • 2005
  • H.264, a recently proposed international video coding standard, has adopted context-based adaptive variable length coding (CAVLC) as the entropy coding tool in the baseline profile. By combining an adaptive variable length coding technique with context modeling, we can achieve a high degree of redundancy reduction. However, CAVLC in H.264 has weakness that the correct prediction rate of the variable length coding (VLC) table is low in a complex area, such as the boundary of an object. In this paper, we propose a VLC table prediction scheme considering multiple reference blocks; the same position block of the previous frame and the neighboring blocks of the current frame. The proposed algorithm obtains the new weighting values considering correctness of the VLC table for each reference block. Using this method, we can enhance the prediction rate of the VLC table and reduce the bit-rate.

  • PDF