• Title/Summary/Keyword: video CODEC

Search Result 315, Processing Time 0.019 seconds

Fast Edge Map Method And Edge Map Compression Using Edge Features (고속 Edge Map 생성 방법과 Edge 특성을 이용한 Edge Map 압축)

  • Kim, Do-Hyun;Kim, Yoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.07a
    • /
    • pp.45-48
    • /
    • 2015
  • 오늘날 하드웨어의 발전으로 인해 영상 해상도는 FHD를 넘어 4K UHD 이상의 영상 해상도가 사용화되고 있다. 하지만 Edge Map을 만들기 위해 일반적으로 사용하는 함수들은 Convolution 함수 일종으로서 영상의 해상도가 높을수록 더 많은 Complexity를 요구한다. 또한 현재 주요 영상 압축 기술인 JPEG, H.264/AVC High efficiency video coding(HEVC)같은 기법들은 자연 영상을 중점으로 개발되어 있어 Edge map 압축에 있어 자연 영상만큼의 효율을 보여주지 못하고 있다. 본 논문은 원 영상을 Down Scaling한 뒤 이미지를 다시 원래 사이즈로 Up Scaling하여 두 영상의 차를 이용한 Edge Map을 생성하는 새로운 방법을 소개한다. 생성된 Edge Map의 특성인 Histogram 값의 분포가 0을 중심으로 Gaussian 분포를 가지는 것을 이용한 Zero Based 코덱을 제안한다. 제안된 알고리즘을 이용하여 고 해상도 영상에서도 빠르게 Edge Map을 생성하고 제안한 코덱을 통해 해당 Edge map을 압축한 결과 다른 압축 기술보다 더 뛰어난 성능을 보여주었다.

  • PDF

An Enhancement of the Encoding Speed and a Compensation of Decoded Video Quality for H.263 Codec (H.263 압축 속도 향상과 영상 복원용 화질 보상 연구)

  • Yun, Seong-Gyu;Gang, Ui-Seon;Yu, Hwan-Jong;Im, Yeong-Hwan
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.5
    • /
    • pp.402-411
    • /
    • 2001
  • H.263 압축 방식은 실현하는데 여러 가지 문제가 있지만 그 중에서 그 대표적인 것은 인코딩 과정에서의 압축 시간이 오래 걸린다는 것이고 다른 한 가지는 과도한 압축률에 의한 복원된 이미지 화질 저하이다. 이 논문에서는 H.263에서의 압축 속도 향상과 복원 이미지의 화질 이미지의 화질 보상에 대한 두 가지 새로운 방법을 제안하였다. 압축 속도를 향상시키기 위해서 움직임 벡터를 찾는 알고리즘을 개선하여 새로운 4단계 탐색 알고리즘을 제안하였다. 또한 화질을 보상하기 위해 디코더에서 블록 아티팩을 제거하고 복원 이미지를 선명하게 하는 알고리즘을 제안하였다. 여기서 화질 보상은 원본 이미지와 동일하게 만드는 것이 아니라 인간이 더 좋은 영상으로 인식하도록 하는 걸 목적으로 한다. 우리가 제한한 알고리즘에 의해서 압축 속도는 초당 2.5에서 17 프레임으로 증가하였고 블록 아티팩을 제거하고 명암 대비를 높임으로써 보기 좋은 영상을 제공하였다.

  • PDF

Design and Implementation of Free-view Player using OpenGL and Nvidia Video Codec (OpenGL과 Nvidia 영상코덱을 사용한 실시간 자유시점 재생기 설계 및 구현)

  • Gu, Dongjun;Ahn, Heejune
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.263-266
    • /
    • 2020
  • 사용자에게 본인이 원하는 시점과 시각을 선택할 수 있도록 하는 자유시점 (Free Viewpoint) MPEG-I 과제를 통하여 3DOF, 3DOF+, 6DOF의 표준을 개발 중이다. 실사 영상의 자유시점 영상을 구현하는 방법으로는 깊이정보를 사용한 렌더링 기법을 사용하는데, 이를 실시간 재생할 수 있는 시스템은 개발되지 않았다. 본 논문에서는 PC 사양에서 NVIDIA 영상 코덱과 OpenGL사용하는 rtRVSlibrary를 바탕으로, 최대 8개의 HD급 다중 뷰 영상 입력 (컬러+깊이)을 자유 시점을 실시간 생성하여 디스플레이하는 재생기를 설계 및 개발하였다. 사용자는 원하는 시점으로 상하좌우앞뒤(회전)로 자유롭게 이동할 수 있으며, 계산양과 화질 효율성을 고려하여 디코딩한 입력영상 중에 두 개의 시점을 선별하는 알고리즘을 개발하여 실시간 동작 (25fps)을 검증하였다.

  • PDF

3D Motion Estimation and Compensation method for Point cloud video codec by 3D DCT (3D DCT 를 이용한 포인트 클라우드의 움직임 예측/보상 기법)

  • Lee, Minseok;Kim, Boyeun;Yoon, Sangeun;Hwang, Yonghae;Kim, Junsik;Kim, Khuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.279-282
    • /
    • 2021
  • 포인트 클라우드는 3 차원 물체를 표현하기 위한 점들의 집합으로, 동적인 3 차원 데이터를 정밀하게 획득할 수 있기에 이의 효율적인 압축의 필요성이 대두되고 있다. 기존 3D DCT(3D Discrete Cosine Transform)를 이용한 동적 객체의 포인트 클라우드 압축 방식은 Inter 프레임 압축을 고려하지 않아 압축시의 데이터 압축률에 한계가 있다. 따라서 본 논문은 이러한 문제점을 개선하기 위해 3D DCT 를 이용한 움직임 예측을 통하여 포인트 클라우드 영상의 I 프레임 및 P 프레임을 압축하는 방식을 제안한다.

  • PDF

Neural Network based Pixel to Intra Prediction Mode Decision (신경망 기반 원본영상에서 화면 내 예측 모드로 변환)

  • Kim, Yangwoo;Lee, Yung-Lyul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.671-672
    • /
    • 2020
  • VVC(Versertile Video Codec)의 화면 내 예측은 인코더에서 영상을 적절하게 사각형 블록으로 분할하고, 블록 주변의 먼저 재구성된 참조샘플들을 이용하여 예측블록을 형성한다. 인코더는 화면 내 예측 모드에서 각 PU(Prediction Unit)에 대하여 MIP(Matrix-based weighted Intra Prediction) 적용 여부, MIP에서 matrix의 인덱스, MRL(Multi Reference Line)의 인덱스, DC/Planar/Angular 모드에 대한 최적모드를 고려하여 각 정보를 디코더로 전송하며 각 후보모드들의 압축효율을 비교하는 과정에서 높은 연산량을 요구한다. 본 논문에서는 이러한 모드 결정은 원본영상으로도 대략적인 결정이 가능하다는 전제를 가지고 NN(Nueral Netwrok)의 일종인 CNN(Convolutional Nerual Network)를 이용하여 복잡한 모드 결정 방법을 생략하는 방법을 제안한다.

  • PDF

HEVC Encoder Optimization using Depth Information (깊이정보를 이용한 HEVC의 인코더 고속화 방법)

  • Lee, Yoon Jin;Bae, Dong In;Park, Gwang Hoon
    • Journal of Broadcast Engineering
    • /
    • v.19 no.5
    • /
    • pp.640-655
    • /
    • 2014
  • Many of today's video systems have additional depth camera to provide extra features such as 3D support. Thanks to these changes made in multimedia system, it is now much easier to obtain depth information of the video. Depth information can be used in various areas such as object classification, background area recognition, and so on. With depth information, we can achieve even higher coding efficiency compared to only using conventional method. Thus, in this paper, we propose the 2D video coding algorithm which uses depth information on top of the next generation 2D video codec HEVC. Background area can be recognized with depth information and by performing HEVC with it, coding complexity can be reduced. If current CU is background area, we propose the following three methods, 1) Earlier stop split structure of CU with PU SKIP mode, 2) Limiting split structure of CU with CU information in temporal position, 3) Limiting the range of motion searching. We implement our proposal using HEVC HM 12.0 reference software. With these methods results shows that encoding complexity is reduced more than 40% with only 0.5% BD-Bitrate loss. Especially, in case of video acquired through the Kinect developed by Microsoft Corp., encoding complexity is reduced by max 53% without a loss of quality. So, it is expected that these techniques can apply real-time online communication, mobile or handheld video service and so on.

A Technical Analysis on Deep Learning based Image and Video Compression (딥 러닝 기반의 이미지와 비디오 압축 기술 분석)

  • Cho, Seunghyun;Kim, Younhee;Lim, Woong;Kim, Hui Yong;Choi, Jin Soo
    • Journal of Broadcast Engineering
    • /
    • v.23 no.3
    • /
    • pp.383-394
    • /
    • 2018
  • In this paper, we investigate image and video compression techniques based on deep learning which are actively studied recently. The deep learning based image compression technique inputs an image to be compressed in the deep neural network and extracts the latent vector recurrently or all at once and encodes it. In order to increase the image compression efficiency, the neural network is learned so that the encoded latent vector can be expressed with fewer bits while the quality of the reconstructed image is enhanced. These techniques can produce images of superior quality, especially at low bit rates compared to conventional image compression techniques. On the other hand, deep learning based video compression technology takes an approach to improve performance of the coding tools employed for existing video codecs rather than directly input and process the video to be compressed. The deep neural network technologies introduced in this paper replace the in-loop filter of the latest video codec or are used as an additional post-processing filter to improve the compression efficiency by improving the quality of the reconstructed image. Likewise, deep neural network techniques applied to intra prediction and encoding are used together with the existing intra prediction tool to improve the compression efficiency by increasing the prediction accuracy or adding a new intra coding process.

Multi-view video coding using efficient disparity vector prediction (다시점 동영상에서의 효율적인 변이 벡터 압축 기법)

  • Kim, Yong-Tae;Sohn, Kwang-Hoon
    • Journal of Broadcast Engineering
    • /
    • v.10 no.4 s.29
    • /
    • pp.621-631
    • /
    • 2005
  • To enhance the performance of multi-view sequence CODEC, an efficient disparity vector coding method fur multiview sequences is proposed herein. For higher coding efficiency, we encode the differential vectors acquired by subtracting the original vectors from the predicted ones. To enhance the performance of disparity vector coding, it is essential to predict the disparity vectors accurately. The prediction by this proposed method utilizes the correlation among the multiview images, while conventional methods exploit the correlation among the causal blocks. Experiments were performed fur three different 5 view sequences. We were able to confirm that the proposed method predicts disparity vectors accurately by comparing the entropy and the mean absolute values for differential vectors with conventional methods. Its performance is superior to vector coding methods used in MPEG-4 which uses only a spatial correlation. The proposed method increases the coding efficiency by a factor of $30{\~}45\%$ while preserving image quality.

Study of an Adaptive Multichannel Rate Control Scheme for HDTV Encoder (HDTV 인코더용 적응적 다중채널 율제어 방식 연구)

  • 남재열;강병호;이호영;하영호
    • Journal of Broadcast Engineering
    • /
    • v.2 no.1
    • /
    • pp.56-64
    • /
    • 1997
  • An HDTV frame has 4~6 times more pixels than a DTV frame. In order to encode the HDTV image in real time, parallel processing architectures have been widely used in many HDTV codec developments. That is, an HDTV Image is divided into several subbands and each subband is encoded in parallel using some DTV level encoders. In this paper, we adopt an HDTV codec architecture which divides an HDTV frame into 4 subbands and propose a new scene change detection algorithm using local variance. In addition, a new adaptive multichannel rate control scheme which allocate target bits adaptively to each subband of the HDTV image based on the activities of subband images is suggested in this paper. The activities of subband images are calculated at scene change detection part and reused at the adaptive rate control part. The simulation results show that the proposed scene change detection algorithm detects the scene change of HDTV video very accurately. Also the suggested adaptive multichannel rate control scheme shows better performance than the rate control method which allocates target bits equally to each subbands of the HDTV image.

  • PDF

Multi-view Synthesis Algorithm for the Better Efficiency of Codec (부복호화기 효율을 고려한 다시점 영상 합성 기법)

  • Choi, In-kyu;Cheong, Won-sik;Lee, Gwangsoon;Yoo, Jisang
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.2
    • /
    • pp.375-384
    • /
    • 2016
  • In this paper, when stereo image, satellite view and corresponding depth maps were used as the input data, we propose a new method that convert these data to data format suitable for compressing, and then by using these format, intermediate view is synthesized. In the transmitter depth maps are merged to a global depth map and satellite view are converted to residual image corresponding hole region as out of frame area and occlusion region. And these images subsampled to reduce a mount of data and stereo image of main view are encoded by HEVC codec and transmitted. In the receiver intermediate views between stereo image and between stereo image and bit-rate are synthesized using decoded global depth map, residual images and stereo image. Through experiments, we confirm good quality of intermediate views synthesized by proposed format subjectively and objectively in comparison to intermediate views synthesized by MVD format versus total bit-rate.