• 제목/요약/키워드: quantization step

검색결과 85건 처리시간 0.019초

블록내 화소특성 및 블록간 상관성을 이용한 MPEG 화질 개선 방법 (The Methods for Improvement of MPEG Picture Quality using the Characteristics of Pixels in Block and Inter-Block Correlations)

  • ;류권열
    • 한국멀티미디어학회논문지
    • /
    • 제5권1호
    • /
    • pp.28-37
    • /
    • 2002
  • 본 논문에서는 계산량의 증가가 없이 MPEG 코덱 에 사용되 어 블로킹 현상 등 복원 영상에서 의 화질 열화를 개선하는 새로운 방법들을 제안한다. 먼저 움직임 탐색 및 보상 과정에 2단계 MAD 움직임 탐색 방법을 제안하여 탐색 계산량을 줄이고 블록의 경계 부분의 화소의 왜곡을 줄였다. 또한 줄어든 계산량을 이용하여 블록 경계 너머의 화소를 탐색에 이용하는 중첩 2단계 MAD움직임 탐색 방법을 제안하였다. 인트라 블록에 대한 DCT/양자화 과정에서는 먼저 복원된 블록의 인접 화소들을 이용하여 적응적으로 양자화 함으로써 블록간 화소의 연속성을 높이는 1차원 DCT 추정 양자화 방법과 화소타 추정 양자화 방법을 제안하였다. 모의 실험 결과 제안한 방법은 일반적인 MPEG에 비해 블로킹 현상을 줄여서 개선된 복원 화질을 보였다

  • PDF

저 전송률 통영상에서 양자화 잡음의 평균값 보상을 사용한 부호화기의 성능 개선 (Performance Improvement Using Mean Compensation of Quantization Noise in Low Bit-rate Video Encoder)

  • 신정환;백성학;김재호
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2085-2091
    • /
    • 2001
  • 손실압축 기법을 사용하는 대부분의 표준 동영상 압축 방법에서는 이미지 변환 후, 변환된 계수들의 양자화를 수행하게 된다. 양자화 과정에서 발생하는 양자화 잡음으로 인한 영상정보의 손실은 복구 영상의 화질을 저하시킨다. 본 논문에서는 H.26L의 테스트 모델인 TML-2를 기반으로 양자화 잡음의 평균값을 추가 보상함으로써 부호화기의 성능을 개선하는 방법을 제안한다. 실험 결과 비트율에서 평균 1.29% 개선과 PSNR에서 평균 0.93%개선이 있었으며, 특히 움직임이 적은 영상에서 더 큰 개선 효과가 있었다.

  • PDF

H.264 부호화시스템에서 간단한 비트열 변환 기법 (A Simple Transcoding Method for H.264 Coding System)

  • 양영현;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제9권7호
    • /
    • pp.818-826
    • /
    • 2006
  • 본 논문에서는 특정 부호화율을 가지는 H.264 비트열을 다른 부호화율로 바꾸어 전송하는 비트열변환 방법에서 필요되는 부호화율-양자화변수 사이의 모델 관계식을 규명한다. 그리고 H.264 동영상 부호화된 비트열간 부호화율을 변환하기 위한 새로운 기법을 제안한다. 제안된 비트열 변환기법은 근사화된 부호화율-양자화 계단 크기 사이의 관계식을 사용하여 이전 부호화화면, 이전 슬라이스에서 부호화된 결과로부터 모델변수를 갱신하고, 이로부터 목표되는 양자화 계단 크기를 찾아 재 양자화 이후의 부호화 과정만을 수행하여 목표되는 부호화율로 비트량을 발생시킨다. 따라서, 제안된 방식은 비트열변환에서 복잡한 부호화율 제어를 필요로 하지 않으며, 간단한 구현만으로 목표되는 부호화율로 변환시킨다. 모의실험으로부터 제안된 비트열변환방법이 4가지 다른 특성의 실험영상에 대하여 설정된 비트열로 정확하게 변환됨을 보인다.

  • PDF

군 통신상에서 워터마킹 기술을 이용한 피아식별 방법 (Identifying Friendly and Foe Using a Watermarking Technique During Military Communication)

  • 이종관;최현주
    • 한국군사과학기술학회지
    • /
    • 제9권4호
    • /
    • pp.81-89
    • /
    • 2006
  • In this paper, a watermark technique for identifying friendly and foe is proposed during communication. The speech signal is processed in several stages. First, speech signal is partitioned into small time frames and the frames are transformed into frequency domain using DFT(Discrete Frequency Transform). The DFT coefficients are quantized and the watermark signal is embedded into the quantized DFT coefficients. At the destination channel quantization errors of received signal are regarded as the watermark signal. Identification of friendly and foe are done by correlating the detected watermark and the original watermark. As in most other watermark techniques, this method has a trade off between noise robustness and quality. However, this is solved by a partial quantization and a noise level dependent quantization step. Simulation results in the various noisy environments show that the proposed method is reliable for identification between friendly and foe.

정확한 깊이 맵을 위한 전처리 과정과 다이나믹 프로그래밍에 관한 연구 (A Study of the Use of Step by Preprocessing and Dynamic Programming for the Exact Depth Map)

  • 김영섭;송응열
    • 반도체디스플레이기술학회지
    • /
    • 제9권3호
    • /
    • pp.65-69
    • /
    • 2010
  • The stereoscopic vision system is the algorithm to obtain the depth of target object of stereo vision image. This paper presents an efficient disparity matching method using nagao filter, octree color quantization and dynamic programming algorithm. we describe methods for performing color quantization on full color RGB images, using an octree data structure. This method has the advantage of saving a lot of data. We propose a preprocessing stereo matching method based on Nagao-filter algorithm using color information. using the nagao filter, we could obtain effective depth map and using the octree color quantization, we could reduce the time of computation.

CNN 모델의 최적 양자화를 위한 웹 서비스 플랫폼 (Web Service Platform for Optimal Quantization of CNN Models)

  • 노재원;임채민;조상영
    • 반도체디스플레이기술학회지
    • /
    • 제20권4호
    • /
    • pp.151-156
    • /
    • 2021
  • Low-end IoT devices do not have enough computation and memory resources for DNN learning and inference. Integer quantization of real-type neural network models can reduce model size, hardware computational burden, and power consumption. This paper describes the design and implementation of a web-based quantization platform for CNN deep learning accelerator chips. In the web service platform, we implemented visualization of the model through a convenient UI, analysis of each step of inference, and detailed editing of the model. Additionally, a data augmentation function and a management function of files that store models and inference intermediate results are provided. The implemented functions were verified using three YOLO models.

주파수 영역에서 주요 피크에 QIM을 적용한 오디오 워터마킹 (Audio Watermarking Using Quantization Index Modulation on Significant Peaks in Frequency Domain)

  • 강중순;조상진
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.303-307
    • /
    • 2011
  • 본 논문에서는 주파수 영역에서의 주요 피크를 선정하고, 주파수 크기 응답에 따라 각기 다른 스텝 사이즈를 사용하는 QIM 오디오 워터마킹을 제안한다. 오디오 신호에 대해 사각 윈도우로 오버랩 없이 L샘플을 취하고 영교차율을 통해 해당 프레임에 워터마크 삽입 가능 여부를 판단 후 푸리에 변환을 통해 주파수 영역에서의 크기 응답을 구한다. 프레임 별 주파수 크기 응답의 최대값에 따라 스텝 사이즈를 결정하고 스펙트럼에서 주요 피크 n개를 검출하여 주변 샘플 w개를 포함한 $n{\times}(w+1)$개 샘플에 대해 QIM을 이용하여 워터마크를 삽입한다. 워터마크 검출은 유클리디안 거리 (Euclidean distance)를 이용한 블라인드 검출 방식으로 수행된다. 오디오 워터마크 벤치마킹을 통한 강인성 검증에서 대부분 강인한 특성을 보였다.

Proposed Efficient Architectures and Design Choices in SoPC System for Speech Recognition

  • Trang, Hoang;Hoang, Tran Van
    • 전기전자학회논문지
    • /
    • 제17권3호
    • /
    • pp.241-247
    • /
    • 2013
  • This paper presents the design of a System on Programmable Chip (SoPC) based on Field Programmable Gate Array (FPGA) for speech recognition in which Mel-Frequency Cepstral Coefficients (MFCC) for speech feature extraction and Vector Quantization for recognition are used. The implementing process of the speech recognition system undergoes the following steps: feature extraction, training codebook, recognition. In the first step of feature extraction, the input voice data will be transformed into spectral components and extracted to get the main features by using MFCC algorithm. In the recognition step, the obtained spectral features from the first step will be processed and compared with the trained components. The Vector Quantization (VQ) is applied in this step. In our experiment, Altera's DE2 board with Cyclone II FPGA is used to implement the recognition system which can recognize 64 words. The execution speed of the blocks in the speech recognition system is surveyed by calculating the number of clock cycles while executing each block. The recognition accuracies are also measured in different parameters of the system. These results in execution speed and recognition accuracy could help the designer to choose the best configurations in speech recognition on SoPC.

2-단계 위상 천이 디지털 홀로그래피를 이용한 이진 정보 광 암호화 기법 (Optical Encryption of Binary Information using 2-step Phase-shifting Digital Holography)

  • 변현중;길상근
    • 한국광학회지
    • /
    • 제17권5호
    • /
    • pp.401-411
    • /
    • 2006
  • 보안 시스템에서 2-단계 위상 천이 홀로그래피를 이용하여 이진 정보 광 암호화 기법을 제안하였다. 위상 천이 디지털 간섭계는 CCD 카메라를 이용하여 위상과 크기 정보를 기록할 수 있는 기법이다. 2-단계 위상 천이는 0과 ${\pi}/2$의 위상 천이 각을 갖도록 PZT 거울을 움직여서 구현하였다. 이진 정보와 암호키는 랜덤 코드와 랜덤 위상으로 표현하였고, 디지털 홀로그램은 푸리에변환 홀로그램으로 간섭무늬는 CCD를 이용하여 256 레벨의 양자화 된 광세기로 획득되었다. 데이터 복원 시 DC 성분 제거 방법을 사용하였다. 컴퓨터 모의실험을 통하여 데이터 복원과 양자화 과정에서의 양자화 레벨 변화량과 디지털 홀로그램 간섭무늬의 오차 픽셀수에 따른 오차 분석을 수행하였다. 이 결과를 이용하여 정보의 광학적 암호화에 적용이 가능함을 확인하였다.

이종의 영상부호화 표준간의 변환부호화에서 화면내 부호화를 위한 효율적인 재양자화 기법 (An Efficient Requantization Method for INTRA Frames in Heterogeneous Transcoding)

  • 서광덕;김재균
    • 전기전자학회논문지
    • /
    • 제5권2호
    • /
    • pp.221-231
    • /
    • 2001
  • 본 논문에서는 MPEG-1을 MPEG-4 심플 프로파일로 변환 부호화할 때 화면내 부호화를 위한 효율적인 재양자화 기법에 대해 제안한다. MPEG-1의 화면내 부호화 블록의 양자화는 양자화 가중 행렬을 사용하는 반면, MPEG-4 심플 프로파일은 양자화 가중 행렬을 사용하지 않는다. 그 결과 두 부호화 방식의 양자화에 사용되는 양자화 파라미터가 동일하더라도 양자화 계단 크기가 서로 달라지기 때문에 변환 부호화된 MPEG-4 영상의 화질이 심하게 열화 된다. 이 문제를 해결하기 위해 변환 부호기에서 양자화 오차를 최소화하는 재생레벨을 결정하는 방식을 제안하며, 이 방식의 적용을 위해 변환부호기에서 MPEG-1 시퀸스의 DCT 계수에 대한 확률밀도함수를 추정하는 방법을 제시한다. 실험결과에 의하면 제안된 방식을 적용할 경우 기존의 방식에 비해 PSNR 측면에서 $0.3{\sim}0.6dB$ 정도의 개선이 있으며, 동시에 발생 비트량을 $5{\sim}7%$ 정도 줄일 수 있다.

  • PDF