• 제목/요약/키워드: Adaptive Quantization

검색결과 206건 처리시간 0.025초

벡터 양자화 화자적응기법을 사용한 한국어 단어 인식 (Korean Word Recognition Using Vector Quantization Speaker Adaptation)

  • 최갑석
    • 한국음향학회지
    • /
    • 제10권4호
    • /
    • pp.27-37
    • /
    • 1991
  • 본 논문에서는 퍼지벡터양자화보다 양자화 왜곡을 더욱 저감시키기 위하여 에너지부분공간을 도입한 퍼지벡터양자화(energy subspace fuzzy vector quatization : ESFVQ)를 제안하였으며, 그것을 화자적응에 적용한 에너지부분공간 퍼지벡터양자화 화자적응기법에 의하여 미지화자의 한국어 단어를 인식하였다. 화자적응을 위한 학습과정에서 에너지 부분공간에 따른 퍼지 히스토그램으로 사상코드북을 작성하였으며, 인식과정에서 미지화자의 음성을 ESFVQ에 의해 복화화하므로써 인식율의 향상을 도모하였다. 남성 2인과 여성 1인이 발성한 DDD 전화 지역명에 대하여 ESFVQ에 의한 양자화 왜곡 및 화자적응 단어 인식율을 측정하여 그 성능을 평가하였다. ESFVQ의 양자화 왜곡은 벡터 양자화보다 22% 감소되었으며, 퍼지 벡터 양자화보다 5% 감소되었다. 또한, ESFVQ에 의한 화자적응방법으로 인식한 결과, 화자적응을 고려하지 않은 방법보다 26%, 벡터 양자화에 의한 방법보다 11%의 향상된 인식율을 얻을 수 있었다.

  • PDF

이동통신 음성 부화화기를 위한 선형 예측 계수(LPC)의 효율적 양자화 방법 (Efficient quantization of LPC parameters for vocoder of mobile communications)

  • 이인성;우홍채
    • 전자공학회논문지S
    • /
    • 제34S권4호
    • /
    • pp.50-56
    • /
    • 1997
  • In this paper, efficient quantization methods of line spectrum pairs (LSP) which has good performances and low complexity and memory are proosed for vocoder of mobile communication system. The adaptive quantization method utilizing the ordering property of LSP parameters is used in a scalar quantizer and a vector-scalar hybrid quantizer. The proposed scalar quantization algorithm needs 31 bits/frame to maintain the transparent quality of speech. The improved vector-scalar quantizer achieves an average spectral distortion of 1dB using 26 bits/frame. The proposed methods are evaluated in the channel errors and changed the predictor structure to maintain the robustness to channel errors.

  • PDF

저 전송률 동화상 압축에서 후처리 방법 및 후처리 방법의 주관적 객관적 평가 (Post-filtering in Low Bit Rate Moving Picture Coding, and Subjective and Objective Evaluation of Post-filtering)

  • 이영렬;김윤수;박현욱
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1518-1531
    • /
    • 1999
  • MPEG 및 H.263과 같은 동화상 압축 방식에 의하여 고 압축된 영상이 복원되었을 때 블록화 현상, 코너 이상치 (coner outliers), 링잉 잡음이 발생한다. 블록화 현상은 8x8 블록의 코너 (corner) 점에서 발생하는 잡음이며, 링잉 잡음은 영상의 에지 주변에서 발생하는 잡음이다. 그 이유는 MPEG 및 H.263이 8x8 화소 블록의 DCT 계수를 양자화 (quantization)하기 때문이다. 본 논문에서는 MPEG-4 및 H.263의 복원된 영상에서 발생하는 블록화 현상, 코니 이상치, 링잉 잡음을 줄이기 위해 기존의 저자들에 의하여 제안된 방법에 대한 주관적, 객관적 평가를 수행한다. 이 신호 적응형 후처리 방법은 압축된 데이터로부터 추출한 8x8 DCT 계수의 분포 정보와 움직임 벡터 정보를 이용하여 적응적으로 양자화 효과를 (quantization effect) 줄인다. 블록화 현상은 1차원 수평 및 수직 저대역 필터에 (low pass filter) 의하여 줄게 되고, 링잉 잡음은 2차원 신호 적응 필터 (signal-adaptive filter)에 의하여 줄게 된다. 신호 적응형 후처리 방법과 MPEG-4 VM (verification model)의 후처리 방법에 대한 MSSM (Modified Single Stimulus Method)을 이용한 주관적 \ulcorner질평가, 객관적 화질평가 (PSNR), 계산량 복잡도 (complexity)에 관한 비교연구가 컴퓨터 실험에 의하여 수행된다. 컴퓨터 실험을 위하여 MPEG-4에서 입력으로 사용하는 시험용 비데오 시퀀스를 이용하였다. 주관적인 화질 평가에서 두 방법은 비슷한 결과를 보였다. 반면 객관적 평가와 계산량 복잡도 분석 측면에 있어서, 신호 적응형 후처리 방법이 MPEG-4 VM의 후처리 방법보다 우수한 성능을 보였다.

  • PDF

Channel-adaptive Image Compression for Wireless Transmission

  • Lee, Yun-Gu;Lee, Ki-Hoon
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권4호
    • /
    • pp.276-280
    • /
    • 2017
  • This paper presents computationally efficient image compression for wireless transmission of high-definition video, to adaptively utilize available channel bandwidth and improve image quality. The method indirectly predicts an unknown available channel bandwidth by monitoring encoder buffer status, and adaptively controls a quantization parameter to fully utilize the bandwidth. Experimental results show that the proposed method is robust to variations in channel bandwidth.

버퍼제약에 의한 영상압축 적응양자화 알고리듬 (A Buffer-constrained Adaptive Quantization Algorithm for Image Compression)

  • 박대철;정두영
    • 한국멀티미디어학회논문지
    • /
    • 제5권3호
    • /
    • pp.249-254
    • /
    • 2002
  • 본 논문에서는 영상압축을 위한 버퍼제약에 의한 적응양자화 알고리즘에 대해서 논하고져 한다. 버퍼제약에 의한 알고리즘은 source coding과 더불어 그간 연구되다가, 최근에는 비트율 왜곡의 이름으로 연구가 더욱 진전돼 오고 있다. 여기에서 우리는 버퍼 occupancy의 값이 비트율 왜곡의 측정치에서 Lagrange multiplier 형식으로 통합되는 것을 제안한다. 여기서 제안하는 알고리즘이 Viterbi 알고리즘과는 반대로 최적치에는 약간 못미치는 성능을 보여주지만, 대신 계산의 복잡도가 매우 낮을 뿐 아니라, 버퍼 제어 알고리즘의 안정도를 Liapnov의 안정화이론을 이용해서 간단하게 설명 할 수 있다는 것이다.

  • PDF

경계의 방향성에 근거를 둔 가변블록형상 적응 예측영상부호화 (Adaptive Predictive Image Coding of Variable Block Shapes Based on Edge Contents of Blocks)

  • 도재수;김주영;장익현
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2254-2263
    • /
    • 2000
  • This paper proposes an efficient predictive image-compression technique based on vector quantization of blocks of pels. In the proposed method edge contents of blocks control the selection of predictors and block shapes as well. The maximum number of bits assigned to quantizers has been in creased to 3bits/pel from 1/5bits/pel, the setting employed by forerunners in predictive vector quantization of images. This increase prevents the saturation in SNR observed in their results in high bit rates. The variable block shape is instrumental in eh reconstruction of edges. The adaptive procedure is controlled by means of he standard deviation ofp rediction errors generated by a default predictor; the standard deviation address a decision table which can be set up beforehand. eh proposed method is characterized by overall improvements in image quality over A-VQ-PE and A-DCT VQ, both of which are known for their efficient use of vector quantizers.

  • PDF

Adaptive Digital Watermarking Based on Wavelet Transform Using Successive Subband Quantization and Perceptual Model

  • Kim, Ju-Young;Kwon, Seong-geun;Hwang, Hee-Chul;Kwon, Ki-Ryong;Kim, Duk-Gyoo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1240-1243
    • /
    • 2002
  • In this paper, we propose an adaptive digital image watermarking algorithm using successive subband quantization (SSQ) and perceptual model based on wavelet domain. The watermark is embedded into the perceptually significant coefficients (PSCs) of image. The PSCs in the baseband are selected according to the amplitude of the coefficients and the high frequency subbands are selected by SSQ. To embed the watermark, we use perceptual model. The perceptual model is based on the computation of the noise visibility function (NVF) and embed at the texture and edge region stronger embedded watermarks.

  • PDF

SBC와 블럭 적응 양자화를 이용한 가정용 디지탈 VCR 영상 압축 알고리듬 (An Image Data Compression Algorithm for a Home-Use Digital VCR Using SBC with Block-Adaptive Quantization)

  • 김주희;서정태;박용철;이제형;윤대희
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.124-132
    • /
    • 1994
  • An image data compression method for a digital VCR must satisfy special requirements such as high speed playback. various edting capabilities and error concealment to provide immunity to tape dropouts. Taking these requirements requirements into consideration, this paper proposes a new interframe subband coding algorithm for a digital VCR. In the proposed method, continuous input images are fist partitioned into four frequency bands. The lowest frequency subband is coded with 3-D block adaptive quantization that removes the level redundancy within each level. The other higher frequency subbands are coded by an intraframe coding method using the property of the human visual system. To keep reasonable image quality in high speed palyback, a segment forming method in the frequency domaing is also proposed Computer simulation results demonstrate that the proposed algorithm has the potential of achieving virtually lossless compression in normal play and produces an image with less mosaic errors in high speed play.

  • PDF

멀티웨이브릿 변환 기반에서 연속 부대역 양자화 및 지각 모델을 이용한 적응 워터마킹 기술 (Adaptive Watermarking Using Successive Subband Quantization and Perceptual Model Based on Mukiwavelet Transform)

  • 권기룡;강균호;조영웅;문광석;이준재
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.121-124
    • /
    • 2002
  • This paper presents an adaptive digital image watermarking scheme that uses successive subband quantization (SSQ) and perceptual modeling. Our approach performs a multiwavelet transform to determine the local image properties optimal and the watermark embedding location. The multiwavelet used in this paper is the DGHM multiwavelet with approximation order 2 to reduce artifacts in the reconstructed image. A watermark is embedded into the perceptually significant coefficients (PSC) of the image in each subband. The PSCs in high frequency subbands are selected by setting the thresholds to one half of the largest coefficient in each subband. After the PSCs in each subband are selected, a perceptual model is combined with a stochastic approach based on the noise visibility function to produce the final watermark.

  • PDF

An Adaptive Algorithm for the Quantization Step Size Control of MPEG-2

  • Cho, Nam-Ik
    • Journal of Electrical Engineering and information Science
    • /
    • 제2권6호
    • /
    • pp.138-145
    • /
    • 1997
  • This paper proposes an adaptive algorithm for the quantization step size control of MPEG-2, using the information obtained from the previously encoded picture. Before quantizing the DCT coefficients, the properties of reconstruction error of each macro block (MB) is predicted from the previous frame. For the prediction of the error of current MB, a block with the size of MB in the previous frame are chosen by use of the motion vector. Since the original and reconstructed images of the previous frame are available in the encoder, we can calculate the reconstruction error of this block. This error is considered as the expected error of the current MB if it is quantized with the same step size and bit rate. Comparing the error of the MB with the average of overall MBs, if it is larger than the average, small step size is given for this MB, and vice versa. As a result, the error distribution of the MB is more concentrated to the average, giving low variance and improved image quality. Especially for the low bit application, the proposed algorithm gives much smaller error variance and higher PSNR compared to TM5 (test model 5).

  • PDF