• 제목/요약/키워드: Vector quantization (VQ)

검색결과 129건 처리시간 0.035초

영상 코딩을 위한 벡터 양자화 방법의 성능 비교 (Comparison of Vector Quantization for Image Coding)

  • 박광훈;박용철;차일환;윤대희
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1987년도 춘계학술발표회 논문집
    • /
    • pp.35-38
    • /
    • 1987
  • The purpose of this paper is to compare a class of vector quantization techniques which include GVQ(Genera VQ) MSVQ(Mean separated VQ) and DCT_VQ The VQ techniques are applied to six images and both subjective and objective performance comparison are made The results indicate that the transform domain approach(DCT_VQ) yields more syable results than the spatial domain method (GVQ, MSVQ)

  • PDF

영상 부호화를 위한 벡터 양자화기에서의 고속 탐색 기법 (Fast Codebook Search for Vector Quantization in Image Coding)

  • 고종석;김재균
    • 한국통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.302-308
    • /
    • 1988
  • 본 논문에서는 벡터 양자화(VQ)의 탐색 복잡도를 줄이기 위한 방법을 제안한다. 본 방법의 현재 부호화하려는 벡터의 특성을 효율적으로 이용함으로써 고속 탐색 효과를 가져온다. 벡터 크기가 16인 제안하는 VQ방식으로써 약 0.1-1.9dB의 미소한 성능 감소로 1/8-1/16의 복잡도 감소를 꾀할 수 있음을 보인다. 동시에 기존의 방식과 비교하여 더 성능이 우수함을 보인다.

  • PDF

표본 적응 프러덕트 양자화와 설계 알고리즘 (Sample-Adaptive Product Quantization and Design Algorithm)

  • 김동식;박섭형
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2391-2400
    • /
    • 1999
  • 벡터 양자화(vector quantizer:VQ)는 낮은 전송률을 가지는 데이터 압축에 효과적인 방법이나, 가장 큰 단점은 부호화 복잡도로 벡터의 차수와 전송률이 증가함에 따라 기하 급수적으로 증가하게 된다. VQ의 부호화 복잡도 문제를 해결하기 위하여 여러 변형된 VQ 기법이 제안되었어도 전송률이 높은 경우에는 높은 부호화 복잡도와 방대한 양의 부호책 및 훈련 열로 인하여 구현이 거의 불가능하다. 본 논문에서는 특별히 높은 전송률에서, 스칼라 양자기의 구조를 가지며 VQ의 성능을 얻을 수 있는 양자화 기법을 제안하였다. 이 기법은 feed-forward 적응 양자기의 형태를 가지고 있는데, 비교적 짧은 적응 주기를 가지고 있다. 따라서 제안한 양자화 기법을 표본 적응 프로덕트 양자기(sample-adaptive product quantizer: SAPQ)로 부르기로 한다. 그러나 제안된 SAPQ는 m차원의 공간에서 구조적 제한을 가지는 m차원 VQ의 일종으로, 비록 입력 신호가 독립이라고 할지라도 입력 분포에 따라 큰 이득을 얻을 수 있다. 제한한 SAPQ의 성능은 입력 분포에 따라서 Lloyd-Max 양자기에 비하여 약 2∼3dB의 이득을 얻었다.

  • PDF

벡터 양자화에서 벡터의 특성을 이용한 단축 탐색방법 (A Simple Algorithm for Fast Codebook Search in Image Vector Quantization)

  • 고종석;김재균;김성대
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1434-1437
    • /
    • 1987
  • We present a very simple algorithm for reducing the encoding (codebook search) complexity of vector quantization (VQ), exploiting some features of a vector currently being encoded. A proposed VQ of 16 (=$4{\times}4$) vector dimension and 256 codewords shows a slight performance degradation of about 0.1-0.9 dB, however, with only 16 or 32 among 256 codeword searches, i.e., with just 1/16 or 1/8 search complexity compared to a full-search VQ. And the proposed VQ scheme is also compared to and shown to be a bit superior to tree-search VQ with regard to their SNR performance and memory requirement.

  • PDF

백터양자화가의 구조적 코더 찾기 (STRUCTURED CODEWORD SEARCH FOR VECTOR QUANTIZATION)

  • 우홍체
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.467-470
    • /
    • 2000
  • Vector quantization (VQ) is widely used in many high-quality and high-rate data compression applications such as speech coding, audio coding, image coding and video coding. When the size of a VQ codebook is large, the computational complexity for the full codeword search method is a significant problem for many applications. A number of complexity reduction algorithms have been proposed and investigated using such properties of the codebook as the triangle inequality. This paper proposes a new structured VQ search algorithm that is based on a multi-stage structure for searching for the best codeword. Even using only two stages, a significant complexity reduction can be obtained without any loss of quality.

  • PDF

코우드북의 절충탐색에 의한 벡터양자화 (Vector Quantization by N-ary Search of a Codebook)

  • 이창영
    • 음성과학
    • /
    • 제8권3호
    • /
    • pp.143-148
    • /
    • 2001
  • We propose a new scheme for VQ codebook search. The procedure is in between the binary-tree-search and full-search and thus might be called N-ary search of a codebook. Through the experiment performed on 7200 frames spoken by 25 speakers, we confirmed that the best codewords as good as by the full-search were obtained at moderate time consumption comparable to the binary-tree-search. In application to speech recognition by HMM/VQ with Bakis model, where appearance of a specific codeword is essential in the parameter training phase, the method proposed here is expected to provide an efficient training procedure.

  • PDF

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

  • 신재현;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.286-291
    • /
    • 2003
  • 본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

벡터 양자화 변분 오토인코더 기반의 폴리 음향 생성 모델을 위한 잔여 벡터 양자화 적용 연구 (A study on the application of residual vector quantization for vector quantized-variational autoencoder-based foley sound generation model)

  • 이석진
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.243-252
    • /
    • 2024
  • 최근에 연구되기 시작한 폴리(Foley) 음향 생성 모델 중 벡터 양자화 변분 오토인코더(Vector Quantized-Variational AutoEncoder, VQ-VAE) 구조와 Pixelsnail 등 생성모델을 활용한 생성 기법은 중요한 연구대상 중 하나이다. 한편, 딥러닝 기반의 음향 신호의 압축/복원 분야에서는 기존의 VQ-VAE 구조에 비해 잔여 벡터 양자화 기술이 더 적합한 것으로 보고되고 있으며, 따라서 본 논문에서는 폴리 음향 생성 분야에서도 잔여 벡터 양자화 기술이 효과적으로 적용될 수 있을지 연구하고자 한다. 이를 위하여 본 논문에서는 기존의 VQ-VAE 기반의 폴리 음향 생성 모델에 잔여 벡터 양자화 기술을 적용하되, Pixelsnail 등 기존의 다른 모델과 호환이 가능하고 연산 자원의 소모를 늘리지 않는 모델을 고안하여 그 효과를 확인하고자 하였다. 효과를 검증하기 위하여 DCASE2023 Task7의 데이터를 활용하여 실험을 진행하였으며, 그 결과 평균적으로 0.3 가량의 Fréchet audio distance 의 향상을 보이는 것을 확인하였다. 다만 그 성능 향상의 정도가 제한적이었으며, 이는 연산 자원의 소모를 유지하기 위하여 시간-주파수축의 분해능이 저하된 영향으로 판단된다.

Multi-frame AR model을 이용한 LPC 계수 양자화 (Quantization of LPC Coefficients Using a Multi-frame AR-model)

  • 정원진;김무영
    • 한국음향학회지
    • /
    • 제31권2호
    • /
    • pp.93-99
    • /
    • 2012
  • 음성코딩 시 성도는 Linear Predictive Coding (LPC) 계수를 이용해서 모델링 한다. 일반적으로 LPC 계수는 양자화와 선형보간 관점에서 유리한 Line Spectral Frequency (LSF) 파라미터로 변경하여 사용한다. 10차 이상의 다차원 LSF 데이터를 벡터 양자화를 이용하여 직접 코딩하게 되면 벡터 내 상관관계 (intra-frame correlation)를 모두 이용할 수 있으므로 rate-distortion 관점에서는 높은 효율을 기대할 수 있다. 하지만, 계산량과 메모리 요구량이 높아져서 실제 코딩 시스템에서는 사용할 수 없게 되므로, 차원을 나누어 압축하는 Split Vector Quantization (SVQ)이 이용된다. 또한, LSF 데이터는 과거 벡터와의 벡터 간 상관관계 (inter-frame correlation)가 높으므로, 이를 이용한 Predictive Split Vector Quantization (PSVQ)이 사용되고 있다. PSVQ는 SVQ 보다 높은 rate-distortion 성능을 보인다. 본 논문에서는 음성 저장 장치를 위한 최적의 PSVQ를 구현하기 위해서 다수의 과거 프레임 정보와의 벡터 간상관관계 (inter-frame correlation)를 고려한 Multi-Frame AR-model 기반 SVQ (MF-AR-SVQ)를 제안하였다. 기존 PSVQ와 비교해 보았을 때, MF-AR-SVQ는 계산량과 메모리 요구량의 큰 증가 없이, 평균 spectral distortion 관점에서 약 1비트의 성능 향상을 보였다.

동적 인텍스 매핑을 이용한 벡터 양자화 시스템에서의 비트율 감축 (Bitrate Reduction in Vector Quantization System Using a Dynamic Index Mapping)

  • 이승준;양경호;김철우;이충웅
    • 전자공학회논문지B
    • /
    • 제32B권8호
    • /
    • pp.1091-1098
    • /
    • 1995
  • This paper proposes an efficient noiseless encoding method of vector quantization(VQ) index using a dynamic index mapping. Using high interblock correlation, the proposed index mapper transforms an index into a new one with lower entropy. In order to achieve good performance with low computational complexity, we adopt 'the sum of differences in pixel values on the block boundaries' as the cost function for index mapping. Simulation results show that the proposed scheme reduces the average bitrate by 40 - 50 % in ordinary VQ system for image compression. In addition, it is shown that the proposed index mapping method can be also applied to mean-residual VQ system, which allows the reduction of bitrate for VQ index by 20 - 30 %(10 - 20 % reduction in total bitrate). Since the proposed scheme is one for noiseless encoding of VQ index, it provides the same quality of the reconstructed image as the conventional VQ system.

  • PDF