• 제목/요약/키워드: SD (Spectral Distortion)

검색결과 16건 처리시간 0.021초

효율적인 가변차원 하모닉 크기 양자화기법 (Efficient Variable Dimension Quantization of Harmonic Magnitude)

  • 신경진;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.47-54
    • /
    • 2001
  • 본 논문은 스펙트럴 크기 파라미터들에 대한 효율적인 가변 차원 양자화 기법을 제안한다. 특히, 하모닉 부호화 기에서의 스펙트럴 크기값 계수들은 가변차원이기 때문에 가변 차원의 양자화를 필요로 한다. 따라서, 본 논문에서는 스펙트럴 크기값 계수들에 대해 가변 이산 코사인 변환(DCT: Discrete Cosine Transform) 및 가변 차원에 적합한 훈련구조를 가지는 비정방형 변환 벡터 양자화 (NSTVQ: Nonsquare Transform Vector Quantization)를 홀수/짝수 구조 및 분할(Split) 구조 그리고 다단계(Multi-stage) 구조 등과 결합시킨 효율적인 양자화 기법을 제안한다. 제안된 양자화 기법의 성능평가는 스펙트럴의 크기값에 대한 주파수 왜곡(SD: Spectral Distortion) 값을 사용하였으며, 다단계 비정방형 변환 벡터 양자화(MSNSTVQ: Multi-Stage Nonsquare Transform Vector Quantization)가 가장 좋은 성능을 나타내었다.

  • PDF

하모닉 코더를 위한 직선과 이산코사인변환 (DCT)을 이용한 하모닉 크기값 (Magnitude) 양자화 기법 (Method of Harmonic Magnitude Quantization for Harmonic Coder Using the Straight Line and DCT (Discrete Cosine Transform))

  • 최지욱;정규혁;이인성
    • 한국음향학회지
    • /
    • 제27권4호
    • /
    • pp.200-206
    • /
    • 2008
  • 본 논문은 음성신호의 주파수를 반으로 나누어 양자화 계수 추출에 직선과 DCT (Discrete Cosine Transform)를 혼합하여 사용한 양자화 기법을 제안한다. 하모닉 부호화기에서의 하모닉은 가변이므로 저주파에서의 하모닉만을 오버샘플링하여 차원을 고정한다. 고정된 차원의 스펙트럼 포락선을 직선으로 표현한 후 직선이 불연속인 주파수에서의 샘플값만을 전송한다. 이 논문에서는 저주파에서의 하모닉은 복원을 위해 고정된 직선의 계수를 사용하였고 고주파에서의 하모닉은 가변 DCT를 적용하여 직선과 DCT가 격합된 형태의 양자화기법을 제안한다. 제안된 양자화 기법의 성능평가는 스펙트럴의 크기값에 대한 Spectral Distortion (SD)값을 사용하였다. 실험결과 HVXC보다 제안된 양자화 기법의 SD가 0.3dB 정도 개선되었다.

한국어에 의한 EVRC LSP 코드북 설계 (Design of EVRC LSP Codebooks with Korean)

  • 이진걸
    • 한국음향학회지
    • /
    • 제21권2호
    • /
    • pp.167-172
    • /
    • 2002
  • 음성부호화 알고리즘인 EVRC (Enhanced Variable Rate Codec)는 현재 북미 및 한국 CDMA 디지털 셀룰러 시스템에 사용되고 있다. EVRC음성부호화기에서 음성의 주파수영역에서의 에너지 분포와 관련되어 있는 LSP (Line Spectral Pairs)값은 가중분할 벡터 양자화 (Weighted Split Vector Quantization)에 의해 코딩된다. 이러한 코딩 과정에 사용되는 LSP 코드북이 개발국 언어 혹은 영어로 설계되었음을 감안하면 한국어통화에 대해서는 한국어로 설계된 LS 코드북에 의해 향상된 성능을 기대할 수 있다. 본 논문에서는 한국어로 BVRC의 LSP 코드북을 LBG알고리즘을 기반으로 한 벡터 양자화기법으로 설계하였으며 이 코드북에 의한 벡터양자화 성능향상 및 그에 따른 음질향상을 각각 SD (Spectral Distortion) 및 신호대 잡음비 (SNR), SegSNR측정으로 입증하였다.

광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계 (Design of the LSF Parameter Quantizer for the Wideband Speech Codec)

  • 지상현;강상원;윤병식
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.29-34
    • /
    • 2001
  • 본 논문에서는 고품질 음성 서비스를 가능하게 하는 광대역 음성 부호화기의 선 스펙트럼 주파수 (line spectral frequency: ISF) 계수 양자화기를 설계하였다. 광대역 음성 부호화기를 위한 효율적인 LSF 계수 양자화기를 설계하기 위하여, 인접 프레임간의 상관도를 이용하였으며, 각 해당 프레임의 ISF 계수에 대한 양자화를 인접 프레임간 상관도가 높은 프레임과 상관도가 낮은 프레임으로 나누어 독립적으로 수행하였다. 인접 프레임간 상관도가 높은 프레임의 LSF계수 양자화를 위하여 예측 피라미드형 벡터 양자화기 (predictive pyramid vector quantizer: PPVQ)를 사용하여 양자화하였고, 상관도가 낮은 프레임의 LSF 계수는 피라미드형 벡터 양자화기 (PVQ)를 사용하여 양자화 하였다. PPVQ에서 예측기로 1차 AR 예측기를 사용하였다. 광대역 음성 부호화기를 위해 본 논문에서 설계된 UF 계수양자화기를 평균스펙트럼 왜곡(spectral distortion: SD) 성능 관점에서 실험한 결과, LSF계수 양자화에 할당된 비트가 프레임당 40비트일 때, 평균 SD값이 1 dB 내외이고, 2 dB 이상 및 4 dB 이상 outlier가 각각 3.87%및 0.01%인 transparent한 성능을 얻을 수 있었다.

  • PDF

위너필터에 의한 음성 중의 잡음제거 알고리즘 (Noise Reduction Algorithm in Speech by Wiener Filter)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제8권9호
    • /
    • pp.1293-1298
    • /
    • 2013
  • 본 논문에서는 음성신호를 개선할 목적으로 잡음으로 오염된 음성신호로부터 잡음성분을 제거하기 위한 위너 필터를 사용한 잡음제거 알고리즘을 제안한다. 제안한 알고리즘은 먼저 잡음 복원 및 제거 방법에 기초하여 잡음으로 오염된 신호로부터 각 프레임에서 백색잡음의 잡음 스펙트럼을 제거한다. 또한 본 알고리즘은 선형예측 분석 방법에 기초한 위너 필터를 사용하여 음성신호를 강조한다. 본 실험에서는 일본 남성화자에 의한 음성과 잡음데이터를 사용하여 본 알고리즘의 실험 결과를 나타낸다. 백색잡음에 의하여 오염된 음성신호에 대하여 스펙트럼 왜곡률 척도를 사용하여 본 알고리즘이 유효하다는 것을 확인한다. 실험으로부터 백색잡음에 대하여 이전의 위너 필터와 비교하여 최대 4.94 dB의 출력 스펙트럼 왜곡률이 개선된 것을 확인할 수 있었다.

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

  • 신재현;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.286-291
    • /
    • 2003
  • 본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

가변 윈도우 스펙트럼 분석을 이용한 CELP 부호화기의 음질 향상에 관한 연구 (A Study on a Improvement of the Speech Quality by Spectrum Analysis with Variable Window in CELP Vocoder)

  • 나덕수;민소연;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
    • /
    • pp.106-109
    • /
    • 2000
  • There have been proposed two types of low bit rate vocoder upto now : One is MBE type using the spectrum modeling and another is CELP type using the hybrid coding method. CELP type vocoder has mainly studied between them. Specially, much of intensity is concentrated in CELP vocoder due to the emergence of Internet Phone and PCS in a domestic. In order to improve the speech quality in CELP vocoder, in this paper, we proposed a new spectrum analysis algorithm with variable window, In CELP vocoder, the spectrum of the synthesised speech signal is distorted because the fixed size windows is used for spectrum analysis. So we have measured the spectral leakage and in order to minimize the spectral leakage have adjusted the window size. Applying this method G.723.1 ACELP, we can get SD(Spectral Distortion) reduction 0.084(dB), residual energy reduction 6.3% and MOS(Mean Opinion Score) improvement 0.1.

  • PDF

가변 윈도우를 이용한 CELP 부호화기의 음질 향상에 관한 연구 (A Study on a Improvement of the Speech Quality with Variable Window in CELP Vocoder)

  • 주상규
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.265-268
    • /
    • 2010
  • There have been proposed two types of low bit rate vocoder upto now : One is MBE type using the spectrum modeling and another is CELP type using the hybrid coding method. CELP type vocoder has mainly studied between them. Specially, much of intensity is concentrated in CELP vocoder due to the emergence of Internet Phone and PCS in a domestic. In order to improve the speech quality in CELP vocoder, in this paper, we proposed a new spectrum analysis algorithm with variable window. In CELP vocoder, the spectrum of the synthesised speech signal is distorted because the fixed size windows is used for spectrum analysis. So we have measured the spectral leakage and in order to minimize the spectral leakage have adjusted the window size. Applying this method G.723.1 ACELP, we can get SD(Spectral Distortion) reduction 0.084(dB), residual energy reduction 6.3% and MOS(Mean Opinion Score) improvement 0.1.

  • PDF

음향학적 모델에 의한 스펙트럼 필터 알고리즘 (Spectrum Filter Algorithm based on Acoustic Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

G.723.1 음성 부호화기의 LSE 계수 양자화를 위한 고속화 알고리즘 연구 (A study on a fast algorithm for the LSP coefficient quantization of G. 723.1 speech codec)

  • 송창용;성호상;강상원;성유나
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.153-156
    • /
    • 2000
  • 본 논문에서는 멀티미디어 서비스들 중에서 음성 또는 오디오 신호를 저속으로 압축할 때 사용되는 G.723.1 부호화기의 line spectral frequency(LSF) 계수 양자화 방식을 고속으로 처리하는 알고리즘을 제안하였다. 제안된 고속탐색 방법은 LSF 계수의 순서성질을 이용하여 코드북의 탐색 범위를 줄임으로써 계산량을 크게 감소시킨다. 제안된 고속탐색 방법을 predictive split VQ(PSVQ) 구조를 갖는 G.723.1 에 적용한 결과 spectral distortion(SD) 성능 감쇄 및 추가적인 메모리 증가 없이 최적 코드벡터를 찾기 위한 코드북 탐색 과정에서 코드북의 평균 탐색 범위가 $20.1\%$ 감소했으며, 이는 additions, subtractions, multiplies 및 comparisons 수가 각각 $19.1\%$, $20.1\%$, $19.4\%$$12.2\% 감소하는 결과를 얻었다.

  • PDF