• 제목/요약/키워드: Line spectral frequencies (LSF)

검색결과 6건 처리시간 0.021초

Line Spectral Frequency와 음성신호의 주파수 분포에 관한 연구 (A Study on the Relation Between the LSF's and Spectral Distribution of Speech Signals)

  • 이동수;김영화
    • 대한전자공학회논문지
    • /
    • 제25권4호
    • /
    • pp.430-436
    • /
    • 1988
  • LSF(Line Spectral Frequency) derived from LPC has known as a very useful transmission parameter of speech signals, for it has a good linear interpolation characteristics and a low spectrum distortion at low bit rates coding. This paper presents that it is possible to extract directly the formant frequencies of speech signals from LSF parameter without application of FFT algorithm by comparing the distribution of LSF parameter with the frequency distribution of analysis filter. This paper suggests the advanced algorithm that results in improving the speed of convergence at analytic solution method. Also, for the flexibility of parameters, the process that transforms from LSF to LPC is presented.

  • PDF

Noise Spectrum Estimation Using Line Spectral Frequencies for Robust Speech Recognition

  • Jang, Gil-Jin;Park, Jeong-Sik;Kim, Sang-Hun
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.179-187
    • /
    • 2012
  • This paper presents a novel method for estimating reliable noise spectral magnitude for acoustic background noise suppression where only a single microphone recording is available. The proposed method finds noise estimates from spectral magnitudes measured at line spectral frequencies (LSFs), under the observation that adjacent LSFs are near the peak frequencies and isolated LSFs are close to the relatively flattened valleys of LPC spectra. The parameters used in the proposed method are LPC coefficients, their corresponding LSFs, and the gain of LPC residual signals, so it suits well to LPC-based speech coders.

포만트 공간에서의 주파수 변환을 이용한 이중 언어 음성 변환 연구 (Bilingual Voice Conversion Using Frequency Warping on Formant Space)

  • 채의근;윤영선;정진만;은성배
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.133-139
    • /
    • 2014
  • This paper describes several approaches to transform a speaker's individuality to another's individuality using frequency warping between bilingual formant frequencies on different language environments. The proposed methods are simple and intuitive voice conversion algorithms that do not use training data between different languages. The approaches find the warping function from source speaker's frequency to target speaker's frequency on formant space. The formant space comprises four representative monophthongs for each language. The warping functions can be represented by piecewise linear equations, inverse matrix. The used features are pure frequency components including magnitudes, phases, and line spectral frequencies (LSF). The experiments show that the LSF-based voice conversion methods give better performance than other methods.

제한된 시간적 분해법에 기반한 선스펙트럼 주파수의 효과적인 양자화 (Efficient Quantization Method for Line Spectral Frequencies Based on Restricted Temporal Decomposition)

  • 김승주;오영환
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.45-53
    • /
    • 1998
  • 본 논문에서는 선스펙트럼 주파수(LSF) 파라미터를 위한 제한된 시간적 분해법을 제안한다. LSF 파라미터는 인접 차수에 대해 의존적이고, 차수간 순차성이 있으나, 기존의 시간적 분해법은 이러한 성질을 보존하지 못한다. 즉, 추정된 사건 벡터가 더 이상 LSF 파 라미터로서 해석되지 못하는 문제가 있다. 이를 해결하기 위하여, 본 논문에서는 사건 함수 간에 새로운 제약을 두어, 추정된 사건 벡터가 LSF 파라미터의 성질을 유지하도록 한다. 결 과적으로 제안된 방법을 이용하여 구해진 사건 벡터는 LSF 파라미터와 동일한 방법을 적용 하여 효과적으로 양자화될 수 있고, 실험 결과 평균 752bps의 전송률로 투명한 양자화를 수 행할 수 있었다.

  • PDF

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계 (Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization)

  • 전자경;박상국;강상원
    • 한국통신학회논문지
    • /
    • 제32권3C호
    • /
    • pp.234-240
    • /
    • 2007
  • 본 논문에서는 기존의 트렐리스 부호화 양자화 기법을 이용, 변형하여 저 복잡도 블록 제한 격자 부호화 양자화 기법 (Block-Constrained Trellis Coded Quantization, 이하 BC-TCQ)을 제안하곤 이를 이용한 협대역 음성 부호화기용 예측 BC-TCQ를 설계하였다. 트렐리스 부호화 양자화 기법은 일종의 벡터 양자화 방식으로 부호화에 요구되는 벡터 코드북을 트렐리스 구조에 기반한 스칼라 코드북으로 구성함으로써 VQ와 비교 할 만한 성능을 보일 뿐 아니라 복잡도가 훨씬 작은 특성을 보인다. 본 논문에서 제안한 예측 BC-TCQ는 프레임당 26비트에서 IS-641 음성 부호화기보다 평균 SD가 0.4107dB 향상되었으며, 더하기 연산이 64.54%, 곱하기 연산이 76.93%, 비교 연산이 2.35% 감소하였다.