• Title/Summary/Keyword: 음성신호 대역

Search Result 146, Processing Time 0.029 seconds

The Slop Compensation Algorithm of Speech Spectrum by QMF (Quadrature Mirror Filter) (QMF Filter에 의한 음성스펙트럼의 기울기 보상 알고리즘)

  • Min, So-Yeon;Bae, Myung-Jin
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.364-367
    • /
    • 2006
  • 음성신호를 관찰하였을 때 성문특성으로 인해서 고주파 쪽 특성이 약화되는 경향이 있다. 약화된 고주파 특성을 보상하기 위하여 프리 엠퍼시스 필터를 통해 보상하고 있다. 프리 엠퍼시스 필터를 간단한 수식으로 표현하면 y(n)=s(n)-As(n-1)와 같이 차분 방정식으로 나타낼 수 있다. 여기서 A값은 보통 0.9에서 1사이의 값을 사용한다. 본 논문에서는 QMF 필터를 이용하여 입력신호를 고주파와 저주파의 2개의 대역으로 분할하여 각 밴드에 프리 엠퍼시스 필터를 적용하여 약화되어진 특성을 정확히 보상하는 방법을 제안한다.

  • PDF

Designing on improved combined mapping based on soft-decision for wideband LSP coefficients pattern estimation (광대역 LSP 계수의 패턴 추론을 위한 연판정 기반 개선된 조합 매핑 설계)

  • Jeon, Jong-geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.805-807
    • /
    • 2018
  • 본 논문은 인공 대역 확장에서 스펙트럼 포락선 확장 시 발생하는 스펙트럼 왜곡을 줄이는 개선된 조합 매핑(Improved combined mapping) 알고리즘을 제안한다. 벡터양자화를 기반으로 하는 코드북 매핑(Codebook mapping)과 스펙트럼 포락선(Spectrum Envelope)의 선형 의존도를 이용한 선형 매핑(Linear mapping)을 사용하여 각각 확장된 광대역 LSP(Line Spectrum Pair)를 추론하고, 연판정(Soft-decision)을 통해 최적화된 LSP를 추론한다. 제안된 알고리즘으로 합성된 음성신호의 스펙트럼 왜곡(Spectrum Distortion)이 기존 조합매핑으로 얻은 음성 신호의 스펙트럼 왜곡보다 더 적은 왜곡을 갖는 결과를 나타내었다.

Implementation of Speech Recognition Filtering at Emergency (응급상황에서의 음성인식을 위한 필터기 구현)

  • Cho, Young-Im;Jang, Sung-Soon
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.20 no.2
    • /
    • pp.208-213
    • /
    • 2010
  • Generally, the mal factor for speech recognition is the background noise in speech recognition. The noise is the reason to reduce the speech recognition performance. Owing to the fact, the place to recognize is very important. To improve the recognition performance from the sound having noise, we implemented the noise filtered Wiener filter at the signal process step which adopted the FIR filter. In FIR filter, it deal with the filtered speech signal which is appropriate frequency range of human speech frequency range. Therefore, we make the recognition system distinguish between noise and speech sound from the incoming speech signal.

An Analysis on Audio Quality Deterioration of Acoustic OFDM (음향 OFDM의 음질 저하 원인 분석)

  • Cho, Ki-Ho;Yu, Hwan-Sik;Chang, Jun-Hyuck;Kim, Nam-Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.2
    • /
    • pp.107-111
    • /
    • 2009
  • Acoustic OFDM is used for audible frequency band acoustic communication which employs loudspeaker as transmitter and microphone as the receiver antenna. Since acoustic OFDM can transmit about 1 kbps using 1600 Hz band. acoustic OFDM signal is inserted into the audio signal like music or speech, However. audio quality deteriorates definitely during the inserting process. This paper introduces a reason for audio quality deterioration and discuss how to reduce this phenomenon.

A Correlation between Emile Sound and Other Waves (에밀레의 맥놀이와 다른 파동과의 상관관계)

  • 안정근;진용옥
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.1
    • /
    • pp.30-35
    • /
    • 2001
  • The most important characteristic of Emile Bell's sound is a beating. It is modulation phenomenon which appears as a result of interference multiplication in time domain. This modulation phenomenon can be modeled as DSB-SC which suppress carrier and signals distributed both sides. The beatiog wave is observed in Laman distribution signal for polyvinyl speech signal, water vein wave, tide wave. The beating wave is caused by asymmetry Property of the bell.

  • PDF

An Imporvement of DTMF Tone Transmission Based on Dual Mode G.723.1 Vocoder (이중 모드 G.723.1 음성부호화기에 의한 DTMF 톤 전송성능 개선)

  • 허호영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.415.1-418
    • /
    • 1998
  • G.723.1은 부호화 방식은 제한된 계산량으로 낮은 전송율에서 음성을 가장 잘 표현할 수 있도록 최적화되어 있어서, 음성주파수 대역에 있는 DTMF톤의 경우 왜곡이 발생되어 전송성능이 떨어지는 문제점이 있다. 본 논문에서는 DTMF톤의 투명한 전송을 위해 LSP 계수를 이용한 톤 신호 검출에 기반을 둔 음성모드와 톤모드의 이중모드를 가지는 변형된 G.723.1 음성부호화 방식을 제안한다. 제안된 방식에서 음성모드 부호화기는 기존의 방식과 동일하며, 톤모드의 경우 부호화 단계에서 spectral smoothing 및 피치주기 검출 방식 등을 수정함으로써 수신단의 변경없이 DTMF톤의 전송왜곡을 개선시킨다. 본 논문에서는 컴퓨터 모의실험을 통해 제안된 방법이 DTMF 전송성능을 개선시킴을 확인하였다.

  • PDF

Speech enhancement system using the multi-band coherence function and spectral subtraction method (다중 주파수 밴드 간섭함수와 스펙트럼 차감법을 이용한 음성 향상 시스템)

  • Oh, Inkyu;Lee, Insung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.4
    • /
    • pp.406-413
    • /
    • 2019
  • This paper proposes a speech enhancement method through the process of combining the gain function with spectrum subtraction method in the two microphone array with close spacing. A speech enhancement method that uses a gain function estimated by the SNR (Signal-to Noise Ratio) based on the multi frequency band coherence function causes the performance degradation in high correlation between input noises of two channels. A new speech enhancement method is proposed where the weighted gain function is used by combining the gain function from the spectral subtraction. The performance evaluation of the proposed method was shown by comparison with PESQ (Perceptual Evaluation of Speech Quality) value which is an objective quality evaluation test provided by the ITU-T (International Telecommunications Union Telecommunication). In the PESQ tests, the maximum 0.217 of PESQ value is improved in the various background noise environments.

A CELP Speech Coder Using Secondary Long Term Prediction with Multi-Band Pass Filtered Multi-Pulses (다중 펄스와 다중 대역 이차 장구간 예측을 이용한 CELP 음성 부호화기)

  • 서정태;최용수;강홍구;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.9-16
    • /
    • 1998
  • 본 논문에서는 낮은 비트율 CELP 음성 부호화기의 장구간 예측기의 성능 향상 방 법을 제안한다. 비트율을 낮추기 위해서는 분석 구간의 길이가 길어져야하며 이에 따라 장 구간 예측기의 성능이 저하되어 장구간 예측 후에도 준 주기성 성분이 상당량 존재하므로 백색 잡음으로 구성된 통계 코드북만으로는 이를 모델링하기 어려워진다. 제안 방법에서는 다중 대역 필터와 다중 펄스열을 이용하여 한 번 더 필터링(이차 장구간 예측)함으로써 장 구간 예측 후의 신호가 통계 코드북에 적합한 백색 잡음 형태로 되도록 모델링한다. 제안된 방법의 성능을 평가하기 위해 4.8kbps 비트율로 양자화한 후, 기존에 제안된 같은 전송률의 MBCELP와 DoD-CELP와 비교하였다. 실험 결과 제안된 방법이 기존 부호화기들에 비해 주/객관적인 음질에서 우수한 성능을 보여준다.

  • PDF

A study for maximum channelizing by FIR filter in voice band (음성대역에서 FIR필터에 의한 최대 채널화에 관한 연구)

  • Kim, Seong-Cheol;Park, Kyung-Ho
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.11 no.8
    • /
    • pp.1472-1477
    • /
    • 2007
  • Users are offered by the multimedia service of various information on current information-oriented society. The digitize became essential that process of various data is not to selected. Also, Filter technology is required to use the lacking frequency resources efficiently. This paper designs FIR digital band-pass filter of the voice band by narrow band pass filter md verify the characteristics of filter to use by the DSP practice SET.

Design and Implementation of Simple Text-to-Speech System using Phoneme Units (음소단위를 이용한 소규모 문자-음성 변환 시스템의 설계 및 구현)

  • Park, Ae-Hee;Yang, Jin-Woo;Kim, Soon-Hyob
    • The Journal of the Acoustical Society of Korea
    • /
    • v.14 no.3
    • /
    • pp.49-60
    • /
    • 1995
  • This paper is a study on the design and implementation of the Korean Text-to-Speech system which is used for a small and simple system. In this paper, a parameter synthesis method is chosen for speech syntheiss method, we use PARCOR(PARtial autoCORrelation) coefficient which is one of the LPC analysis. And we use phoneme for synthesis unit which is the basic unit for speech synthesis. We use PARCOR, pitch, amplitude as synthesis parameter of voice, we use residual signal, PARCOR coefficients as synthesis parameter of unvoice. In this paper, we could obtain the 60% intelligibility by using the residual signal as excitation signal of unvoiced sound. The result of synthesis experiment, synthesis of a word unit is available. The controlling of phoneme duration is necessary for synthesizing of a sentence unit. For setting up the synthesis system, PC 486, a 70[Hz]-4.5[KHz] band pass filter for speech input/output, amplifier, and TMS320C30 DSP board was used.

  • PDF