• 제목/요약/키워드: Pitch period

검색결과 187건 처리시간 0.019초

음성 하모닉스 스펙트럼의 피크-피팅을 이용한 피치검출에 관한 연구 (A Study on the Pitch Detection of Speech Harmonics by the Peak-Fitting)

  • 김종국;조왕래;배명진
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.85-95
    • /
    • 2003
  • In speech signal processing, it is very important to detect the pitch exactly in speech recognition, synthesis and analysis. If we exactly pitch detect in speech signal, in the analysis, we can use the pitch to obtain properly the vocal tract parameter. It can be used to easily change or to maintain the naturalness and intelligibility of quality in speech synthesis and to eliminate the personality for speaker-independence in speech recognition. In this paper, we proposed a new pitch detection algorithm. First, positive center clipping is process by using the incline of speech in order to emphasize pitch period with a glottal component of removed vocal tract characteristic in time domain. And rough formant envelope is computed through peak-fitting spectrum of original speech signal infrequence domain. Using the roughed formant envelope, obtain the smoothed formant envelope through calculate the linear interpolation. As well get the flattened harmonics waveform with the algebra difference between spectrum of original speech signal and smoothed formant envelope. Inverse fast fourier transform (IFFT) compute this flattened harmonics. After all, we obtain Residual signal which is removed vocal tract element. The performance was compared with LPC and Cepstrum, ACF. Owing to this algorithm, we have obtained the pitch information improved the accuracy of pitch detection and gross error rate is reduced in voice speech region and in transition region of changing the phoneme.

  • PDF

VSELP 부호화기의 음질 및 주기탐색 개선에 관한 연구 (A Study on Improving Voice Quality and Pitch Searching of the VSELP Coder)

  • 성기철;문상재
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.740-749
    • /
    • 1994
  • 본 논문에서는 기존의 PSELP음성 부호화기의 성능을 개선하는 방법들을 제안하였다. 혼합 방법에 의한 주기추출법을 제안하여 기존의 PSELP음성 부호화기의 피치 주기 탐색시간을 줄였으며, 장기 필터(long term filter)의 출력 여기신호에서의 양자화 오차로 인해 발생할 수 있는 주기추출 오류를 개선시켰다. 또한 주기성을 향상기키고 잡음을 줄이기위해 본 논문에서 제안한 주기성 향상 필터를 복호기의 여기신호에 적용하여으며, 합성된 음성신호에서 음의 명료도를 높이기 위해 적응 일차 필터를 적용하였다. 작시한 방식과 필터를 적용한 결과 주기탐색시간이 기존에 대해 26%로 줄었으며, 최종합성음의 MOS(mean opinion score) 측정기에서 기존함성음은 3.19를 나타낸데 비해 개선된 합성읍의 4.04를 나타내었다.

  • PDF

연속음성인식을 위한 음성구간과 피치검출에 관한 연구 (A Study on Speech Period and Pitch Detection for Continuous Speech Recognition)

  • 김태석;장종칠
    • 한국멀티미디어학회논문지
    • /
    • 제8권1호
    • /
    • pp.56-61
    • /
    • 2005
  • 본 논문은 연속음성인식을 위한 음성구간과 피치를 검출하는 알고리즘을 제안한다. 이것은 연속음성을 입력받아 프레임 단위로 자/모음을 구분하며, 구분된 유성음에서 피치를 검출하는 방법이다 실제 잡음 환경에서 음성을 입력받아 적당한 문턱치 에너지를 사용함으로써 잡음환경에서 강인한 음성구간 추출이 가능하였고 추출한 음성구간에서 프레임단위로 영교차율과 단구간에너지를 이용한 알고리즘으로 유성음의 피치를 검출함과 동시에 자/모음을 구분하는 개선된 방식이다.

  • PDF

트리 코팅에서 전송에러에 강한 역방향 적응 피치 예측 (Robust Backward Adaptive Pitch Prediction for Tree Coding)

  • 이인성
    • 한국통신학회논문지
    • /
    • 제19권8호
    • /
    • pp.1587-1594
    • /
    • 1994
  • 피지 예측기는 강인한 트리 부호화기에서 가장 중요한 부분 중에 하나이다. 피치 예측기는 역방향으로 블록 적용 방법과 회귀적인 방법이 결합되어 구성되어진다. 부호화기의 전송에러에 대한 성능을 개선하고 입력 음성의 피치주기의 변화를 추적하기 위해 피치 예측기의 스무더를 부가하는 방법을 제시한다. 3개의 탭을 갖는 스무더는 고정된 계수를 가지거나 피치 합성기의 출력신호의 자기상관 함수에 따라 변화되는 가계변수를 가질 수 있다. 피치 예측기에 스무더의 부가는 한 블록 내에서의 피치주기의 변화를 추적할 수 있고 채널에러에 대한 영향도 줄일 수 있다.

  • PDF

고해상 피치검출을 이용한 한국어 음성신호의 음소분리 (Segmentation of the Korean speech signals into phonetic units using the super resolution pitch determination)

  • 이응구;이두수
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.270-278
    • /
    • 1993
  • 본 논문에서는 고해상 피치검출을 이용해서 정확한 피치를 찾고 각 피치 주기에서의 상관함수와 문턱값을 비교하여 한국어 음성신호를 음소단위로 분리하는 알로리듬을 제안한다. 제안된 알고리듬의 특성은 정확하고 고신뢰도를 갖으며, 변이구간이나 무음구간도 구분할 수 있다. 이 알고리듬은 음소단위로 분리하여 코드북을 설계하는 백터양자화와 음성인식 분야에 적용된다. 본 논문에서 제안한 알고리듬은 PC386/DX 상에서 386/MATLAB으로 실행한 결과 피치주기를 정확히 찾고 음소별로 분리가 가능함을 알 수 있다.

  • PDF

음성 파형코딩의 음원피치 변경에 관한 연구 - LPC와 주기반분법에 의한 피치변경법 - (On Altering the Pitch of Speech Signals in Waveform Coding -(Altering Method by the LPC and the Pitch Halving)-)

  • 민경중
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1991년도 학술발표회 논문집
    • /
    • pp.45-49
    • /
    • 1991
  • In area of the speech synthesis, the waveform coding with high quality are mainly used to the synthesis by analysis. However, it is difficult to applying the waveform coding to the synthesis by rule, because the parameters of this coding are not classified as either excitation parameters and vocal tract parameters. In this paper, we proposed a new pitch change method that can alter the pitch periods in the waveform coding. The proposed method expands the pitch period by the LPC synthesis method, and then the period is compressed by the waveform halving technique. Thus, it is possible that the waveform coding is carried out the synthesis by rule in speech processing.

  • PDF

Dyadic Wavelet Transform 방식의 Pitch 주기결정 (A Stable Pitch ]Determination via Dyadic Wavelet Transform (DyWT))

  • 김남훈;윤기범;고한석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.197-200
    • /
    • 2000
  • This paper presents a time-based Pitch Determination Algorithm (PDA) for reliable estimation of pitch Period (PP) in speech signal. In proposed method, we use the Dyadic Wavelet Transform (DyWT), which detects the presence of Glottal Closure Instants (GCI) and uses the information to determine the pitch period. And, the proposed method also uses the periodicity property of DyWT to detect unsteady GCI. To evaluate the performance of the proposed methods, that of other PDAs based on DyWT are compared with what this paper proposed. The effectiveness of the proposed method is tested with real speech signals containing a transition between voiced and the unvoiced interval where the energy of voiced signal is unsteady. The result shows that the proposed method provides a good performance in estimating the both the unsteady GCI positions as well as the steady parts.

  • PDF

A Study on Longitudinal Phugoid Mode Affected by Application of Nonlinear Control Laws

  • Kim, Chong-Sup;Hur, Gi-Bong;Kim, Seung-Jun
    • International Journal of Aeronautical and Space Sciences
    • /
    • 제8권1호
    • /
    • pp.21-31
    • /
    • 2007
  • Relaxed Static Stability (RSS) concept has been applied to improve aerodynamic performance of modern version supersonic jet fighter aircraft. The T-50 advanced supersonic trainer employs the RSS concept in order to improve the aerodynamic performance. And the flight control system stabilizes the unstable aircraft and provides adequate handling qualities. The T-50 longitudinal control laws employ a proportional-plus-integral type controller based on a dynamic inversion method. The longitudinal dynamic modes consist of short period with high frequency and phugoid mode with low frequency. The design goal of longitudinal control law is optimization of short period damping ratio and frequency using Lower Order Equivalent System (LOES) complying the requirement of MIL-F-8785C. This paper addresses phugoid mode characteristics such as damping ratio and natural frequency that is affected by the nonlinear control laws such as angle of attack limiter, auto pitch attitude command system and autopilot of pitch attitude hold.

PSOLA 전처리과정을 이용한 G.723.1 보코더의 전송률 감소에 관한 연구 (On a Study of the Reduction of Bit Rate by the Preprocessing of PSOLA Coding Technique in the G. 723.1 Vocoder)

  • 장경아;조성현;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.401-404
    • /
    • 2002
  • In general, speech coding methods are classified into the following three categories: the waveform coding, the source coding and the hybrid coding. In this paper, First, the reference waveform is detected after searching the pitch period by NAMDF similarity and similarity between the reference waveform and the waveform each pitch period. It made a decision whether the waveform is compressed with the threshold of similarity. If the waveform is compressed only magnitude and pitch information is transmitted into the input of G.723.1 vocoder. Performing through the G.723.1 vocoder, the waveform is restored with the magnitude and pitch information by PSOLA synthesis method. The result of simulation with proposed algorithm has a 31% reduction of bit rate than the standard 5.3kbps G.723.1 ACELP vocoder.

  • PDF

Peak 검출과 AMDF에 의한 고속도 음성주기 추출방법 (A High Speed Pitch Extraction Method Based on Peak Detection and AMDF)

  • 성원용;은종관
    • 대한전자공학회논문지
    • /
    • 제17권4호
    • /
    • pp.38-44
    • /
    • 1980
  • 본 논문에서는 peak 검출과 average magnitude difference function (AMDF)방법을 이용해서 음성의 주기를 고속도로 추출하는 방법이 연구되었다. 먼저 입력 음성을 800Hz로 대역폭을 줄인다음 Pitch peak가 될 만한 몇개의 Peak을 검출한다. 그 다음 이들 peak들의 값을 갖고 AMDF를 계산해서 이들 값들 중에서 최소의 AMDF치를 갖는 peak를 원하는 음성주기로 결정을 한다. 이 방법을 사용하여 음성의 주기를 검출하면 타 음성주기 추출방법 보다 훨씬 적은 계산 시간이 소요될 분만 아니라 비교적 정확한 결과를 얻을 수 있다.

  • PDF