• Title/Summary/Keyword: 피치

Search Result 1,320, Processing Time 0.038 seconds

An Efficient Pitch Estimation for IMBE (Improved Multi-band Excitation) Speech Coder (개량형 다중대역 여기 (IMBE: Improved Multi-band Excitation) 음성 부호기의 피치 예측 개선)

  • Na, Hoon;Jeong, Dae-Gwon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.3
    • /
    • pp.34-41
    • /
    • 2001
  • In an IMBE (Improved Multi-band Excitation) speech coder, initial pitch estimation occupies most of the total computing time for the coder due to complex cost function and exhaustive search over candidate pitches. Future frames in initial pitch estimation cause inevitable time delay. Therefore, it is difficult to implement a real-time coder. Furthermore, unvoiced frames use the unnecessary pitch estimation as in the voiced frames. In this paper, each frame is determined voiced or unvoiced by Dyadic Wavelet Transform (DyWT) and, then, initial pitch estimation is performed only for voiced frame. Therefore different pitch estimation algorithms are employed between voiced and unvoiced frames incurring reduced time delay at transmitter and receiver. Simulation result show that the relative complexity of initial pitch estimation is reduced by 23%, and the processing time decreases down to 1/10 ∼ 1/1l of the IMBE coder while speech quality is almost maintained.

  • PDF

A Study on Improving Pitch Search by Varying the number of Subframes for Vocoder (보코더에서 서브프레임 수의 변화를 이용한 피치검색 성능 개선에 관한 연구)

  • Baek, Geum-Ran;Bae, Myung-Jin
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.49 no.10
    • /
    • pp.83-88
    • /
    • 2012
  • The pitch searching is a very important process in a vocoder. Generally, the method of pitch searching method is used by highlighting the periodicity, where a correlation is identified with the signal by changing the interval of two pulses. When the correlation value is highest, the pitch can be found by the pulse interval because it is the repetition interval with most striking period. There are many methods to solve this problem and search the pitch by dividing a frame into many subframes, but there is too much calculation to solve. A method in this paper is suggested to vary the number of subframes by predicting the amplitude change rate in a frame. If this method is applied, the general pitch searching performance will be improved because the accuracy may be enhanced without affecting the sound quality in the synthesized signal after parameter transmission; and the pitch searching time may be reduced.

Period-to-Period Pitch Estimation Using Average Magnitude Fluctuation Rate (음성파형의 평균진폭 변동율에 의한 주기별 피치검출)

  • 강동규
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.125-128
    • /
    • 1994
  • 선형예측기법으로 피치동기식 분석을 하기 위해 우선적으로 필요한 정보로서 유성음 신호의 영교차 구간별 평균 진폭변동율 추출에 의한 주기별 피치를 검출할 수 있는 기법을 제안하였다. 유성음의 제1포먼트 성분에 대한 각 영교차 구간에서의 평균진폭값은 성대 폐쇄시점에서 주기별 최대치를 나타내며, 평균진폭변동율은 "+" 영역의 평균진폭값과 선행하는 "-" 영역 값의 차로 표시한다. 이 평균 진폭 변동율은 성대파형의영향이 반영되어 주기성이 더욱 강조되므로 분석구간에 대한 구간별 평균피치와 변화의 정도를 이용하여 주기별피치정보를 추출할 수 있다. 검출결과는 구간별 평균피치와 비교하였으며, 좋은 결과가 나타나는 것을 확인할 수 있다.과가 나타나는 것을 확인할 수 있다.

  • PDF

The Speech Enhancement of G.723.1 Vocoder by the Improvement of Pitch Accuracy Using a Flattened Energy in a Transient Period (전이구간에서의 Energy 평탄화를 통한 피치정확도 향상에 의한 G.723.1 Vocoder의 음질향상)

  • Park Won;Kim JungJin;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.59-62
    • /
    • 2000
  • 화상회의 및 인터넷폰을 목적으로 개발된 G.723.1은 CELP계열 보코더와 같이 화자의 개성정보를 위해 피치를 전송하고 있다. 하지만 안정구간과 비 안정구간의 차이를 두지 않고 처리를 하기 때문에 비 안정구간, 특히 전이구간에서 정확한 피치검출이 이루어지지 않는 이유로 음질의 열하가 발생하게 된다. 따라서 본 논문에서는 한 프레임 구간에서 에너지의 기울기로 대략적인 피치이득을 구한 다음 안정구간일 때와 프레임 내의 에너지의 기울기가 문턱 값을 넘을 때에는 기존의 방법으로 피치를 구하고 그런지 않은 경우에는 에너지를 조정하여 피치를 다시 구하는 방법을 사용하였다. 실제 음성시료에 대해 기존의 방법과 제안한 방법을 비교하기 위해 SegSNR 과 MOS를 비교하였을 때 각각 1.302(dB)와 평균 0.045 MOS가 향상되었다.

  • PDF

On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function (자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구)

  • 함명규;최성영;박종철;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

A Study on the Noise-Level Measurement using the Energy and relation of closed pitch (에너지와 인근피치간에 유사도를 이용한 잡음레벨 검출에 관한 연구)

  • Kang InGyu;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.77-80
    • /
    • 2004
  • 인간은 "습관적 피치 레벨" 즉 자연스럽게 말할 때 평균적으로 사용하는 피치를 갖는다. 하지만 음성에 잡음이 첨가 되면 이 피치가 불규칙하게 바뀌게 된다. 이점을 이용하여 음성의 잡음레벨을 측정할 수 있다. 본 논문에서는 입력음성의 에너지를 구하고 일정 에너지레벨 이상에서의 구간에 대해 NAMDF(Normalized Average Magnitude Difference Function)방법으로 피치를 구하고, 각 프레임을 피치단위로 분절한 뒤 인근 피치간의 유사도를 측정하여 입력음성데이터의 잡음레벨을 검출하는 방법을 제안하였다.

  • PDF

A Study On the Pitch Extraction by the Spectrum Flattening in an Adaptive Sub-band using LSP (LSP를 이용한 적응 밴드 스펙트럼 평탄화에 의한 피치 검색 방법에 관한 연구)

  • Seo JiHo;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.105-106
    • /
    • 2004
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 피치검출이나 포만트검출은 매우 중요하다. 주파수 영역의 스펙트럼 신호는 잡음이 부가되는 경우에도 고조파정보와 포만트 포락선 정보를 유지하기 때문에 음성신호처리분야에서 매우 유용하다고 할 수 있다. 고조파 정보나 포만트 포락선 정보는 피치검출과 포만트 주파수 검출에 직접 이용된다 하지만 두 성분을 분리하는 방법에 따라 피치검출이나 포만트 주파수 검출에 영향을 미칠 수 있으므로 기존의 방법보다 두 성분을 더 잘 분리할 수 있는 방법이 필요한 것이다. 본 논문에서는 스펙트럼 신호를 최대한 평탄화시킴으로써 포만트의 영향을 제거하고 고조파 성분을 분리해 내어 이를 피치검출에 사용한다. LSP를 이용하여 적응적 밴드에서 평탄화를 시도하고 이를 피치 검출에 이용하였다.

  • PDF

An analysis of structural characteristic's changing as stranded wire's pitch changing of wind turbine type cable's conductor by CAE techniques (CAE 기법을 활용한 풍력 케이블의 도체 연선 피치 변화에 따른 구조적 특성 변화 분석)

  • Park, Moon-Gun;Jang, Jin-Wook
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.276_277
    • /
    • 2009
  • 풍력 케이블의 nacelle부와 Tower 사이에 포설되는 케이블은 사용 환경의 특성상 장력+비틀림의 스트레스를 받는다. 이러한 사용 환경 때문에 케이블은 전기적인 특성 뿐 아니라 반복 운동을 하는 환경에 대해 구조적인 특성에 대해서도 검토가 요구되어진다. 본 논문에서는 풍력 케이블의 핵심 검토 요소로 도체의 구조적 위험 요소를 줄이기 위한 연구 대상으로 도체의 (*)피치 변화의 특성을 분석하였으며, 피치가 길어지면 도체에 발생되어지는 응력(스트레스)이 작아질 것이고 피치가 짧아지면 도체에 발생되어지는 응력(스트레스)이 커질 것이라는 일반적인 상식을 벗어나 각 피치별 응력(스트레스)의 최저점들을 찾게 되었고 그 중 유연성을 함께 고려하여 품질의 향상을 기여하는 최적 피치를 선정하였다.

  • PDF

On the Reduction of Pitch Search Time for G.723.1 Using the Skipping Technique (G.723.1에서 Skipping Technique을 이용한 피치검색시간 단축에 관한 연구)

  • 김정진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.285-288
    • /
    • 1998
  • G.723.1은 저 전송률 환경에서 고음질을 제공하여 주고 있으나 CELP형 부호화기가 갖는 합성에 의한 분석(analysis by synthesis) 방식의 구조로 인해 많은 처리 시간과 계산량을 요구하게 된다. 본 논문에서는 G.723.1에 대해 skipping 기법을 이용하여 피치 검색과정이 계산량을 줄여 부호화기의 전체 처리 시간을 감소시키는 방법을 제안하였다. 예측 피치를 찾기 위한 개회로 피치 예측(open loop pitch estimation) 과정에서 계산량을 줄이기 위해 skipping 기법을 사용하였다. 피치 예측 과정시 상관관계를 파형은 양과 음의 파형이 교대로 나타나는 특징을 가지고 있기 때문에 계산시 음의 파형을 생략하는 방법을 사용하였다. 실제 음성시료에 대해 제안한 피치 검색법을 적용하였을 때 부호화시 평균 처리시간은 약 10%정도 감소하였으며 기존 G.723.1과 제안한 방법을 적용한 G.723.1의 음질 비교를 위하여 MOS 평가를 했을 때 기존의 방법이 평균 3.76인데 비해 제안한 방법의 평균 MOS는 3.73으로 주관적인 음질 저하는 거의 나타나지 않았다.

  • PDF

Pitch Determination and Voiced/Unvoiced Decision of Noisy Speech Based on the Higher-Order Statistics (고차 통계를 이용한 잡음 환경에서의 음성신호의 피치 추출과, 유, 무성음 판별)

  • 신태영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.55-60
    • /
    • 1995
  • 고차 통계 방법을 이용하여 잡음이 섞인 음성 신호에서 피치를 구하는 방법과 이를 이용하여 유성음 및 무성음 구간을 구분하는 방법을 구현하고 그 결과를 기술하였다. 고차 통계의 일종인 3차 cumulant 함수의 경우 Gaussian 또는 대칭적인 분포를 갖는 잡음 신호를 음성신호로부터 효과적으로 분리하여 제거시키는 특징을 가지고 있으며, 이러한 특징을 이용하면 잡음 환경에서 여러 가지 음성 특징 파라메터들을 보다 신뢰도 높게 추정할 수 있다. 본 논문에서는 dam성 신호의 3차 cumulant 함수의 자기상관함수로부터 음성의 피치 주기를 추정하였으며, 피치 위치에서의 normalized peak 크기에 의해 유성음과 무성음을 구분하였다. 또한 성능 비교를 위해 음성 신호 자체의 자기 상관 함수로부터 역시 피치 주기 및 유성음/무성음 구분을 수행하였다. 백색 및 유색 Gaussian 잡음 환경에서의 음성의 피치 주기 추정 실험 결과 SNR가 낮은 경우에 3차 cumulant를 이용한 방법이 2차 통계에 비해 우수한 성능을 나타내었다. 또한 동일한 잡음 환경에서의 유성음/무성음 판별 시험에서도 3차 cumulant를 이용한 방법이 기존의 2차 통계를 이용한 방법에 비해 성능이 크게 향상된 결과를 얻었다.

  • PDF