• 제목/요약/키워드: 피치주기

검색결과 81건 처리시간 0.024초

시간-주파수영역에서의 새로운 피치검출 방법 (A New Pitch Detection Method in time-Frequency Domain)

  • 김종국;최호진;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.805-808
    • /
    • 2001
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하나 만일 음성신호의 기존주파수를 정확히 검출할 수 있다면 음성인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석시 피치에 동기 시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 따라서 제안한 논문에서는 시간영역처리에서 시간영역파형에서 먼저 성도성분이 제거된 성문특성 즉 피치주기 성분을 강조하기 위해 음성신호의 기울기를 이용한 Positive 센터 클리핑를 수행하고 주파수 영역에서는 원신호의 스펙트럼과 센터클립된 신호의 스펙트럼과의 Peak-Fiting을 수행하고 선형 인터폴래이션(스무딩)을 통해 평탄화된 스펙트럼을 얻었다. 결과적으로 유성음 구간과 음성이 변하는 전이구간에서 G-peak가 강조된 더욱 정확한 Pitch를 검출할 수 있었다.

  • PDF

균일양자화기의 잔여신호를 이용한 음성신호의 피치검출 (On a Pitch Extraction of Speech Signal using Residual Signal of the Uniform Quantizer)

  • 배명진;한기천;차진종
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.36-40
    • /
    • 1997
  • 음성신호처리 분야에서 정확한 피치검출은 중요하고 필요하다. 지금까지 제안된 피치검출 알고리즘들은 음성신호의 다양성으로 인해 피치를 정확히 검출하기가 어렵다. 본 논문에서는 PCM과 같은 균일 양자화기의 잔여신호에 대해 음성신호의 기본주기를 검출하는 새로운 피치검출법을 제안하였다. 제안한 방법은 무잡음 음성에 대해 평균 0.25%의 조오율이 그리고 0dB의 SNR에 대해서는 평균 3.39%의 조오율이 나타나는 정확성을 보였다. 또한 음소의 천이영역이나 배경잡음 하에서도 피치검출의 정확도가 개선된 피치검출의 결과를 얻었다.

  • PDF

연속음성신호의 SNR 추정기법에 관한 연구 (A Study on SNR Estimation of Continuous Speech Signal)

  • 송영환;박형우;배명진
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.383-391
    • /
    • 2009
  • 음성 신호처리 환경에서 잡음이 섞인 신호를 개선할 목적으로 음성향상 기법이 많이 이용되고 있다. 잡음추정 알고리즘은 변화하는 환경에 빠르게 적응할 수 있어야 하며 음성신호의 영향을 줄이기 위해 음성신호가 존재하지 않는 구간에서만 잡음의 파워를 갱신한다. 이러한 방법은 음성구간검출이 선행되어야 한다. 그러나 잡음에 열화된 음성신호에 묵음구간이 존재하지 않을 경우, 위와 같이 음성검출을 통한 묵음구간에서의 잡음 추정 방법 및 SNR 추정 방법이 적용될 수 없다. 본 논문에서는 묵음구간이 존재하지 않는 연속음성신호에서 SNR을 추정하는 기법을 제안한다. 유성음의 안정구간에서는 단구간 내 피치의 변화가 매우 작아 피치주기에 따른 음성신호의 파형이 유사하게 나타난다. 따라서 잡음이 음성에 부가되었을 때 피치주기에 따른 인접파형의 유사도를 통해 SNR을 추정한다. 무성음에서는 잡음의 영향이 수신신호의 성도성분 추정에 영향을 미치기 때문에 잡음환경에서 추정된 성도성분과 수신신호 스펙트럼 간의 거리를 이용하여 SNR을 추정한다. 마지막으로, 음성신호의 에너지가 유성음에 대부분 분포하기 때문에, 부가성 잡음 환경에서 유성음의 에너지를 음성신호의 에너지로 근사화하여 SNR을 추정할 수 있다.

위상 동기화에 의한 잡음 음성의 피치 검출 (Pitch Detection by Synchronizing the Phase of Noise-Corrupted Speech Signals)

  • 이병국;배명진;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • 제11권1E호
    • /
    • pp.42-49
    • /
    • 1992
  • 시간 영역에서 음성의 피치 정보를 추출하는 새로운 알고리즘을 제안한다. 이 알고리즘은, 위상 이 일치하는 고조파 성분의 합은 위상이 일치하지 않는 고조파 성분의 합의 경우보다 주기 정보를 분명 히 나타낸다는 사실을 이용한 것이다. 즉, 음성 신호의 위상 성분을 0으로 되도록 하여 실질적으로 기본 파와 모든 고조파 성분의 위상을 일치시킨다. 이 알고리즘은 잡음이 없는 음성의 경우 0.18%의 조오류 를 보이며, 0dB 눅의 경우에도 3.63%의 조오류를 보임으로써 잡음에 강건한 성질이 있음을 알 수 있다. 또한 시간 영역에서의 결정 논리를 사용하므로 피치 해상도가 우수하다. 전반적인 실험결과는 제안된 알고리즘이 피치 검출에 상당히 효율적임을 나타낸다.

  • PDF

정현파 모델 부호화기를 위한 MP(Matching Pursuit) 알고리즘과 파라미터 양자화기 (Matching Pursuit Estimation and Quantizer Design for Sinusoidal Model-based Coder)

  • 안영욱;정규혁;김종학;양용호;이인성
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.402-409
    • /
    • 2005
  • 본 논문에서는 고대역 (4kHz-8kHz)의 주기적 성분이 강하게 나타나는 신호에 대해서 MP (Matching Pursuit) 알고리즘을 이용한 부호화 방법을 제안한다. 또한 분석된 스펙트럼 크기 파라미터와 위상 파라미터의 효율적인 양자화 방법을 제안한다. MP 알고리즘은 오류 상쇄 원리와 정현파 모델에 바탕을 두고 있기 때문에 정확한 피치 주기 예측이 필요하다. 고대역의 정확한 피치 주기 예측을 위해 저대역 (0kHz-4kHz) 신호에서 검출한 피치 주기를 이용함으로써 부호화와 비트할당의 효율을 높일 수 있다. 스펙트럼 크기 계수의 양자화를 위해 계수들에 대해 고정 차원 이산코사인 변환 (MDCT : Modified Discrete Cosine Transform) 및 다단계 (multi-stage) 구조를 결합시킨 양자화 기법을 사용하였고, 위상 값들은 스펙트럼 크기에 따른 가중치 필터와 위상의 $2{\pi}$ 순환 특성을 이용하여 양자화하였다. 또한 제안한 양자화 기법과 부호화 방법을 음성 분석-합성 (analysis-by-synthesis) 시스템에 적용하여, 목적 신호와의 비교를 통해 검증한다. 향후 대역 분할을 기본 구조로 하는 계층 구조의 광대역 음성부호화기에의 적용 가능성을 제시한다.

2피치 유로 캐스케이드 실험을 위한 벽면 최적화에 관한 연구 (Optimization of sidewalls for a Double-Passage Cascade Experiment)

  • 조종현;안국영;조수용
    • 한국항공우주학회지
    • /
    • 제36권10호
    • /
    • pp.969-978
    • /
    • 2008
  • 선형 캐스케이드 실험장치에서 블레이드간에 주기조건을 만족하면서 적은 개수의 블레이드를 적용하는 것은 실험의 정확도 향상뿐만 아니라 실험수행에 여러 장점을 제공한다. 따라서 본 연구에서는 유로를 캐스케이드 피치의 두 배 넓이로 설정하고 두 개의 블레이드만을 설치하였을 때 주기조건이 얻어지도록 하는 벽면의 형상설계에 관한 연구를 수행하였다. 이를 위하여 주기조건에서 얻어진 블레이드 표면에서의 마하수와 동일한 결과가 얻어지도록 목적함수를 설정하였으며, 설계변수로는 벽면의 형상과 관련이 있는 12개의 변수를 선정하였다. 벽면의 설계를 위하여 기울기 기반의 최적화법을 사용하였으며, 목적함수에 민감한 변화를 나타내는 영역의 조정과 가중치를 사용하였다. 이러한 방식으로 얻어진 결과에서 주기조건과 동일한 유동특성이 얻어질 수 있음을 확인하였다.

160% 피치의 유로에서 단일익형에 의한 캐스케이드 실험을 위한 벽면의 설계에 관한 연구 (A Study of Design of Sidewalls for Cascade Model with Single Blade Within a 160% Pitch Passage)

  • 조종현;김영철;안국영;조수용
    • 한국항공우주학회지
    • /
    • 제37권6호
    • /
    • pp.527-536
    • /
    • 2009
  • 캐스케이드 실험장치에 한 개의 익형을 설치하여 캐스케이드 실험이 가능한 장치벽면의 설계를 수행하였다. 장치의 폭은 피치의 160% 넓이이다. 이 경우에 실험장치 내에 다수개의 블레이드를 설치하는 경우에 비하여 소형의 장치라도 실험의 정확성이 향상되는 장점이 있지만, 피치방향으로 주기조건을 맞추기가 어렵다. 본 연구에서는 주기조건이 얻어지도록 벽면의 형상설계를 내부유동장의 결과를 바탕으로 기울기기반과 유전자알고리즘의 방식을 사용하여 벽면을 설계하였다. 이를 위하여 목적함수는 캐스케이드 익형의 표면에서 얻어진 마하수를 적용하였으며, 실험장치의 형상 조정이 가능한 14개의 설계변수를 적용하였다. 유전자알고리즘에 의한 최적화 설계방식이 향상된 결과를 보여주었다.

유성음 구간 검출을 위한 간단한 알고리즘에 관한 연구 (A Study on the Simple Algorithm for Discrimination of Voiced Sounds)

  • 장규철;우수영;박용규;유창동
    • 한국음향학회지
    • /
    • 제21권8호
    • /
    • pp.727-734
    • /
    • 2002
  • 본 논문에서는 유ㆍ무성음 구간을 검출하기 위한 간단한 알고리즘을 제안한다. 제안된 방법은 음성의 유ㆍ무성음의 주기성에 대한 특성을 보완할 수 있는 저대역 에너지와 영교차율, 그리고 주기성의 안정성을 판단하기 위한 피치 변화량을 파라미터로 사용하였다. 유ㆍ무성음의 구간검출을 음소단위의 검출이라는 측면에서 접근하여 음소군의 검출율과 음소군내의 음소의 검출율을 얻었다. TIMIT코퍼스 (corpus)를 데이터베이스로 사용하여 실험했을 때 유성음 음소 검출율이 약 13% 향상되었다.

지속적으로 발성한 모음에 의한 화자인식 (Automatic Speaker Identification by Sustained Vowel Phonation)

  • 배건성
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.35-41
    • /
    • 1992
  • 지속적으로 발성한 모음에 대해 각 화자의 특징을 나타내는 벡터양자화 코드북을 만들고 이를 이용해 화자를 인식하는 방법을 제안하고 실험하였다. 특히 벡터로는 모음 /이/로 부터 각각의 피치 주기에 대해 얻어진 선형예측계수를 사용하였으며, 코드북의 크기는 4가 적절함을 실험적으로 보였다. 인식실험에서, 학습에 사용된 데이타를 이용했을 경우에는 99.4%의 인식율을 보였으며, 학습에 사용되지 않은 50개의 피치 주기를 포함하는 음성신호로 부터는 89.4%의 인식율을 보였다.

  • PDF

G.729 음성 보코더를 이용한 가변 전송율 보코더 구현 (Implementation of the Variable Bit Rate Vocoder Using G.729 Vocoder)

  • 함명규;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.73-76
    • /
    • 2002
  • 본 논문에서는 8kbps의 전송율을 가진 ITU G.729 보코더와 PSOLA(Pitch Synchronized Overlap -Add) 알고리즘을 적용하여 전송율을 6kbps와 4kbp까지 낮출 수 있는 가변 전송율 보코더를 구현하였다. 제안한 방법은 4kbps일 경우에 G.729의 부호화전에 PSOLA를 적용하여 피치의 주기를 반으로 줄여 부호화한다. 이렇게 부호화된 데이터는 G.729의 복호화를 거치고 다시 PSOLA를 통해 음성의 피치 주기를 2배로 늘려주어 원음성을 합성하게된다. 기존의 Bkbp의 전송율을 갖는 G.729는 음성의 크기가 반으로 줄어 부호화되므로 전송율이 4kpb로 줄어들게 된다. 실험의 평가는 MOS 테스트를 통해 수행되었으며 4kbp에서 MOS값이 3.37정도로 측정되었다. 또한 처리해야할 음성의 길이가 줄어들게 되므로 계산시간도 줄어들게 된다.

  • PDF