• 제목/요약/키워드: 무성음

검색결과 122건 처리시간 0.021초

유성음/무성음 분리를 이용한 잡음처리 (Speech Enhancement Based on Voice/Unvoice Classification)

  • 유창동
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.374-379
    • /
    • 2002
  • 본 논문에서는 유성음/무성음 분리를 이용하여 잡음처리를 한다. 유성음과 무성음은 음성의 하나의 중요한 특징으로 유성음과 무성음 부분에 각각 같은 잡음처리기법을 삼는 것이 아니라 각각의 성질을 고려하여 잡음처리를 하였다. 유성음/무성음의 분리는 영 교차율과 에너지를 이용하여 구해 졌으며, 유성음/무성음 분리정보를 토대로 하여 변형된 음성/잡음우세결정방법을 제안하였다. 제안된 방법은 백색 잡음과 비행기 잡음에 오염된 음성문장에 대해 성능평가가 이루어졌다. 그리고 다양한 입력 신호대잡음비 (SNR)로 오염된 문장에 대해 세그멘탈 신호대잡음비를 구하고, 듣기 평가를 통해 기존의 방법보다 향상된 성능을 가짐을 알 수 있다.

An Acoustic Analysis on the Plosives of Korean and Japanese

  • Lee Seungmie
    • 대한음성학회지:말소리
    • /
    • 제21_24호
    • /
    • pp.111-122
    • /
    • 1992
  • 본 논문에서는 한국어에 있어서 세 가지 유형의 파열음과 일본어에 있어서 두 가지 유형의 파열음과 일본어에 있어서 두 가지 유형의 파열음이 보여주는 시간적 특성을 어두 위치 및 모음간 위치로 나누어 비교해 보았다- 한국어에 있어서 세 가지 유형의 파열음은 어두 위치에서 모두 무성음으로 실현되므로 성의 대립으로는 이들을 유형화 할 수 없고, 그보다는 조음의 힘과 기식의 유무에 따라 연음, 무기 경음, 유기 경음으로 분류하는 것이 타당하다. 이에 비해 일본어 파열음은 유성음인 연음과 무성음인 경음의 두가지 유형으로 대립된다. 유성음과 무성음, 그리고 유기음과 무기음의 구분에는 파열음의 개방에서부터 성대 진동까지의 시간인 성 시작 시간(VOT)과 기식의 길이가 변수가 된다. 경음과 연음의 구분에는 선행 모음의 길이, 폐쇄 지속 시간, Vl/(Vl+CL)의 비율이 유용한 정보가 된다. 양국어 어두 파열음의 VOT를 비교해 볼 때, 일본어 유성음은 음수의 VOT를 가지며, 한국어 무기 경음에서는 VOT가 10msec정도로 짧게 나타나고, 그 다음으로 한국어 연음. 일본어 무성음, 한국어 유기 경음의 순서로 길어진다. $\frac{선행 모음의 길이}{(선행 모음의 길이+폐쇄 지속 시간)}$의 비율은 언어의 특성도 반영해 주는데, 한국어의 경우 연음: 무기 경음: 유기 경음의 비는 0.63: 0.30:0.35, 일본어의 경우 유성음:무성음의 비는 0.69: 0.45로 나타났다. 청취 실험을 통해 한국인의 자음 인식 경향을 살펴본 결과, 성대 진동의 유무를 변별적으로 사용하지 않는 한국인 화자는 일본어 유성음은 연음으로, 무성음은 경음으로 인식하는 경향이 있는 것으로 나타났다.

  • PDF

웨이브렛 변환을 이용한 음성신호의 유성음/무성음/묵음 분류 (Voiced/Unvoiced/Silence Classification of Speech Signal Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.449-453
    • /
    • 1998
  • 일반적으로 음성신호는 파형의 특성에 따라 파형이 준주기적인 유성음과 주기성 없이 잡음과 유사한 무성음 그리고 배경 잡음에 해당하는 묵음의 세 종류로 분류된다. 기존의 유성음/무성음/묵음 분류 방법에서는 피치정보, 에너지 및 영교차율 등이 분류를 위한 파라미터로 널리 사용되었다. 본 논문에서는 음성신호를 웨이브렛 변환한 신호에서 스펙트럼상에서이 변화를 파라미터로 하는 유성음/무성음/묵음 분류 알고리즘을 제안하고 제안된 알고리즘으로 검출한 결과와 이에 따른 문제점을 검토하였다.

  • PDF

고차 통계를 이용한 잡음 환경에서의 음성신호의 피치 추출과, 유, 무성음 판별 (Pitch Determination and Voiced/Unvoiced Decision of Noisy Speech Based on the Higher-Order Statistics)

  • 신태영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.55-60
    • /
    • 1995
  • 고차 통계 방법을 이용하여 잡음이 섞인 음성 신호에서 피치를 구하는 방법과 이를 이용하여 유성음 및 무성음 구간을 구분하는 방법을 구현하고 그 결과를 기술하였다. 고차 통계의 일종인 3차 cumulant 함수의 경우 Gaussian 또는 대칭적인 분포를 갖는 잡음 신호를 음성신호로부터 효과적으로 분리하여 제거시키는 특징을 가지고 있으며, 이러한 특징을 이용하면 잡음 환경에서 여러 가지 음성 특징 파라메터들을 보다 신뢰도 높게 추정할 수 있다. 본 논문에서는 dam성 신호의 3차 cumulant 함수의 자기상관함수로부터 음성의 피치 주기를 추정하였으며, 피치 위치에서의 normalized peak 크기에 의해 유성음과 무성음을 구분하였다. 또한 성능 비교를 위해 음성 신호 자체의 자기 상관 함수로부터 역시 피치 주기 및 유성음/무성음 구분을 수행하였다. 백색 및 유색 Gaussian 잡음 환경에서의 음성의 피치 주기 추정 실험 결과 SNR가 낮은 경우에 3차 cumulant를 이용한 방법이 2차 통계에 비해 우수한 성능을 나타내었다. 또한 동일한 잡음 환경에서의 유성음/무성음 판별 시험에서도 3차 cumulant를 이용한 방법이 기존의 2차 통계를 이용한 방법에 비해 성능이 크게 향상된 결과를 얻었다.

  • PDF

하모닉 코딩과 CELP방법을 이용한 저 전송률 음성 부호화 방법 (Low Rate Speech Coding Using the Harmonic Coding Combined with CELP Coding)

  • 김종학;이인성
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.26-34
    • /
    • 2000
  • 본 논문에서는 선형예측 잔여신호에 대한 하모닉 벡터 여기 코딩에, 시간 대역 분리 혼합 코딩을 결합한 4kbps 음성코더를 제안한다. 하모닉 벡터 여기 코딩은 유성음 구간에서 하모닉 여기 코딩을 사용하며, 무성음 구간에 대해서는 분석-합성 구조의 벡터 여기 코딩을 사용한다. 그러나, 이러한 양단 모드 코딩 방법은 유성음과 무성음이 혼재하는 전이 구간에서는 비효과적이므로, 유/무성음 모드 코딩 이외의 새로운 방법이 요구된다. 이에, 전이 구간을 위한 시간 분리 전이 코딩을 설계하였으며, 여기서, 유/무성음 결정 알고리즘은 단위 구간 내의 유성음과 무성음의 존속기간을 결정하고, 이전 구간의 유/무성음 결정에 따라 하모닉-하모닉 코딩과 벡터-하모닉 코딩을 선택적으로 사용한다. 복호화기에서는 하모닉 크기값들의 IFFT 과정을 통해 유성음 여기신호가 효과적으로 합성되며, 무성음 여기신호는 역 벡터 양자화를 통해 만들어진다. 재 복원된 음성 신호는 중첩합산 방법에 의해 합성된다.

  • PDF

ML 기반의 음성의 유/무성음 성분 분리 (A VOICEDIUNVOICED DECOMPOSITION OF SPEECH BASED ON MAXIMUM LIKELIHOOD METHOD)

  • 강명구
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.475-478
    • /
    • 1998
  • 음성에 공존하는 유/무성음 성분을 추정하는 알고리즘을 제안하였다. 유성음 성분은 주기성을 띤 사인곡선의 형태로 표현되며, 무성음 성분은 자동회기의 결과로 표현된다. 두 성분을 각각 차례대로 추정할 경우 한 성분에 대한 추정치의 정확도가 나머지 성분의 추정에도 영향을 주기 때문에 제안된 알고리즘은 두 성분을 공동으로 추정한다. 실제 ML 추정치는 구하기 어려워 이에 근접하는 추정치를 선형 방정식들을 interative 방법으로 풀어 구현하였다. 예비 시험결과 제안한 알고리즘이 정확하고 효율적으로 두 성분을 추정함을 알 수 있었고, 합성된 데이터 뿐만 아니라 실제 음성 데이터를 이용한 실험에서도 좋은 결과를 보여주었다.

  • PDF

한국어 음성인식 시스템에서 음소 경계 검출을 위한 Branch 알고리즘 (Branch Algorithm for Phoneme Segmentation in Korean Speech Recognition System)

  • 서영완;한승진;장흥종;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.357-359
    • /
    • 2000
  • 음소 단위로 구축된 음성 데이터는 음성인식, 합성 및 분석 등의 분야에서 매우 중요하다. 일반적으로 음소는 유성음과 무성음으로 구분되어 진다. 이러한 유성음과 무성음은 많은 특징적 차이가 있지만, 기존의 음소 경계추출 알고리즘은 이를 고려하지 않고 시간 축을 기준으로 이전 프레임과 매개변수 (스펙트럼) 비교만을 통하여 음소의 경계를 결정한다. 본 논문에서는 음소 경계 추출을 위하여 유성음과 무성음의 특징적 차이를 고려한 블록기반의 Branch 알고리즘을 설계하였다. Branch 알고리즘을 사용하기 위한 스펙트럼 비교 방법은 MFCC(Mel-Frequency Cepstrum Coefficient)를 기반으로 한 거리 측정법을 사용하였고, 유성음과 무성음의 구분은 포만트 주파수를 이용하였다. 실험 결과 3~4음절 고립단어를 대상으로 약 78%의 정확도를 얻을수 있었다.

  • PDF

혼합 다중대역 여기모델에 기반한 저 전송률 음성 부호화기의 설계 (Design of a Low Bit-rate Speech Coder Based on Mixed Multi-band Excitation Model)

  • 한우진;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.510-521
    • /
    • 2002
  • 다중대역 여기부호화 (MBE: multi-band excitation) 음성 부호화기는 고조파 대역별로 유/무성음 판단을 수행함으로써 한 프레임 내에서 유성음과 무성음이 혼합되는 경우를 잘 모델링할 수 있다. 하지만 같은 주파수 대역에서는 유성음 성분과 무성음 성분이 공존할 수 없다. 또한 유/무성음 판단 과정에서 경험에 의한 임계치와의 비교 과정이 필요하므로 원음 스펙트럼과 합성음 스펙트럼간의 오류가 큰 경우가 발생하는 단점이 있다. 본 논문에서는 모든 주파수 영역에서 유성음 성분과 무성음 성분이 혼합되는 것을 허용하는 혼합다중대역 여기 부호화 (MMBE: mixed multi-band excitation) 음성 모델을 제안하고, 모델 파라미터인 주파수 영역 혼합함수를 임계치와의 비교없이 효과적으로 추정할 수 있는 방법을 제시한다. 제안한 음성 모델을 적용한 2.6 kbps 음성 부호화기를 구현해 본 결과, 2.9 kbps의 전송률을 갖는 MBE음성 부호화기에 비해서 낮은 전송률에서도 더 우수한 합성음 음질을 가지는 것으로 나타났다.

한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ) (On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech)

  • 하판봉;이철희;방승찬;안수길
    • 한국음향학회지
    • /
    • 제5권3호
    • /
    • pp.28-35
    • /
    • 1986
  • 우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.

  • PDF

분산을 이용한 피치검출 (Pitch Detection Using Variance)

  • 김득수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.69-72
    • /
    • 2004
  • 음성신호는 주기성으로 유성음과 무성음으로 구분할 수 있으며 유성음은 준주기성 신호이지만 무성음은 주기성이 없다. 주기성은 음성신호를 분석하는 중요한 파라미터 중 하나이다. 본 논문에서는 시간영역에서 피치의 시작점과 주파수 영역에서 분산을 이용하여 피치 검출 알고리즘을 제안하며 864개 단독 숫자음을 이용하여 실험한 결과 $99.5\%$의 정확도를 확인하였으며 제안된 알고리즘의 유효성을 확인하였다.

  • PDF