• Title/Summary/Keyword: 음성신호

검색결과 1,512건 처리시간 0.027초

웨이블릿 페킷을 이용한 잡음에 손상된 음성신호 인식에 관한 연구 (Recognition of Corrupted Speech by Noise using Wavelet Packets)

  • 고광현;장성욱;양성일;권영헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.89-92
    • /
    • 1999
  • 인식기 훈련과정에서 발생하지 않았던 잡음이 인식과정에서 신호를 손상할 경우 인식률의 저하가 발생한다. 본 논문에서는 음성의 질을 떨어뜨리는 이러한 잡음을 Wavelet Packets을 이용하여 전처리함으로서 인식률을 향상시키는 방법을 제안한다. 인식기로는 Hidden Markov Model을 사용하였고, 시스템에 사용된 특징 파라미터로는 15차 Cepstrum을 사용하였다. 11 kHz로 샘플링된 숫자음에 Additive White Gaussian Noise를 첨가한 손상된 음성신호를 인식실험에 사용하였다. 화자독립으로 진행된 실험에서 잡음에 의해 손상된 SNR 20dB의 음성신호에 대하여 Wavelet Packets로 잡음을 제거한 후 복원된 음성신호 의 인식률은 약 $10\%$ 향상됨을 확인하였다.

  • PDF

무선전화 시스템용 잡음억제회로의 설계 (A Design of Noise Reduction Circuit for A radio Telephonic System)

  • 문종규;김덕규
    • 대한전자공학회논문지TE
    • /
    • 제39권2호
    • /
    • pp.84-89
    • /
    • 2002
  • 본 논문에서는 무선전화 시스템의 잡음제거 방법을 제안한다. 구현회로는 압축기(Compressor), 신장기(Expender) 및 필터로 구성된다. 제안방법의 기본개념은 채널잡음을 방지하기 위해 전송전에 음성신호를 압축(Compress)하여 전송하고 원래의 신호를 복원하기 위해 전송신호의 역 비율로 신장(Expand)한다. 압축과 신장과정을 통해서 음성신호의 감쇠나 왜곡은 일어나지 않는다. 압축과정에서 압축기의 이득은 입력신호의 유효 다이나믹 영역과 신호대 잡음 비를 향상시키기 위해 음성신호의 포락선 레벨에 따라 자동적으로 제어된다. 압축비율은 음성신호의 제곱근(Root) 배로 압축한다. 압축된 신호는 신장기에서 음성신호의 제곱이 되게 신장하여 원래의 신호를 복원한다. 시뮬레이션을 통해 제안한 방법의 성능과 안정성을 검증하였다.

음성의 유성음 특성을 이용한 음성/비음성 판별 방법 (A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech)

  • 이성주;정호영;이윤근;김형순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.411-412
    • /
    • 2007
  • 자동음성인식 시스템을 이용하는 사용자 입장에서 보면 음성인식시스템을 사용하기 위하여 음성을 입력할 때마다 버튼을 눌러야 하는 Push-To-Talk (PTT) 방식은 여간 번거로운 일이 아닐 수 없다. 그리고 사용자가 원거리에서 음성을 입력하는 경우처럼 PTT 방식 자체가 용이하지 못 한 음성인식 응용분야에서는 Non-Push-To-Talk (NON-PTT) 방식의 필요성이 대두되게 된다. NON-PTT 방식의 음성 전처리를 위해서는 입력신호로부터 음성신호만을 구분해내는 음성판별기술이 필수적이다. 하지만 일상적인 잡음환경에서 음성신호만을 구분해내는 일은 매우 어려운 일이 아닐 수 없다. 본 논문에서는 일상적인 가정잡음환경에 강인한 음성판별방식을 제안한다. 여기서는 음성판별을 위해서 음성의 유성음 특성을 이용하였다. 즉, 일정구간 이상의 음성신호에는 일정구간이상의 유성음 구간이 존재하며 만약 잡음환경에서도 유성음 구간을 잘 검출할 수 있다면 이러한 음성의 특성을 이용하여 검출된 신호가 음성인지 아닌지를 판별할 수 있다. 이를 위하여 여기서는 가정잡음환경에서도 유성음을 잘 검출할 수 있도록 11 가지 유성음 특징들과 이를 이용한 음성판별방법을 제안하였다. 제안된 방법의 성능 평가를 위하여 음성의 끝점검출방법과 통합하여 음성/비음성 판별 테스트를 수행하였으며 테스트 수행결과 열악한 잡음환경에서 80%이상의 비음성을 거절하는 성능을 보였다.

  • PDF

웨이브렛 변환을 이용한 음성신호의 유성음/무성음/묵음 분류 (Voiced/Unvoiced/Silence Classification of Speech Signal Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.449-453
    • /
    • 1998
  • 일반적으로 음성신호는 파형의 특성에 따라 파형이 준주기적인 유성음과 주기성 없이 잡음과 유사한 무성음 그리고 배경 잡음에 해당하는 묵음의 세 종류로 분류된다. 기존의 유성음/무성음/묵음 분류 방법에서는 피치정보, 에너지 및 영교차율 등이 분류를 위한 파라미터로 널리 사용되었다. 본 논문에서는 음성신호를 웨이브렛 변환한 신호에서 스펙트럼상에서이 변화를 파라미터로 하는 유성음/무성음/묵음 분류 알고리즘을 제안하고 제안된 알고리즘으로 검출한 결과와 이에 따른 문제점을 검토하였다.

  • PDF

정현파 모델을 이용한 2.4kbps 음성부호화 알고리즘 (2.4kbps Speech Coding Algorithm Using the Sinusoidal Model)

  • 백성기;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.123-126
    • /
    • 2000
  • STC(Sinusoidal Transform Coding) 방식은 음성신호의 주파수 영역에서 스펙트럼 피크치들을 정현파로 모델링하여 합성하는 방식을 말한다. 저전송률 STC 방식에서는 전송되는 정보량을 줄이기 위해 스펙트럼 피크를 대신해 음성신호의 스펙트럼 포락선 정보와, 피치정보를 이용하여 얻어지는 고조파 성분들을 정현파로 모델링하여 음성을 합성한다. 본 논문에서는 음성신호의 정현파 모델에 기반하여 2.4kbps 전송속도를 갖는 음성부호화 알고리즘을 제안하였으며, 실험결과로 합성음의 파형과 스펙트럼 특성, 위상특성, 그리고 MOS(Mean Opinion Score) 테스트를 이용한 합성음의 음질을 비교/분석 하였다.

  • PDF

2-채널 (음성 및 EGG) 신호 분석에 의한 피치검출 (Pitch Detection by the Analysis of Speech and EGG Signals)

  • 신무용;김정철;배건성
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.5-12
    • /
    • 1996
  • 본 연구에서는 음성 및 EGG 신호를 2-채널 피치검출 알고리즘을 제안하였다. 성대의 떨림에 관한 정확한 정보를 얻을 수 있는 EGG 신호를 이용함으로써 음성신호로부터 피치를 검출하고자 할 때 수반되는 문제점들을 최소화 할 수 있으며, EGG 신호의 왜곡 및 불규칙한 변화는 음성신호의 분석을 통해 보완해 줌으로써 시간영역에서 음성신호에 동기된 정확한 피치 marker를 검출하였다. 2-채널 피치검출 알고리즘은 음성신호만을 이용한 일반적인 피치검출 알고리즘에 비해 보다 정확하고 개선된 피치궤적을 얻을 수 있음을 실험을 통해 보였으며, 따라서 새로이 개발되는 피치검출 알고리즘의 객관적인 비교 및 평가에 이용될 수 있다.

  • PDF

음성암호시스템 설계에 관한 연구 (A Study on the design of voice cryptograph system)

  • 최태섭;안인수
    • 대한전자공학회논문지TE
    • /
    • 제39권2호
    • /
    • pp.51-59
    • /
    • 2002
  • 본 논문에서는 음성 통화에서의 안전한 전송과 수신을 위하여 SEED 알고리즘을 이용한 음성 암호 시스템 설계를 하였다. 음성영역의 신호는 CODEC에 의해 디지털 신호로 변환된다. 그리고 개선된 SEED 알고리즘을 적용한 DSP는 이 신호를 암호화한다. CODEC은 암호화된 신호를 아날로그 음성신호로 변환한다. 이 음성 신호는 중간에 도청이나 감청을 한다고 하더라도 암호화되어있기 때문에 안전하게 전송할 수 있다. 수신자는 수신된 음성신호를 복호화 SEED 알고리즘을 이용하여 송신자의 원음성을 들을 수 있다. 본 논문에서는 16라운드인 SEED 알고리즘의 라운드 수를 32라운드로 설계하여 truncated differential 확률을 $2^{-143.1}$에서 $2^{-286.6}$이상으로 개선하였다.

AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계 (Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder)

  • 김은주;이호창;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.755-758
    • /
    • 2000
  • 본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링 된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과ATC방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

AMR 부호화기와 결합된 다전송률 광대역 음성부호화기 설계 (Design of Multi Rate Wideband Speech Coder Using the AMR(Adaptive Multi-Rate) Coder)

  • 김은주;이인성
    • 한국통신학회논문지
    • /
    • 제26권5B호
    • /
    • pp.632-638
    • /
    • 2001
  • 본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz∼7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과 ATC 방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.

  • PDF

자동응답시스템에서 DTMF신호음 검출 개선에 관한 연구 (Improvement of DTMF Tone Detection in ARS System)

  • 김희동;김제우;홍영진
    • 한국음향학회지
    • /
    • 제15권6호
    • /
    • pp.110-116
    • /
    • 1996
  • 본 논문에서는 자동음성응답장치(ARS)에서의 복합주파수(DTMF)톤 수신의 정확도를 높이기 위한 방법을 제안한다. ARS시스템의 음성안내를 송출하는 동안 이용자가 DTMF신호를 발생할 경우, ARS시스템의 망접속부에 위치한 하이브리드에 의해 수신측으로 궤환된 음성신호가 이용자가 송신한 DTMF신호와 중첩이 되어, ARS시스템에서 DTMF신호음을 제대로 검출하지 못하는 경우가 발생한다. 제안하는 방법은 ARS의 음성안내신호에서 DTMF 신호의 주파수 대역 부분을 노치필터(notch filter)로 제거함으로써 여파된 음성안내신호가 하이브리드를 통해 수신측으로 궤환되어도 DTMF신호에 해당하는 주파수 성분이 없게 된다. DTMF수신기의 전단에는 노치필터에서 사용된 필터의 역필터특성을 갖는 대역통과필터를 설치하면, 하이브리드를 통해 수신측으로 궤환되는 신호는 DTMF수신기에 입력되지 않게 되며, 이용자가 송신하는 DTMF신호를 효과적으로 검출할 수 있다. 또한, 노치필터링된 음성신호의 음질저하는 무시할만하여 음성 안내어를 사용하는데 문제가 없다.

  • PDF