• 제목/요약/키워드: 음성 신호 처리

검색결과 473건 처리시간 0.025초

스펙트럼 보상에 의한 피치 검출에 관한 연구 (On a pitch detection with spectrum compensation technique of speech signal)

  • 안중현;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.401-402
    • /
    • 2006
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하다. 그러나 포만트의 영향과 천이진폭의 영향 때문에 음성신호에서 피치를 정확히 구하는 것은 매우 어렵다. 더구나 노이즈가 포함된 신호에서는 더 더욱 어려워진다. 따라서 본 논문에서는 켑스트럼영역에서 포만트의 영향 을 제거하고 밴드 필터링 한 후 기본 피치 정보를 강조 보상하여 피치주기를 검출하는 방법을 새로이 제안한다.

  • PDF

독립성분분석법을 이용한 음성인식기의 성능향상 (Performance Improvement of Speech Recognition Based on Independent Component Analysis)

  • 김창근;한학용;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.285-288
    • /
    • 2001
  • 본 논문에서는 신호간의 의존성과 관련성이 최소가 되도록 분리하는 독립성분분석 법을 이용하여 입력음성에서 변동량이 많은 방향으로 주축을 찾아 그 정보를 이용하여 데이터의 중복성을 제거한 후 음성특징벡터를 추출하는 방법을 제안한다. 학습 하고자하는 음성인식기의 음성에서 독립성분분석법을 이용하여 특징벡터를 추출하고 HMM 을 사용하여 기존의 음성특징벡터로 사용되는 mel-cepstrum과 비교하여 학습, 인식실험을 수행하였으며 제안한 방법에서 음성인식성능의 향상을 확인할 수 있었다. 또한, 인식시 주변여건에 따라 잡음에 의한 인식성능 저하에도 유연히 대처할 수 있음을 앞 수 있었다.

  • PDF

LMS를 이용한 TSIUVC의 음성신호처리에 관한 연구 (A Study on Speech Signal Processing of TSIUVC using Least Mean Square)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1175-1179
    • /
    • 2006
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 프레임 안에 모음과 무성자음이 있는 경우에 음성 파형에 일그러짐이 나타난다. 본 논문에서는 LMS를 적용한 새로운 TSIUVC 근사합성법을 제시하였다. 실험결과, LMS를 적용하여 양호한 TSRIVC 근사합성 파형을 얻을 수 있었으며, 오차신호가 일그러짐이 적은 근사합성 파형에 중요한 역할을 한다는 것을 알 수 있었다. 이 방법은 음성합성, 음성분석, 새로운 Voiced/Silence/TSIUVC의 음성부호화 방식에 활용할 수 있을 것으로 기대된다.

  • PDF

LSP를 이용한 적응 밴드 스펙트럼 평탄화에 의한 피치 검색 방법에 관한 연구 (A Study On the Pitch Extraction by the Spectrum Flattening in an Adaptive Sub-band using LSP)

  • 서지호;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.105-106
    • /
    • 2004
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 피치검출이나 포만트검출은 매우 중요하다. 주파수 영역의 스펙트럼 신호는 잡음이 부가되는 경우에도 고조파정보와 포만트 포락선 정보를 유지하기 때문에 음성신호처리분야에서 매우 유용하다고 할 수 있다. 고조파 정보나 포만트 포락선 정보는 피치검출과 포만트 주파수 검출에 직접 이용된다 하지만 두 성분을 분리하는 방법에 따라 피치검출이나 포만트 주파수 검출에 영향을 미칠 수 있으므로 기존의 방법보다 두 성분을 더 잘 분리할 수 있는 방법이 필요한 것이다. 본 논문에서는 스펙트럼 신호를 최대한 평탄화시킴으로써 포만트의 영향을 제거하고 고조파 성분을 분리해 내어 이를 피치검출에 사용한다. LSP를 이용하여 적응적 밴드에서 평탄화를 시도하고 이를 피치 검출에 이용하였다.

  • PDF

음성신호의 전이구간을 이용한 화자 인식의 성능향상에 관한 연구 (On a Performance Improvement of Speaker Recogniton using the Transition Region of Speech Signal)

  • 오세영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.392-395
    • /
    • 1998
  • 기존의 DP 알고리즘을 이용하여 화자를 인식할 경우 시스템에 등록되어 있는 화자의 수가 증가할수록 처리해야할 데이터의 양이 많아진다. 그러므로 인식률이 저하되고 처리시간이 증가한다는 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위해 화자가 발성한 음성신호에서 안정구간내의 일정 파형을 삭제한 후 전이구간을 위주로 DP 알고리즘을 적용하여 화자를 인식한다. 제안한 방법으로 시험한 결과 시스템의 전체 인식률은 기존의 DP 알고리즘을 이용한 결과에 비해 1%의 향상을 보였고 처리시간은 21.6% 감소함을 볼 수 있다.

  • PDF

신호 준공간 모델에 기반한 통계적 음성 검출기 (Statistical Voice Activity Defector Based on Signal Subspace Model)

  • 류광춘;김동국
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.372-378
    • /
    • 2008
  • 음성 검출기 (VAD, Voice Activity Detector)는 이동 통신이나 음성신호처리 등에 매우 중요한 기법으로 사용된다. 일반적인 음성 검출방식은 이산 푸리에 변환 (DFT, Discrete Fourier Transform)영역에서 통계적인 모델을 기반으로 하여 우도비검정 (LRT, Likelihood Ratio Test)을 하게 된다. 그리고 이 값을 임계값과 비교하며 음성인지 아닌지 판단하게 된다. 본 논문에서는 신호 준공간 (Signal Subspace)에 기반한 새로운 통계적 음성 검출 기법을 제안하다. 확률적인 주성분 분석 (PPCA, Probabilistic Principal Component Analysis)은 신호 준공간 방법에서 잡음신호에 대한 확률적인 모델을 얻기 위해 사용된다. 제안된 기법은 신호 준공간 영역에서 우도비검정에 기반을 두는 결정규칙을 적용하였다. 음성 검출 실험 결과는 신호 준공간 모델에 근거한 음성 검출기 기법이 주파수 영역에 기반한 가우시안 (Gaussian) 음성 검출기 보다 향상된 검출 결과를 보여준다.

영한 음차 변환을 이용한 무제한 음성인식 및 합성기의 구현 (An Implementation of Unlimited Speech Recognition and Synthesis System using Transcription of Roman to Hangul)

  • 양원렬;윤재선;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.181-184
    • /
    • 2000
  • 본 논문에서는 영한 음차 변환을 이용한 음성인식 및 합성기를 구현하였다. 음성인식의 경우 CV(Consonant Vowel), VCCV, VCV, VV, VC 단위를 사용하였다. 위의 단위별로 미리 구축된 모델을 결합함으로써 무제한 음성인식 시스템을 구축하였다. 따라서 영한 음차 변환을 이용하게 되면 인식 대상이 영어단어일 경우에도 이를 한글 발음으로 변환한 후 그에 해당하는 모델을 생성함으로써 인식이 가능하다. 음성 합성기의 경우 합성에 필요한 한국어 음성 데이터 베이스를 구축하고, 입력되는 텍스트에 따라 이를 연결하여 합성음을 생성한다. 영어가 입력될 경우 영한 음차 변환을 이용하여 입력된 영어발음을 한글로 바꾸어 준 후 입력하게 되므로 별도의 영어 합성기 없이도 합성음을 생성할 수 있다.

  • PDF

구강 영역에 대한 타원 근사법을 이용한 음성 구간 검출법 (Voice Activity Detection Using Ellipse Fitting of the Oral Cavity Region)

  • 류제웅;추성권;김기백;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.271-274
    • /
    • 2012
  • 음성 신호처리에서 많이 쓰이는 음성구간 검출은 주로 음향신호의 분석을 통하여 음향 신호에 음성이 존재하는지 여부를 판단한다. 그러나 음향신호를 이용한 방법은 음성 또는 비음성 잡음이나 주위 음향 환경에 의하여 성능이 결정된다는 단점이 있다. 음향 환경 변화에 강인한 음성구간 검출을 수행하기 위하여, 영상정보를 이용한 음성구간 검출 방법들이 최근에 연구되어 왔는데 기존 방법들은 입술 모양의 변화를 추정하기 위하여 입술 모델 등을 이용하거나 구강(oral cavity) 영역에 해당하는 픽셀 수의 변화를 이용하여 음성 구간을 검출하였다. 위 방법들은 입술의 모양을 추정하는 데 복잡한 계산이 필요하거나, 입술 모양 추정 없이 구강 영역픽셀 수만 이용하기 때문에 다소 정확도가 떨어진다는 단점이 있다. 본 논문에서는, 입술 모양의 변화를 추정하기 위해 밖으로 드러나는 구강 영역의 모양을 타원 근사법으로 추정하고, 타원의 넓이와 높이의 변화를 이용하여 음성 구간을 검출하는 방법을 제안하였다. 비교 실험 결과, 제안하는 방법은 구강영역 픽셀 수의 변화만 이용하는 방법에 비해 우수한 성능을 보임을 확인할 수 있었다.

  • PDF

고전 영화의 디지털 음원 복원을 위한 강인한 노이즈 검출 기법 (Robust Noise Detection for Digital Audio Restoration in Old Films)

  • 유수정;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.53-54
    • /
    • 2010
  • 본 논문에서는 단일 채널 디지털 오디오 신호에서 스펙트로그램과 영상 처리 기법을 이용하여 크래클 잡음을 검출하는 알고리즘을 제안한다. 오디오 신호의 주파수 특성을 효율적으로 분석하기 위해 스펙트로그램을 특정 컬러맵을 이용하여 컬러 영상으로 변환한 후 영상 처리 기법을 적용하여 크래클 잡음이 존재하는 구간을 검출하여 디지털 오디오 복원에 이용한다. 특히 고전영화에 나타나는 크래클 잡음은 에너지와 신호 길이가 음성이나 음악 신호와 유사하여 기존의 스펙트럴 음성 검출 기법으로는 검출에 어려움이 있다. 이에 비해 스펙트로그램 영상에서는 크래클 잡음이 다른 신호들과 구분되는 특성을 나타내므로 영상 처리 기법을 적용하여 경계 검출과 Hough 변환에 의한 선 검출을 이용하여 크래클 잡음을 검출한다. 제안된 알고리즘은 고전 영화 디지털 오디오 복원에 적용하였으며 크래클 잡음 검출에 우수한 성능을 보여준다.

  • PDF

음성처리시스템의 전망

  • 한국정보통신산업협회
    • 정보화사회
    • /
    • 통권101호
    • /
    • pp.25-34
    • /
    • 1996
  • 음성처리(Voice Processing) 시장은 원격통신 산업에서 지속적으로 가장 빠르게 성장하고 있는 분야중 하나로, 지금까지는 전화망에 기초한 통신 관련 음성응용 기술이었다. 그러나 이제는 데이타 네트워크와 PC터미날까지를 포함한 기술로 그 범위가 확대되고 있으며 그 정의도 재정립되어야 한다. 음성프로세싱 기술은 음성 메시지와 자동전화 프로세싱, 디지탈음성 데이타의 기억장치와 검색을 위해 기본 기술을 사용하는 정보엑세스 응용프로그램, 인지와 통합, 전화화된 신호체계, 컴퓨터와 전화의 통합(CTI)등을 포함한다.

  • PDF