• 제목/요약/키워드: 비음성

검색결과 1,977건 처리시간 0.03초

우도비를 이용한 DBN 기반의 음성 검출기 (Voice Activity Detection based on DBN using the Likelihood Ratio)

  • 김상균;이상민
    • 재활복지공학회논문지
    • /
    • 제8권3호
    • /
    • pp.145-150
    • /
    • 2014
  • 본 논문에서는 입력된 신호에 의해 결정되는 각 주파수 밴드별 우도비(likelihood ratio, LR)를 deep belief networks(DBN)의 입력층으로 이용하는 새로운 음성 검출기(voice activity detection, VAD) 알고리즘을 제안한다. 기존의 통계적 모델 기반의 음성 검출기는 음성 구간을 판단하기 위해 우도비를 기하 평균을 이용한 결정식을 사용한다. 제안된 음성 검출기는 이 결정식을 대신해 DBN을 이용하여, 오검출 확률을 최소화 하도록 학습을 한다. 제안된 DBN 기반의 음성 검출 알고리즘은 통계적 모델 기반의 음성 검출기의 성능을 개선한 support vector machine(SVM) 기반의 음성 검출기와 정상 및 비정상 잡음 환경에서 다양한 조건을 부과하여 비교하였다. 제안된 알고리즘이 기존의 SVM 기반의 알고리즘보다 전체 오분류 확률 [0.7, 2.7]의 향상 폭을 보였다.

  • PDF

궤환구조를 가지는 변별적 가중치 학습에 기반한 음성검출기 (Voice Activity Detection Based on Discriminative Weight Training with Feedback)

  • 강상익;장준혁
    • 한국음향학회지
    • /
    • 제27권8호
    • /
    • pp.443-449
    • /
    • 2008
  • 이동통신에서 배경잡음이 존재하는 실제 환경에서 음성신호처리의 가장 중요한 이슈중의 하나는 강인한 음성검출기를 설계하는 것이다. 상대적으로 간단하면서도 성능이 우수하여 대표적인 음성검출기로 사용되는 통계적모델기반 기법은 각 주파수 채널별 우도비를 이용하여 음성검출 검출식을 만들어내는 방식이다. 최근, 변별적 가중치 학습 (discriminative weight training)을 이용하여 주파수 체널별 가중치가 인가된 우도비를 이용한 음성검출 결정식을 갖는 음성검출기가 제안 되었으며 상대적으로 우수한 성능을 보였다. 본 연구에서는 기존의 변별적 가중치 학습의 입력벡터에 이전프레임의 결정식을 궤환구조형태를 바탕으로 추가하는 새로운 방식을 제안한다. 제안된 기법은 비정상 (non-staionary) 잡음 환경에서 객관적인 방법을 통해 상호비교 분석되었으며 결론적으로 우수한 성능을 보였다.

구강 영역에 대한 타원 근사법을 이용한 음성 구간 검출법 (Voice Activity Detection Using Ellipse Fitting of the Oral Cavity Region)

  • 류제웅;추성권;김기백;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.271-274
    • /
    • 2012
  • 음성 신호처리에서 많이 쓰이는 음성구간 검출은 주로 음향신호의 분석을 통하여 음향 신호에 음성이 존재하는지 여부를 판단한다. 그러나 음향신호를 이용한 방법은 음성 또는 비음성 잡음이나 주위 음향 환경에 의하여 성능이 결정된다는 단점이 있다. 음향 환경 변화에 강인한 음성구간 검출을 수행하기 위하여, 영상정보를 이용한 음성구간 검출 방법들이 최근에 연구되어 왔는데 기존 방법들은 입술 모양의 변화를 추정하기 위하여 입술 모델 등을 이용하거나 구강(oral cavity) 영역에 해당하는 픽셀 수의 변화를 이용하여 음성 구간을 검출하였다. 위 방법들은 입술의 모양을 추정하는 데 복잡한 계산이 필요하거나, 입술 모양 추정 없이 구강 영역픽셀 수만 이용하기 때문에 다소 정확도가 떨어진다는 단점이 있다. 본 논문에서는, 입술 모양의 변화를 추정하기 위해 밖으로 드러나는 구강 영역의 모양을 타원 근사법으로 추정하고, 타원의 넓이와 높이의 변화를 이용하여 음성 구간을 검출하는 방법을 제안하였다. 비교 실험 결과, 제안하는 방법은 구강영역 픽셀 수의 변화만 이용하는 방법에 비해 우수한 성능을 보임을 확인할 수 있었다.

  • PDF

비균일 표본화된 음성 신호에서의 기본적인 신호처리 (Fundamental Signal Processing in NonUniformly Sampled Speech Signal)

  • 임재열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.235-238
    • /
    • 1995
  • 극점에서 비균일 표본화된 음성 신호는 크기열과 간격열의 이중구조로 표현되어, 균일 표본화된 신호에 근거한 기존의 신호처리 방법을 그대로 적용할 수 없다. 본 논문에서는 비균일 표본화된 음성 신호에서 에너지, 크기, 영교차율, 함수의 관계를 직접 유도하고, 특징을 살펴보아 비규닝ㄹ 펴본화된 음성신호에서도 균일 표본화된 신호에 해당하는 에너지, 크기, 영교차율과 같은 전처리과정 파라미터의추정이 가능함을 확인한다.

  • PDF

칼만필터를 이용한 음성신호에 중첩된 유색잡음의 감쇠 (An Application of the Kalman Filter for Attenuation of Colored Noise Superimposed on Speech Signal)

  • 구본응
    • 한국음향학회지
    • /
    • 제13권2호
    • /
    • pp.76-85
    • /
    • 1994
  • 정체형 칼만필터와 간단한 음성-비음성 판별알고리즘을 사용하여 비정체형 유색잡음을 감쇠시키는 방법을 제안하였다. 종래의 잡음감쇠알고리즘들이 대부분 백색 또는 정체형 잡음을 다룬데 비하여 본 연구는 대부분의 실제 잡음환경, 즉, 비백색 비정체성 잡음을 다루었다는 점이 다르다. 잡음감쇠기로서는 AR모델에 의거한 백터형 칼만필터를 사용하였고, 음성/비음성 판별에는 단구간에너지의 임계값논리를 사용하였다. 칼만필터에 필요한 잡음의 계수는 비음성구간에서 추산하였고, 음성의 계수는 EM반복법을 적용하여 추산하였다. 실험결과는 신호대 잡음비와 청취테스트로 제시하였다. 차량잡음을 사용한 실험결과, 비음성구간의 배경잡음은 거의 완전히 제거할 수 있었고, SNR이 0dB내지 -5dB로 낮아짐에 따라 왜곡이 심화 되는 경향을 보였으나, 음성의 명료도를 저하시키지는 않았다.

  • PDF

음성총괄평가

  • 정옥란
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1994년도 제2회 학술대회 심포지움
    • /
    • pp.101-109
    • /
    • 1994
  • 정상음성이란 개인의 음성 매개변수(vocal parameter), 즉 음도(pitch), 강도(loudness), 음질(quality), 유동성(flexibility) 등이 그 사람의 성, 연령, 환경, 체구 등에 적합한 음성을 말한다. 비정상적인 음성을 가진 음성자애 환자의 의뢰는 이비인후과 전문의에 의해 이루어지는 경우가 많고, 이 외에도 가족, 주변인, 환자의 교사 등에 의해 그리고 때때로 자가의뢰를 해오는 환자도 있다. (중략)

  • PDF

강화학습 기반의 음성향상기법 (Speech enhancement based on reinforcement learning)

  • 박태준;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.335-337
    • /
    • 2018
  • 음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.

차량에서의 음성인식율 향상을 위한 전처리 기법 (Preprocessing Technique for Improvement of Speech Recognition in a Car)

  • 김현태;박장식
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.139-146
    • /
    • 2009
  • 본 논문에서는 차량에서의 자동 음성인식 시스템과 같이 신호대잡음비가 낮은 잡음 환경에서의 음성인식에 적합한 변형된 스펙트럼 차감법을 제안한다. 기존의 스펙트럼 차감법은 스펙트럼에서 낮은 신호대 잡음비(SNR)를 갖는 부분은 감쇄되고, 신호대잡음비가 높은 부분은 강조되는 신호대잡음비에 의존한다. 그러나 이러한 구성은 높은 신호대잡음비를 갖는 환경에서는 적절하나 차량 환경과 같이 낮은 신호대잡음비를 나타내는 환경에서는 매우 부적절하다. 제안하는 방법은 낮은 신호대잡음비를 갖는 잡음 환경을 위해 음성우세영역을 강조하여 불필요하게 음성영역이 과차감되지 않도록 방지한다. 차량용 음성명령어 어휘를 대상으로 한 실험 결과에서 제안하는 방법이 기존의 방법에 비해 우수한 것을 확인하였다.

낮은 신호 대 잡음비 환경에서의 퍼지 소속도 천이 C-means 클러스터링을 이용한 음성구간 검출 알고리즘 (Voice Activity Detection Algorithm using Fuzzy Membership Shifted C-means Clustering in Low SNR Environment)

  • 이기현;이윤정;조진호;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.312-323
    • /
    • 2014
  • 음성구간 검출은 음성과 잡음이 섞인 신호에서 음성과 잡음이 섞인 신호에서 음성구간을 찾는 과정으로 잡음제거나 음성 향상을 위한 신호처리에서 매우 중요한 과정이다. 지금까지 음성구간 검출에 관한 많은 연구가 있었지만, 낮은 신호 대 잡음비 환경에서 문장형태의 음성신호에 대해서는 좋은 성능을 보이지 못하였다. 본 논문에서는 신호의 엔트로피를 이용한 초기 VAD과정을 거친 후, 퍼지 소속도 천이 c-means 클러스터링 방법을 이용해 주 VAD과정을 거치는 새로운 VAD알고리즘을 제안한다. 제안한 알고리즘의 성능을 비교 평가하기 위하여 백색잡음의 다양한 신호 대 잡음비 환경에서 실험을 수행하였으며 실험결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.

자동차 잡음 환경에서 웨이브렛 밴드 엔트로피 앙상블 분석을 이용한 음성구간 검출 알고리즘 (Voice Activity Detection Algorithm using Wavelet Band Entropy Ensemble Analysis in Car Noisy Environments)

  • 이기현;이윤정;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1005-1017
    • /
    • 2013
  • 음성구간 검출은 음성과 잡음이 섞인 신호에서 음성구간과 비음성구간을 구분하는 과정으로 음성 향상을 위한 신호처리에서 매우 중요한 과정이다. 지금까지 음성구간 검출에 관한 많은 연구가 있었지만, 낮은 신호 대 잡음비 환경이나 자동차 잡음과 같은 시간에 따른 변화가 심한 잡음환경에서는 좋은 성능을 보이지 못하였다. 본 논문에서는 웨이브렛 밴드 엔트로피 기반의 앙상블 분산과 소프트 문턱치 기법을 이용한 새로운 음성구간 검출 알고리듬을 제안하였다. 제안한 알고리듬의 성능을 비교 평가하기 위하여 자동차 잡음이 있는 다양한 신호 대 잡음비 환경에서 실험을 수행하였으며 실험결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.