• 제목/요약/키워드: 음성개선

검색결과 1,034건 처리시간 0.036초

음성 합성을 위한 음성 파라미터 분석법의 개선에 관한 연구 (A Study on Improvements of Speech Analysis Methods for Speech Synthesis)

  • 방호균
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.111-114
    • /
    • 1995
  • 포만트 합성에 필요한 음성 파라미터를 분석하는 방법의 개선에 관하여 논한다. 내용은 주로 피치 동기 분석을 위한 피치 위치 추정법의 개선과 포만트 분석시 발생하는 스펙트럼의 왜곡 현상을 기존이 포만트 분석법 및 선형예측분방법과 비교한다.

  • PDF

무선 통신망에서 음성인식률 개선을 위한 보상기법 연구 (Compensation Method for Improvement of Speech Recognition in Wireless Communication Network)

  • 서진호;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.65-68
    • /
    • 2004
  • 이동통신 기술의 발전으로 이동통신 사용이 폭발적으로 증가하였고 그에 따라 이동통신망을 이용한 많은 서비스가 제공되고 있다. 이동통신망에서의 음성 인식 서비스에서 음성 인식기에 입력되는 음성신호는 통신망을 통해 음성 압축기를 거치게 되고 이에 음성신호가 왜곡되어 인식기의 인식성능이 저하된다. 본 논문에서는 무선통신 환경에서 음성인식기의 성능을 개선하기 위한 보상 방법을 제안한다. 기존의 제안된 방법은 음성 데이터에 의존하는 방법을 사용하나 본 논문에서는 음성 데이터와는 독립적 방법인 음성 압축기에 의해 손상된 입력 신호의 스펙트럼 보상방법과 Cepstrum 보정방법을 통해 인식률을 향상시키는 방법을 제안한다. 즉, 음성 압축기에 의하여 왜곡된 스펙트럼을 단계적 방법으로 보상하고 그를 토대로 왜곡된 신호에서 만들어진 Cepstrum을 보정하여 음성 인식기의 성능을 향상시키는 방법을 연구하였으며, 그 견과 손상된 음성신호의 인식률 $64.88\%$에 대하여, 본 논문에서 제안하는 보상 방법을 적용한 음성신호의 인식률은 $79.73\%$로서 $14.85\%$가 향상된 결과를 얻을 수 있었다.

  • PDF

마이크로폰 배열을 이용한 웨이브렛 도메인에서의 음성신호 개선 (Microphone Array Processing in the Wavelet Domain for Speech Enhancement)

  • 장병욱;권홍석;김시호;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.513-516
    • /
    • 2001
  • 마이크로폰을 배열을 이용한 음성개선 기법 중에서 저주파 영역에서의 높은 상관성과 고주파 영역에서의 spatial aliasing을 동시에 고려하기 위하여 대수적인 선형 마이크로폰 배열을 사용하고 웨이브렛 도메인에서의 Wiener 필터에 기반한 postfiltering을 수행하는 방법이 제안된 바 있는데[l], 본 논문에서는 이 방법의 문제점을 분석하고 해결방안을 제시하였다. 제안한 알고리즘을 사용하여 시뮬레이션한 결과, 마이크에 입력되는 음성신호의 SNR이 0dB일 때와 l0dB일 때, 기존의 알고리즘에 비해 약 1.7dB와 2.5dB의 성능개선이 있었으며, 청취실험을 통해서도 음질의 향상을 확인할 수 있었다.

  • PDF

강인한 음성인식을 위한 MMSE-STSA기반 후처리 가중필터뱅크분석을 통한 특징추출 (Feature Extraction through the post processing of WFBA based on MMSE-STSA for Robust Speech Recognition)

  • 정성윤;배건성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.39-42
    • /
    • 2004
  • 본 논문에서는, 잡음음성에 강인한 음성인식을 위한 특징추출 방법을 제시한다. 제시한 방법은 2 단계 잡음제거 과정으로 구성되어 있다. 첫번째 단계는 MMSE-STSA 음성개선기법을 통해 잡음음성신호를 개선시키는 과정이고, 두 번째 단계는, MMSE-STSA 의 개선된 음성에 후처리 가중필터뱅크분석을 통해 잔여잡음의 영향을 감소시키는 과정이다. 제안한 방법의 성능평가를 위해, AURORA2의 잡음음성 DB 중 테스트 집합 A 에 대해 인식실험을 수행하고, 결과를 기존 방법들과 비교, 검토한다.

  • PDF

C++ 언어와 Standard Library 를 이용한 음성인식기 개발 (Development of a Speech Recognition System uSing e++ Language and Standard library)

  • 황규웅
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.74-77
    • /
    • 1998
  • 우리는 C++를 이용하여 음성인식기를 구현하여 기존의 C를 이용한 경우에 비하여 30% 수준의 소스로 표현하였고 인식기의 공동개발, 확장 및 개선, 기술 전수 등이 용이하게 되었으며 이를 음성인식 엔진 및 음성인식 연구를 위한 툴로 사용할 수 있게 되었다. 이 인식기의 특징으로는 연속 음성 및 대화체 음성을 인식할 수 있으며 trigram 언어 모델을 사용하였고 문맥 종속 음소 모델링에서는 기존의 triphone 보다 넓은 문맥을 고려한 n-phone context modeling을 사용하였으며 모델의 선정에는 음성학적 지식을 기반으로 한 질문을 사용한 decision tree를 사용하여 훈련에 나타나지 않은 단어나 문맥인 경우라도 가장 가까운 모델을 선정할 수 있게 하였다. 또, tree lexicon을 사용하여 속도를 개선하였으며 state 단위의 모델 공유를 통해 제한된 데이터를 이용하여 더 많은 모델을 훈련할 수 있어 성능을 개선하였다. 상용화를 염두에 두고 pc에서 구현하였다.

  • PDF

Cross-linked collagen 주입에 의한 성문폐쇄부전의 개선 (CROSS-LINKED COLLAGEN IMPLANT INJECTION AND REHABILITATION OF GLOTTIC INCOMPETENCE)

  • 이정구
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1993년도 제1회 학술대회 연제순서 및 초록집
    • /
    • pp.18-18
    • /
    • 1993
  • 성문폐쇄부전의 개선을 위해 후두내에 주입하여온 여러 재료 중 현재에는 teflon만이 가장 흔히 사용되어지고 있다. 그러나 teflon은 점막하와 가동성 성대 내에 주입할 수 없어 경도 성문 폐쇄부전의 미세 조정과 성대의 작은 결손에는 부적합하다. 성문폐쇄부전을 개선하기 위하여 9명의 환자에서 17회 cross-linked collagen을 주입한 결과 이 방법은 환자의 음성을 개선하고 성문폐쇄부전을 교정하는데 성공적이었다. (중략)

  • PDF

개선된 스펙트럼 스무딩을 이용한 다이폰 클러스터링 기반의 연결 음성합성 (Concatenative Speech Sythesis based on Diphone Clustering using improved spectral smoothing)

  • 장효종;김계영;최형일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.499-501
    • /
    • 2002
  • 최근의 합성음성단위 연결을 통한 음성합성 방법의 잘 알려진 문제점은 연결 부분에서 불연속이 발생한다는 것이다. 본 논문에서는 음성을 합성할 때 나타나는 스펙트럼의 불연속을 제거하기 위하여 개선된 스펙트럼 스무딩 방법을 제안한다. 그리고 보다 좋은 스무딩의 결과를 얻기 위하여 음성합성의 단위로는 문맥에 민감한 클러스터링된 다이폰을 사용한다. 스무딩 방법에서는 연결 구간에서의 다이폰 바운더리에서의 양쪽 스펙트럼의 분포를 고려하여 시간에 따라 가중치를 다르게 주어 스무딩을 수행한다. 또한 가중치를 결정할 때 비선형 함수인 B-Spline함수를 사용하여 스무딩을 수행하여 보다 자연스러운 스펙트럼을 생성 할 수 있었다.

  • PDF

신경회로망을 이용한 화자종속 음성인식 성능에 관한 연구 (A study of speaker dependent speech recognition using neural network)

  • 윤지원;이종수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.153-156
    • /
    • 2003
  • 본 연구는 화자종속 소어휘 음성인식의 성능을 개선하는 데 그 목적이 있다. 인식에 사용될 음성의 특징을 얻기 위해 Winer 필터와 LPC&Cepstrum을 이용하여 프레임 당 12차 패턴을 추출하였다. 추출된 특징패턴을 인식하는 인식부는 특히 소어휘 음성인식에 우수한 성능을 보이는 기존의 역전파 신경회로망(Backpropagation Neural Network)에 인식율 개선을 위하여 퍼지추론시스템을 결합한 형태로 구현되었다. 실험결과 신경망만을 사용한 경우에 비하여 인식율이 향상됨을 연구하였다.

  • PDF

음향학적 모델에 의한 스펙트럼 필터 알고리즘 (Spectrum Filter Algorithm based on Acoustic Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

이중 모드 G.723.1 음성부호화기에 의한 DTMF 톤 전송성능 개선 (An Imporvement of DTMF Tone Transmission Based on Dual Mode G.723.1 Vocoder)

  • 허호영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.415.1-418
    • /
    • 1998
  • G.723.1은 부호화 방식은 제한된 계산량으로 낮은 전송율에서 음성을 가장 잘 표현할 수 있도록 최적화되어 있어서, 음성주파수 대역에 있는 DTMF톤의 경우 왜곡이 발생되어 전송성능이 떨어지는 문제점이 있다. 본 논문에서는 DTMF톤의 투명한 전송을 위해 LSP 계수를 이용한 톤 신호 검출에 기반을 둔 음성모드와 톤모드의 이중모드를 가지는 변형된 G.723.1 음성부호화 방식을 제안한다. 제안된 방식에서 음성모드 부호화기는 기존의 방식과 동일하며, 톤모드의 경우 부호화 단계에서 spectral smoothing 및 피치주기 검출 방식 등을 수정함으로써 수신단의 변경없이 DTMF톤의 전송왜곡을 개선시킨다. 본 논문에서는 컴퓨터 모의실험을 통해 제안된 방법이 DTMF 전송성능을 개선시킴을 확인하였다.

  • PDF