• Title/Summary/Keyword: speech rates

Search Result 271, Processing Time 0.026 seconds

CELP 보코더에서 전처리에 의한 피치검색 시간의 단축 (On A Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder)

  • 김대식;배명진;김종재;변경진;한기천;유하영
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.33-40
    • /
    • 1994
  • 부호여기된 선형예측(CELP) 음성부호화기는 4.8 kbps 이하의 낮은 전송 비율에서도 좋은 성능을 갖는다. CELP형 부호기의 단점은 많은 계산량을 필요로 한다는 것이다. 본 논문에서, 우리는 복잡성을 줄이면서 CELP 보코더의 음질을 유지하는 새로운 피치 검색법을 제안하였다. 이것은 음성 파형의 자기상관계를 간단한 전처리관계식에 의해 사전에 파악하여 필요한 구간에 대해서만 피치검색을 수행하는 방법이다. 제안한 방법은 피치검색에서 기존의 방법에 비해 약 $77\%$의 복잡성이 감소되었다.

  • PDF

순방향 WCDMA 채널에서 AMR 음성 코덱 모드 할당방식에 대한 성능 비교 (Performance Comparison of AMR Codec Mode Allocations in Downlink WCDMA System)

  • 정성환;홍정완;이상천;이창훈
    • 대한산업공학회지
    • /
    • 제31권4호
    • /
    • pp.349-357
    • /
    • 2005
  • The Adaptive Multi-Rate (AMR) speech codec is the mandatory for voice service in WCDMA systems. The AMR codec can be used efficiently to provide a balanced trade-off between the capacity and quality of voice by adjusting various service rates. In this paper, three ways of AMR mode allocation schemes on the downlink in WCDMA system are evaluated. To evaluate users satisfaction efficiently, new system performance measure and analytic models are proposed. The proposed analytic models can be applied to obtain optimal mode allocation ways while considering the system capacity and quality of voice. In numerical examples, the ways of finding optimal parameters are illustrated for the given traffic loads and the performances of three mode allocation schemes are compared.

LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식 (Speaker Recognition using LPC cepstrum Coefficients and Neural Network)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2521-2526
    • /
    • 2011
  • 본 논문에서는 퍼셉트론 신경회로망과 선형예측부호화 켑스트럼 계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음 구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측부호화 켑스트럼 계수를 구한다. 구해진 선형예측부호화 켑스트럼 계수를 분류하기 위하여 이 켑스트럼 계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측부호화 켑스트럼 계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.

잡음환경에서의 바이모달 시스템을 위한 견실한 끝점검출 (Robust Endpoint Detection for Bimodal System in Noisy Environments)

  • 오현화;권홍석;손종목;진성일;배건성
    • 전자공학회논문지CI
    • /
    • 제40권5호
    • /
    • pp.289-297
    • /
    • 2003
  • 음성인식 시스템과 입술독해 시스템을 결합한 하여 음향학적 잡음에 대하여 안정된 성능을 갖는 바이모달(bimodal) 시스템을 구현한다. 바이모달 시스템의 성능은 두 인식 시스템의 성능뿐만 아니라 입력 신호의 끝점검출 성능에도 크게 영향을 받는다. 본 논문에서는 음성신호와 영상신호에서 끝점을 자각 자동 검출하여 입력 음성신호로부터 음성신호에서 추정한 신호대잡음비(signal-to-noise ratio: SNR)로 두 끝점검출 결과를 선택하는 방법을 제안한다. 즉 낮은 SNR에서는 영상신호로부터 검출된 끝점을 선택하고 높은 SNR에서는 음성신호로부터 검출된 끝점을 선택함으로써 음향학적 잡음에 대하여 견실하게 끝점을 검출한다. 제안한 끝점검출 방법이 적용된 바이모달 시스템이 강한 음향학적 잡음에 대하여 만족스러운 인식성능을 나타냄을 실험견과에서 확인할 수 있다.

CELP보코더에서 Line Spectrum Frequency를 이용한 고속 피치검색 (A New Fast Pitch Search Algorithm using Line Spectrum Frequency in the CELP Vocoder)

  • 배명진;손상목;유하영;변경진
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.90-94
    • /
    • 1996
  • 부호여기된 선형예측(CELP) 음성부호화기는 4.8kbps이하의 낮은 전송 비율에서도 좋은 성능을 갖는다. CELP형 부호기의 단점은 많은 계산량을 필요로 한다는 것이다. 본 논문에서, 우리는 복잡성을 줄이면서 CELP보코더의 음질을 유지하는 새로운 피치검색법을 제안하였다. 이 방법은 CELP보코더의 포만트 필터단에서 찾은 제 1 포만트를 이용하여 예비피치를 찾고, 피치검색을 예비피치 구간에서만 수행하는 것이다. 제안한 방법을 CELP보코더에 적용하므로써, 기존의 방법에 비해 약 64%의 복잡성이 감소되었다.

  • PDF

Superiorly based flap을 이용한 기관절개술 (Superiorly Based Flap Tracheostomy)

  • 정필상;이정구;정필섭;김영훈
    • 대한기관식도과학회지
    • /
    • 제1권1호
    • /
    • pp.129-135
    • /
    • 1995
  • The superiorly based flap tracheostomy(SBFT) has been advocated as an new technique of tracheostomy to manage a wide variety of causes of upper airway obstruction. This technique has particular applicability in patients who require long term tracheostomy such as in bilateral vocal cord paralysis and severe obstructive sleep apnea. SBFT has numerous advantages such as shortening of the gap between the skin and trachea : construction of a self-sustaining tract ; circumferential mucocutaneous junction to reduce infection, granulation tissue, bleeding, and stenosis of the tract : avoidance of the laryngotracheal damage : easy placement of a tracheostomal stent to promote speech, coughing and swallowing. Most of all, this technique can reduces the suprastomal buckling by the support of the superiorly based tracheal flap, and thus prevents the stenosis of suprastomal airway. The disadvantage of SBFT is more time-consuming procedure than the conventional tracheostomy, A retrospective analysis of 8 patients undergoing SBFT between June, 1994 and March, 1995 in Dankook University Hospital was performed to present the surgical technique and com-plication rates. The average duration of follow up was 11 months. The complications were consisted of a wound infection and a sternal granulation. The other complications including wound dehiscence, tracheitis, pneumonia, tracheal granulation, sternal narrowing and subglottic stenosis were not experienced.

  • PDF

Neural Network을 이용한 무선 통신시스템에서의 VAD (VAD By Neural Network Under Wireless Communication Systems)

  • 이호선;김수경;박승권
    • 한국통신학회논문지
    • /
    • 제30권12C호
    • /
    • pp.1262-1267
    • /
    • 2005
  • EBF(Elliptical basis function) 신경망은 비선형 처리를 가능하게 하며, 잡음에 강하고 빠른 수렴을 하는 장점이 있다. 또한 EBF는 설계가 간단하여 실시간 음성 구간 검출기(Voice Activity Detection, VAD)에 적용하기 용이하다. 따라서 전송 효율을 높이기 위해 사용되는 음성구간 검출기를 제안함에 있어 EBF 신경망을 이용하였다. EBF의 학습 알고리즘은 평균 클러스터링(K-means Clustering) 알고리즘과 선형 최소 제곱 방범(Least Mean Square error, LMS)을 사용하였다. G.729 Annex B 와 RBF(Radial Basis Function) 신경망을 이용한 음성구간 검출기와 성능 비교에 있에서, G.729 Annex B 음성 검출기보다 $70\%$ 이상의 높은 성능재선을 나타냈고, RBF 신경망을 이용한 음성구간 검출기 보다 비음성 구간에서 $50\%$정도의 높은 효율을 보였다.

성인에 발생한 낭포성활액종 (CYSTIC HYGROMA IN THE ADULT)

  • 오성섭;김일규;전혜경
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제17권3호
    • /
    • pp.283-288
    • /
    • 1995
  • 저자 등은 성인에서는 드물게 발생하는 것으로 알려진 낭포성활액종을 가진 22세 남자 환자에서 임상소견 및 방사선 소견상 우측 전경부삼각에 발생한 낭포성활액종의 가진하에 악하부 절개를 통해 낭종성의 종물을 악하선을 포함하여 완전 절제후 재발 등의 특별한 문제 없이 양호한 결과를 얻었기에 문헌 고찰과 함께 보고 드리는 바이다.

  • PDF

RBFN을 이용한 음소인식에 관한 연구 (A study on the phoneme recognition using radial basis function network)

  • 김주성;김수훈;허강인
    • 한국통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.1026-1035
    • /
    • 1997
  • 본 연구는 RBFN의 일종인 GPFN과 PNN을 이용한 음소인식에 관한 연구이다. RBFN의 구조는 계층형 신경망의 구조와 유사하지만, hidden층에서 활성화함수, 참조벡터 및 학습알고리듬의 선택이 다르다. 특히 PNN은 시그모이드 함수가 지수를 포함한 함수들의 한 분류로 대체된다는 것이며, 학습이 필요없으므로 전체계산 시간이 빠르게 수행된다. 5모음, 12자음을 대상으로 한 음소인식 실험에서 평가데이터, VQ와 LVQ에 의한 코드북 데이터를 사용한 경우에 음성의 통계적 특성을 잘 반영하고 있는 RBFN의 일종인 GPFN과 PNN의 인식결과가 MLP보다 우수하였다.

  • PDF

CONTINUOUS DIGIT RECOGNITION FOR A REAL-TIME VOICE DIALING SYSTEM USING DISCRETE HIDDEN MARKOV MODELS

  • Choi, S.H.;Hong, H.J.;Lee, S.W.;Kim, H.K.;Oh, K.C.;Kim, K.C.;Lee, H.S.
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1027-1032
    • /
    • 1994
  • This paper introduces a interword modeling and a Viterbi search method for continuous speech recognition. We also describe a development of a real-time voice dialing system which can recognize around one hundred words and continuous digits in speaker independent mode. For continuous digit recognition, between-word units have been proposed to provide a more precise representation of word junctures. The best path in HMM is found by the Viterbi search algorithm, from which digit sequences are recognized. The simulation results show that a interword modeling using the context-dependent between-word units provide better recognition rates than a pause modeling using the context-independent pause unit. The voice dialing system is implemented on a DSP board with a telephone interface plugged in an IBM PC AT/486.

  • PDF