• 제목/요약/키워드: voice parameter

검색결과 179건 처리시간 0.027초

일측 성대마비 환자에 대해 음성치료와 성대주입술의 초기 치료 효과 비교 연구 (Comparison of Initial Therapeutic Effects of Voice Therapy and Injection Laryngoplasty for Unilateral Vocal Cord Paralysis Patients)

  • 이창윤;안수연;장현;손희영
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.112-117
    • /
    • 2017
  • Background and Objectives : The purpose of this study was to classify patients with unilateral vocal fold paralysis according to their fixed location and to analysis the effects of two treatment methods by early voice therapy and injection laryngoplasty. Materials and Methods : Twenty patients who were classified as full abduction and slight abduction according to the position of paralysis were treated injection laryngoplasy, and 23 patients were treated by voice therapy. Twenty patients were treated injection laryngoplasy and 23 patients were treated voice therapy. Results were evaluated by acoustic analysis, electroglottography, cepstrum analysis before and after therapy. The voice therapy was conducted by improving the larynx movement and glottal contact, whilst removing hypertension of the supraglottic and use the breathing. Results : Significant improvement was found in the acoustic parameter, cepstrum parameter, and EGG before and after treatment in both groups. There was no significant difference between the two groups when compared before and after treatment to compare the effects of injection laryngoplasty and voice therapy. Conclusion : The initial treatments for unilateral vocal cord paralysis are injection laryngoplasty and voice therapy. however, there is no precise standard about which method should be applied first. Therefore, in this study, we tried to classify patients according to their paralysis position and then apply two methods. The results of this study suggest that voice therapy and Injection laryngoplasty at the initial stage is a very useful method to improve voice quality of vocal fold paralysis and improve laryngeal function.

  • PDF

장애음성의 주기성분과 잡음성분의 분리 방법에 관하여 (Separation of Periodic and Aperiodic Components of Pathological Speech Signal)

  • 조철우;리타오
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.25-28
    • /
    • 2003
  • The aim of this paper is to analyze the pathological voice by separating signal into periodic and aperiodic part. Separation was peformed recursively from the residual signal of voice signal. Based on initial estimation of aperiodic part of spectrum, aperiodic part is decided from the extrapolation method. Periodic part is decided by subtracting aperiodic part from the original spectrum. A parameter HNR is derived based on the separation. Parameter value statistics are compared with those of Jitter and Shimmer for normal, benign and malignant cases.

  • PDF

Dr. Speech Science의 음성합성프로그램을 이용하여 합성한 정상음성과 병적음성(Pathologic Voice)의 음향학적 분석 (Acoustic Analysis of Normal and Pathologic Voice Synthesized with Voice Synthesis Program of Dr. Speech Science)

  • 최홍식;김성수
    • 대한후두음성언어의학회지
    • /
    • 제12권2호
    • /
    • pp.115-120
    • /
    • 2001
  • In this paper, we synthesized vowel /ae/ with voice synthesis program of Dr. Speech Science, and we also synthesized pathologic vowel /ae/ by some parameters such as high frequency gain (HFG), low frequency gain(LFG), pitch flutter(PF) which represents jitter value and flutter of amplitude(FA) which represents shimmer value, and grade ranked as mild, moderate and severe respectively. And then we analysed all pathologic voice by analysis program of Dr. Speech Science. We expect that this synthesized pathologic voices are useful for understanding the parameter such as noise, jitter and shimmer and feedback effect to patient with voice disorder.

  • PDF

음성신호 분석 요소의 적용으로 헬륨가스 흡입이 음성 기관의 특성 변화에 미치는 영향 (The Effect of Helium Gas Intake on the Characteristics Change of the Acoustic Organs for Voice Signal Analysis Parameter Application)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.397-404
    • /
    • 2011
  • 본 논문에서는 헬륨가스 흡입에 따른 조음기관의 특성이 변화되는 것을 측정하기 위해 음성분석학적 요소의 적용을 통한 실험을 수행하였다. 헬륨가스는 기존에 잠수부가 사용하던 질소가스가 인체에 치명적인 공기 색전증을 유발하게 되면서 이를 극복하기 위한 대체 호흡용 가스로 사용되고 있다. 그러나, 헬륨가스는 명료도가 낮은 squeaky voice를 유발하기 때문에 잠수부들의 비정상적인 음성에 대한 해석에 어려움이 많다. 따라서, 헬륨가스가 음성기관에 미치는 영향을 음성분석학적 특성 변화로 측정하기 위해 헬륨가스 흡입 전과 후의 음성을 기반으로 피치 및 스펙트로그램 측정, 분석에 대한 실험을 수행하였다.

PCA 기반 파라메타를 이용한 숫자음 인식 (The Recognition of Korean Syllables using Parameter Based on Principal Component Analysis)

  • 박경훈;표창수;김창근;허강인
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.181-184
    • /
    • 2000
  • 본 논문에서는 음성 특징추출의 한 방법으로서 기존의 방법들과는 달리 음성의 통계적인 특성들을 고려하여, 입력 공간내에서 변동량이 가장 많은 방향으로 주축을 발견한 다음 그 정보를 이용하여 데이터의 중복성을 제거하는 주성분 해석(PCA:Principal Component Analysis)기법을 사용하여 음성의 특징을 추출하는 방법을 제안한다. 본 논문의 숫자음 인식실험 결과와 비교하기 위하여 기존의 음성특징 파라메타인 Mel-Cepstrum과 비교하였을 때, 0.5%의 인식률 차이가 있었으나, 음성특징 추출시 기존의 파라메타에 비하여 비교적 짧은 시간에 구해지는 점과 데이터의 통계적 특성을 이용한 최적의 기저벡터를 이용한다면 단어나 문장 인식시에 보다 나은 인식률을 얻으리라 사료된다.

  • PDF

음성 에너지 분포 처리와 에너지 파라미터를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using a convergence of Voice Energy Distribution Process and Parameter)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.313-318
    • /
    • 2015
  • 전통적인 음성 향상 방법은 잘못된 잡음의 추정에 따라 남아있는 잡음이 발생하여 음성 스펙트럼을 왜곡하거나 음성 프레임을 찾지 못하여 음성 인식 성능을 저하시키는 문제가 발생된다. 본 논문에서는 음성 에너지 분포 처리와 음성 에너지 파라미터를 융합한 음성 검출 방법을 제안하였다. 제안한 방법은 음성 에너지를 최대화시켜 잡음의 영향을 적게 받는 특성을 이용하였다. 또한, 음성 신호의 특징 파라미터 중에서 작은 값을 가지는 로그에너지 특징의 구간에서는 큰 에너지를 가지는 구간에 비해 상대적으로 로그에너지 값을 더 많이 키워서 잡음이 포함한 음성신호의 로그에너지 특징의 크기와 비슷하게 하여 훈련과 인식 환경의 불일치를 융합으로 인해 줄여준다. 인식 실험 결과 기존 방법에 비해 향상된 인식 성능을 확인할 수 있었으며, car 잡음 환경의 음성 구간 적중률은 낮은 SNR구간인 0dB과 5dB에서는 97.1%와 97.3%의 정확도를 보였으며, 높은 SNR구간인 10dB와 15dB에서는 98.3%, 98.6%의 정확도를 보였다.

목적고도 정보를 제공하는 ADS-B 환경의 음성통신량 분석 (The Analysis of Voice Communication Traffic based on ADS-B Providing the Aiming Altitude Parameter)

  • 현정욱;길현철;안동만;홍교영
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.946-952
    • /
    • 2011
  • 항공관제 시에 음성통신의 사용은 정보전달의 부정확성과 주파수 측면에서 채널 점유시간을 증가시키는 문제점을 가지고 있다. 이를 개선하기 위하여 ICAO는 디지털 음성통신과 항공관제에 보다 효과적인 ADS-B 시스템 구축을 제안하고 있다. ICAO는 지정된 ADS-B IN, OUT 데이터 외에 추가적인 파라미터를 통한 효율성 개선에도 많은 연구를 수행하고 있다. 이에, 본 논문은 국내 ADS-B 도입을 위한 기반 연구로 항공관제 시에 음성통신량을 줄이고자 항공관제 음성통신 내역을 분석하였으며, 시뮬레이션을 통해 ADS-B 환경에서 목적고도의 제공 유무에 따라 관제사와 조종사 사이의 음성통신량에 있어서 어떠한 효과가 있는지 비교 분석하였다. 분석 결과 제시한 목적고도 파라미터를 추가할 때 기존 환경보다 음성통신량이 현저히 감소함을 확인하였다.

개별 음향 정보를 이용한 화자 확인 알고리즘 성능향상 연구 (The Study for Advancing the Performance of Speaker Verification Algorithm Using Individual Voice Information)

  • 이재형;강선미
    • 음성과학
    • /
    • 제9권4호
    • /
    • pp.253-263
    • /
    • 2002
  • In this paper, we propose new algorithm of speaker recognition which identifies the speaker using the information obtained by the intensive speech feature analysis such as pitch, intensity, duration, and formant, which are crucial parameters of individual voice, for candidates of high percentage of wrong recognition in the existing speaker recognition algorithm. For testing the power of discrimination of individual parameter, DTW (Dynamic Time Warping) is used. We newly set the range of threshold which affects the power of discrimination in speech verification such that the candidates in the new range of threshold are finally discriminated in the next stage of sound parameter analysis. In the speaker verification test by using voice DB which consists of secret words of 25 males and 25 females of 8 kHz 16 bit, the algorithm we propose shows about 1% of performance improvement to the existing algorithm.

  • PDF

최적 분류 변환을 이용한 음성 개성 변환 (Voice Personality Transformation Using an Optimum Classification and Transformation)

  • 이기승
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.400-409
    • /
    • 2004
  • 본 논문에서는 임의의 화자가 발성한 음성을 다른 화자가 발성한 음성처럼 들리도록 변환하는 음성 변환 알고리즘을 제안하였다. 개인이 지니고 있는 음성의 특성을 변환하기 위해 성도 전달 함수의 특성을 변환 변수로 사용하였으며, 기존의 기법과 비교하여 목표 화자의 음성과 주관적, 객관적으로 더욱 유사한 변환음을 얻기 위한 새로운 방법을 제안하였다. 성도 전달 함수의 변환은 전체 특징 벡터 공간을 분류 한 뒤, 각 구획에 대한 선형 변환식을 통해 구현된다. 특징 변수로서 LPC 켑스트럼을 사용하였으며, 벡터 공간의 분류와 선형 변환식의 추정을 동시에 최적화시키는 분류-변환 알고리즘이 새로이 제안되었다. 제안된 음성 변환 기법의 성능을 평가하기 위해 3명의 남성 화자와 1명의 여성 화자로부터 수집된 약 150개의 문장을 사용하여 변환 규칙을 생성하였으며, 이를 동일한 화자가 발성한 다른 150개의 문장에 대해 적용하여 객관적인 성능 평가와 주관적 청취 테스트를 수행하였다.

잡음환경에서 Teager Energy 기반의 전역 음성부재확률을 이용하는 음성검출 (Voice Activity Detection Using Global Speech Absence Probability Based on Teager Energy in Noisy Environments)

  • 박윤식;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.97-103
    • /
    • 2012
  • 본 논문에서는 잡음환경에서 효과적인 음성을 검출하기 위한 새로운 음성 검출 (VAD, voice activity detection) 알고리즘을 제안한다. 통계적 모델에 기반의 Likelihood ratio (LR)를 통하여 도출되는 전역 음성부재확률 (GSAP, global speech absence probability)은 음성검출을 위한 피쳐 (feature) 파라미터로 널리 적용되고 있다. 하지만 신호 대 잡음 비 (SNR, signal-to-noise ratio)가 낮은 잡음환경에서는 정확한 GSAP 추정이 어려운 문제점을 가지고 있다. 따라서 제안된 방법에서는 잡음환경에서 강인한 VAD 알고리즘을 위하여 Teager energy (TE) 기반의 GSAP를 피쳐 파라미터로 적용한다. 제안된 알고리즘은 기존의 방법과 객관적인 실험을 통해 비교 평가한 결과 다양한 배경잡음 환경에서 향상된 성능을 보였다.