• 제목/요약/키워드: speech quality

검색결과 807건 처리시간 0.031초

일측 성대마비 환자에서 성대내전술 후 성대접촉율의 증가가 음질 개선에 미치는 영향 (The Effect of An Increase of Closed Quotient on Improvement of Voice Quality after Type I Thyroplasty in Patients with Unilateral Vocal Cord Paralysis)

  • 김한수;최성희;임재열;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.16-20
    • /
    • 2004
  • Purpose : To assess perceptual, acoustic and aerodynamic measure of voice quality in patients with unilateral vocal cord paralysis before and after type I thyroplasty. Methods : The clinical records of patients operated type I thyroplasty in the Departement of otorhinoalryngolgy, Yongdong Severance hospital from November 2001 to November 2003 were reviewed. All patients uderwent a vocal function evaluation including perceptual, acoustic and aerodynamic measures of voice preoperative and on $60^{th}$ postoperative day. The perceptual and acoustic measures were obtained from recording of patients' reading a 'Sanchak' passage. The perceptual evaluation was performed by 2 speech pathologist using a 4-point rating scale. Acoustic parameters(voice range profile low(RAL), voice range profile high(RAH), average fundamental frequency(AFX), closed quotient, harmonic to noise ratio, jitter and shimmer) were investigated by Lx speech studio. Mean flow rate(MFR), subglottic pressure(Psub) and intensity were measured using the Phonatory function analyzer. The maximum phonation time was also measured. The data were statistically analyzed. A paired t-test (p<0.1) was used to compare preoperative and postoperative results. And multiple regression test was used to find which parameter was most correlated to improvement of postoperative voice quality. Results : Among aerodynamic parameters, Psub $(88.11mmH_2O{\rightarrow}58.7mmH_2O)$, MPT(7.87sec${\rightarrow}$12.53sec), MFR (359.8ml/sec${\rightarrow}$161.06ml/sec) were statistically improved. AFx(205.5Hz${\rightarrow}$163.27Hz), AQx(23.9%${\rightarrow}$48.3%), RAL, RAH. Jotter and shimmer were improved. In multiple regression test, AFx and AQx was noted as the two meost correlated parameters to improvement of postoperative breathiness. But general grade of voice quality was more correlated to Psub and shimmer. Conclusion : Vocal fold medialization procedures effectively reduce glottic gap. Increasing of contact area of both vocal folds induced improvement in aerodynamic parameters and leaded stabilizing of vocal fold vibration. That effect results in improvement in acoustic parameters (shimmer, jitter, signal-to-noise ratio, voice range profile) and voice quality.

  • PDF

3D 캐릭터에서의 자동 립싱크 MAYA 플러그인 개발 (Development of Automatic Lip-sync MAYA Plug-in for 3D Characters)

  • 이상우;신성욱;정성택
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.127-134
    • /
    • 2018
  • 본 논문에서는 한국어를 기반으로 음성 데이터와 텍스트 정보에서 한국어 음소를 추출하고 분할된 음소들을 사용하여 정확하고 자연스러운 3D 립싱크 애니메이션을 제작하기 위한 오토 립싱크 Maya 플러그인을 개발하였다. 여기서 개발된 시스템에서는 음소 분할은 Microsoft Speech API 엔진 SAPI에서 제공하는 49개의 음소를 참조하여 한글에 사용되는 음소들을 모음 8개, 자음 13개로 분류하였다. 또한 모음과 자음의 발음들은 다양한 입모양을 가지지만 일부 동일한 입모양에 대하여 같은 Viseme을 적용할 수 있도록 구현하였다. 이를 바탕으로 파이썬(Python) 기반의 오토 립싱크 Maya 플러그인을 개발하여 립싱크 애니메이션이 한 번에 자동으로 구현할 수 있게 하였다.

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.369-379
    • /
    • 2016
  • 본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.

생리적 발성 기법의 변성발성장애 치료 적용 효과 (The Therapeutic Effects of $SKTCLP^{(R)}$ in Patients with Mutational Dysphonia)

  • 김성태;남순열
    • 말소리와 음성과학
    • /
    • 제3권2호
    • /
    • pp.99-105
    • /
    • 2011
  • The treatment for patients with mutational dysphonia typically is useful with vegetative phonation, but has not yet been studied. This study attempts to identify the effect of $SKTCLP^{(R)}$ using throat clearing and laughing in patients with mutational dysphonia. The study, which was designed by the author, included 26 patients aged from 14 to 32 years (mean: 18.7 years) who had been diagnosed with mutational dysphonia between January 2007 and June 2010. Voice therapy for these patients included $SKTCLP^{(R)}$, ranging from two to seven sessions (mean: 3.8 sessions). Results were evaluated by videostroboscopy, perceptual evaluation of GRBAS scale, aerodynamic test, and acoustic analysis before and after therapy. Most patients could phonate with low pitch from the beginning and sustain with normal pitch sound in the last session. We had found that glottic gap reduced after therapy and anterior-posterior compression of superior laryngeal part at the first time, and these patients had complete closure of the glottis after treatment. The results of acoustic and aerodynamic measures after treatment indicated significant decreases in Fo, Jitter, Shimmer, SFF, and SPI, and increases in MPT, Psub, and vocal efficiency (p<.05). $SKTCLP^{(R)}$ may be a useful treatment method in managing mutational dysphonia. We can suggest this technique may be useful in improving the voice quality of other functional dysphonia having glottal chink or functional aphonia.

  • PDF

감성인식과 핵심어인식 기술을 이용한 고객센터 자동 모니터링 시스템에 대한 연구 (A Study on the Automatic Monitoring System for the Contact Center Using Emotion Recognition and Keyword Spotting Method)

  • 윤원중;김태홍;박규식
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.107-114
    • /
    • 2012
  • 본 논문에서는 고객의 불만관리 및 상담원의 상담품질 관리를 위한 고객센터 자동 모니터링 시스템에 대한 연구를 진행하였다. 제안된 시스템에서는 평상/화남의 2가지 감성에 대한 음성 감성인식 기술과 핵심어인식 기술을 사용하여 상담내역에 대한 보다 정확한 모니터링이 가능하고, 욕설, 성희롱 등의 언어폭력을 일삼는 고객에 대한 전문상담 및 관리가 가능하다. 서로 다른 환경에서 구축된 이종 음성 DB를 이용하여 불특정 고객들의 질의 음성에 안정적으로 동작할 수 있는 알고리즘을 개발하였으며, 실제 고객센터 상담내역 데이터를 이용하여 성능을 검증하였다.

VSELP 부호화기의 음질 및 주기탐색 개선에 관한 연구 (A Study on Improving Voice Quality and Pitch Searching of the VSELP Coder)

  • 성기철;문상재
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.740-749
    • /
    • 1994
  • 본 논문에서는 기존의 PSELP음성 부호화기의 성능을 개선하는 방법들을 제안하였다. 혼합 방법에 의한 주기추출법을 제안하여 기존의 PSELP음성 부호화기의 피치 주기 탐색시간을 줄였으며, 장기 필터(long term filter)의 출력 여기신호에서의 양자화 오차로 인해 발생할 수 있는 주기추출 오류를 개선시켰다. 또한 주기성을 향상기키고 잡음을 줄이기위해 본 논문에서 제안한 주기성 향상 필터를 복호기의 여기신호에 적용하여으며, 합성된 음성신호에서 음의 명료도를 높이기 위해 적응 일차 필터를 적용하였다. 작시한 방식과 필터를 적용한 결과 주기탐색시간이 기존에 대해 26%로 줄었으며, 최종합성음의 MOS(mean opinion score) 측정기에서 기존함성음은 3.19를 나타낸데 비해 개선된 합성읍의 4.04를 나타내었다.

  • PDF

EVRC와 G.729A 간의 상호부호화 (A Transcoding Algorithm between EVRC and G.729A)

  • 권구락;고성제
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.54-60
    • /
    • 2006
  • 본 논문에서는 EVRC와 G.729A 음성부호화기를 위한 상호부호화 알고리듬을 제안한다. 다른 음성 표준을 사용하는 통신망간에 음성신호를 연동시키는 가장 간단한 방법은 이중 부/복호화 (tandem coding) 방법이다. 이 방법은 두 번의 부/복호화 과정을 거치기 때문에 많은 계산량이 요구되며 아울러 음성 지연이 발생하게 된다. 이러한 문제점들을 개선하기 위하여 상호부호화를 사용한다. 상호부호화는 LSP (Line Spectral Pair) 변환과 피치 지연 변환 그리고 지연 시간 단축 알고리듬을 통하여 수행한다. 제안된 알고리듬은 $18{\sim}22%$의 적은 계산량과 $5{\sim}10ms$의 짧은 지연으로 상호 부/복호화에 상응하는 음성 품질을 제공함을 실험을 통해 확인할 수 있다.

An Acoustic and Aerodynamic Study of Consonants in Cheju

  • Cho, Tae-Hong;Jun, Sun-Ah;Ladefoged, Peter
    • 음성과학
    • /
    • 제7권1호
    • /
    • pp.109-141
    • /
    • 2000
  • Acoustic and aerodynamic characteristics of Cheju consonants were examined with the focus on the well-known three-way distinction among stops (i.e., lenis, fortis, aspirated) and the two-way distinction between sand s*. Acoustic parameters examined for the stops included VOT, relative stop burst energy, Fo at the vowel onset, H1-H2, and H1-F2 at the vowel onset. For the fricatives s and s*, acoustic parameters were fricative duration, Fo, centroid of the fricative noise, RMS energy of the frication, H1-H2 and Hl-F2 at the onset of the following vowel. In investigating aerodynamics, intraoral pressure and oral flow were included for the bilabial stops. Results indicate that, although Cheju and Korean are not mutually intelligible, acoustic and aerodynamic properties of Cheju consonants are very similar in every respect to those of the standard Korean. Among other findings there are three crucial points worth recapitulating. First, stops are systematically differentiated by the voice quality of the following vowel. Second, stops are also differentiated by aerodynamic mechanisms. The aspirated and fortis stops are similar in supralaryngeal articulation, but employ a different relation between intraoral pressure and flow. Finally, our study suggests that the fricative s is better categorized as 'lenis' than as 'aspirated' in terms of its phonetic realization.

  • PDF

MRI에 의한 모음의 성도 단면적 측정 및 면적 변이에 따른 합성 연구 (Measurement of the vocal tract area of vowels By MRI and their synthesis by area variation)

  • 양병곤
    • 음성과학
    • /
    • 제4권1호
    • /
    • pp.19-34
    • /
    • 1998
  • The author collected and compared midsagittal, coronal, coronal oblique, and transversal images of Korean monophthongs /a, i, e, o, u, i, v/ produced by a healthy male speaker using 1.5 T MR, VISION. Area was measured by computer software after tracing the cross-section at different points along the tract. Results showed that the width of the oral and pharyngeal cavities varied compensatorily from each other on the midsagittal dimension. Formant frequency values estimated from the area functions of the seven vowels showed a strong correlation (r=0.978) with those analyzed from the spoken vowels. Moreover, almost all of 35 students who listened to the synthesized vowels from area data perceived the synthesized vowels as equivalent to the spoken ones. Movement of constriction points of vowel /u/ with wider lip opening sounded /i/ and led to slight changes in vowel quality. Jaw and tongue movement led to major volume variation with an anatomical limitation. Each comer vowel varied systematically from a somewhat constant volume of the average area. Thus, the author proposed that any simulation studies related to vocal tract area variation should reflect its constant volume. The results may be helpful to verify exact measurement of the vocal tract area through vowel synthesis and a simulation study before having any operation of the vocal tract.

  • PDF

RELP 방식을 이용한 디지털 음성 응답기 (A Digital Audio Respose System Based on the RELP Algorithm)

  • 김상용;은종관
    • 대한전자공학회논문지
    • /
    • 제21권6호
    • /
    • pp.7-16
    • /
    • 1984
  • 본 논문에서는 디지탈 자동 음성 응답장치의 개발에 관하여 전반적인 사항을 기술하였다. 개발된 디지탈 음성 응답 장치는 전화국에서 가입자가 전화번호를 문의하였을 때 자동 응답할 구 있도록 특별히 구성된 시스템이다. 본 시스템의 구현 algorithm으로는 pitch predictive loop(PPL)을 가지는 RELP(residual excited linear pediction)방식을 사용하였는데 system memory는 비교적 적은 반면 음질은 아주 좋은 것이 개발된 자동 응답기의 큰 장점이라 하겠다. Hardware는 bit-slice microprocessor를 사용한 음성 합성기와 controller 및 I/O로 이루어져 있는데 이들은 실시간 신호처리와 시스템의 적응성 및 신뢰성을 고려하여 설계하였다.

  • PDF