ACF의 시간적 요소에 의한 강의실 요해도 평가 (Evaluating Speech Intelligibility of Lecture Rooms Using Temporal Factors in Autocorrelation Function(ACF))

  • 김정미;전진용
    • 한국음향학회:학술대회논문집
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • pp.271-274
    • 2001
  • 강의실의 언어 요해도에 관한 연구는 그 평가방법과 지표에 대한 주제로 꾸준히 이루어져 왔다. 기존의 지표들에서는 전체 음에너지에 대한 초기음에너지의 비율로 계산하거나(C80, D50) 주파수 대역별 음에너지의 감쇠율(RASTI)을 구하여 명료도를 평가하였다. 본 연구에서는 Autocorrelation Function (ACF)의 시간적 요소를 통해 강의실의 언어 요해도를 평가하였다. 먼저 시뮬레이션 대상 강의실에서 무향실 음원이 제시되었을 때 12개 수음점에서 음향특성을 측정$\cdot$분석하였으며 청감실험과 ACF 분석을 통해 강의실 요해도와의 상관관계 규명하였다

일반 노년층 파열음의 음향학적 특성 (Acoustic Characteristics of Stop Consonants in Normal Elderly)

  • 유현지;김향희
    • 말소리와 음성과학
    • 제7권1호
    • pp.39-45
    • 2015
  • Changes in speech production in normal elderly might be subtle and gradual. Therefore, an acoustic analysis is appropriate to identify the effect of aging on speech. For this purpose, this study examined four speech parameters; voice onset time (VOT), VOT range, $f_0$ of following vowel($f_0FV$), and $f_0FV$ difference in two age groups, old (mean age 74.57 yrs.) and young (m: 27.43 yrs.). The results show that compared to the older group the younger demonstrated significantly shorter VOTs in lenis and longer in aspirated stop. VOT ranges were relatively broad and consequently overlapped between the phonation types (e.g., lenis, fortis, aspirated). The $f_0FV$ values in the older group which are an integral parameter with VOT were lower compared with the young group. The $f_0FV$ differences in the old female group were significantly narrower than the young female group, therefore, clear distinction became difficult. In conclusion, contrast in temporal information was obscured, and the domain of glottal information was diminished on stop consonants in Korean elderly. The findings suggest that central/peripheral changes by aging could lead to a deficit in coordination between phonation and articulation.

대공간에서 전기음향 시스템에 따른 음향특성 변화 (The Effect of Sound Reinforcement Systems on the Acoustics of a Large-Span Spaces)

  • 정대업;주현경;최영지
    • 한국공간구조학회논문집
    • 제11권1호
    • pp.67-75
    • 2011
  • 본 연구는 컴퓨터 시뮬레이션을 이용하여 대공간에서 스피커 시스템의 변화에 따른 음장의 특성 변화를 검토하였다. 실의 음향특성변화는 실의 흡음력과 동시에 스피커 시스템의 지향성, 설치높이 및 개수를 조절하면서 예측 분석하였다. 연구 결과, 명료도 관련 지표인 D50 및 RASTI는 실의 흡음력 증가의 변화를 효과적으로 나타내는 것으로 분석되었다. 또 초기감쇠시간은 흡음력 증가에 따라 선형적으로 감소하였으나 저 고주파수대역에서는 오히려 증가하거나 변화를 보이지 않았으며, 잔향시간은 전체주파수대역에서 실의 흡음력 증가에 따라 감쇠하였으나 주파수대역별 결과에서는 오히려 증가하거나 비슷한 결과를 보였다. 이는 실의 음향특성이라기 보다는 감쇠구간의 비선형성에 기인한 것으로 판단된다. 스피커 시스템의 적용에 따른 분석결과, D50 및 RASTI는 실의 흡음력 증가에 크게 상관없이 거의 모든 시스템에서 'fair'이상으로 평가되었으며, 스피커의 설치위치가 높을수록 실의 흡음력 증가보다 스피커 지향특성 변화에 더 큰 영향을 받는 것으로 나타났다. 또한 스피커의 설치위치가 낮을수록 실의 잔향시간은 더 짧은 것으로 분석되었다. 시스템의 적용에 따른 잔향시간은 스피커 설치높이가 높을 경우 실의 흡음력 증가에 비례하여 감쇠하는 경향을 보였으나 스피커 설치높이가 낮은 경우 흡음력 증가에 의한 영향보다 시스템의 영향을 받는 것으로 나타났다.

상악 총의치 장착 환자 언어의 음향학적 특성 연구 (Acoustic Characteristics of Patients with Maxillary Complete Dentures)

  • 고석민;황병남
    • 음성과학
    • 제8권4호
    • pp.139-156
    • 2001
  • Speech intelligibility in patients with complete dentures is an important clinical problem depending on the material used. The objective of this study was to investigate the speech of two edentulous subjects fitted with a complete maxillary prosthesis made of two different palatal materials: chrome-cobalt alloy and acrylic resin. Three patients with complete dentures in the experiment group and ten people in the controls groups participated in the experiment. CSL, Visi-Pitch were used to measure speech characteristics. The test words consisted of a simple vowel /e/, meaningless three syllabic words containing fricative, affricated and stops sounds, and sustained fricative sounds /s/ and /$\int$/. The analysis speech parameters were vowel and lateral formants, VOT, sound durations, sound pressure level and fricative frequency. Data analysis was conducted by a series of paired T-test. The findings like the following: (1) Vowel formant one of patients with complete denture is higher than that of the control group (p<0.05), while lateral formant three of patients with complete denture is lower than that of the control group (p<0.0l). (2) Patients with complete denture produced lower speech intelligibility with low fricative frequency (/$\int$/) than control group (p<0.0). The speech intelligibility of patients with metal prosthesis was higher than that of those with resin prosthesis (p<0.05). (3) Fricative, lateral and stop sound durations of patients with complete denture were longer than those of the control group (p<0.01 and p<0.05), respectively. Total sound durations of patients with metal prosthesis were similar to that of the control group (p<0.05), while those with resin prosthesis had a shorter duration (p<0.01). This implied that those with metal prosthesis had higher speech intelligibility than those with resin prosthesis. (4) Patients with complete denture had higher sound pressure levels /t/ and /c/ than the control group (p<0.01). However, sound pressure levels for /c/ of patients with metal prosthesis or resin prosthesis was similar to the control group (p<0.05). (5) Patients with complete denture had higher fundamental frequency than the control group (p<0.01).

발성의 음향학 (Acoustics of Speech Production)

  • 안상철
    • 대한음성언어의학회:학술대회논문집
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • pp.88-102
    • 1995
  • 이 글의 목적은 조음기관의 구조와 그 움직임에 의해 발생하는 음향학적 원리를 소개하는 데 있다. 이 글에서 논의되는 부분은 모음, 마찰음, 비음, 파찰음, 유음, 이중모음, 활음 등이 모두 포함되지만 상세한 논의는 주로 모음, 마찰음, 비음에 한정하여 진행된다. 왜냐하면 이들에 대한 논의가 다른 소리의 분석에 비슷하게 적용될 수 있기 때문이다. 예를 들어 활음(glide)은 모음의 생성에 관한 설명을, 파찰음의 경우는 마찰음의 것을 수정하여 적용할 수 있다. (중략)

한국인 영어 학습자의 수준별 영어 파열음 시구간 신호 지각 연구 (A Perceptual Study of the Temporal Cues for Leveled Groups of Korean English Learners)

  • 강석한;박한상
    • 대한음성학회:학술대회논문집
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • pp.189-192
    • 2005
  • This study investigates the asymmetry effect between acoustics and perception. The examined cues are closure duration, closure voicing, VOT, release, pre-vowel duration, post-vowel duration. Five native speakers of English and 30 Korean college students participated in the present study. The results showed that high level Korean English learners parallels native speakers in their responses, while mid and low level Korean learners are substantially different from natives.

한국어 고립 단어 음성의 자음/모음/유성자음 음가 분할 및 인식에 관한 연구 (A Study on Consonant/Vowel/Unvoiced Consonant Phonetic Value Segmentation and Recognition of Korean Isolated Word Speech)

  • 이준환;이상범
    • 한국정보처리학회논문지
    • 제7권6호
    • pp.1964-1972
    • 2000
  • For the Korean language, on acoustics, it creates a different form of phonetic value not a phoneme by its own peculiar property. Therefore, the construction of extended recognition system for understanding Korean language should be created with a study of the Korean rule-based system, before it can be used as post-processing of the Korean recognition system. In this paper, text-based Korean rule-based system featuring Korean peculiar vocal sound changing rule is constructed. and based on the text-based phonetic value result of the system constructed, a preliminary phonetic value segmentation border points with non-uniform blocks are extracted in Korean isolated word speech. Through the way of merge and recognition of the non-uniform blocks between the extracted border points, recognition possibility of Korean voice as the form of the phonetic vale has been investigated.

한국어 마찰음과 파찰음의 음향학적 및 공기역학적 특성에 관한 연구 (An Acoustic and Aerodynamic Study of Korean Fricatives and Affricates)

  • 표화영;이주환;최성희;심현섭;최홍식
    • 음성과학
    • 제6권
    • pp.145-161
    • 1999
  • 21 normal Korean native speakers participated as subjects to investigate the acoustic and aerodynamic study of Korean fricatives and affricates and to make good use of the results for the patients with articulation problems. Their productions of [sa], [s'a], [ca], [$c^{h}a$], [c'a], [asa], [as'a], [aca], [$ac^{h}a$], and [ac'a] were analyzed with CSL and AP II instruments. The results are as followings: (1) Fricatives showed higher frequency in minimum and maximum frequency and longer duration than affricates. (2) Fricatives showed higher peak flow rate and longer rise time than affricates. (3) When we compared the different phonemes with each other, their differences were usually statistically significant, but when we compared CV and VCV syllables, they did not show significant difference, even VCV's showed higher and longer values than CV syllables. (4) Normaly, lax fricatives and affricates showed lower frequency and higher peak flow rate, shorter frication duration, and longer rise time.

음성전송지수를 이용한 확성전화기의 명료도 평가 방법 (A Study on the Speech Transmission Index Method for Estimating Articulation of Loudspeaking Telephony)

  • 장대영;강성훈;심동연;김천덕
    • 한국음향학회지
    • 제13권5호
    • pp.32-39
    • 1994
  • 전화기의 통화품질은 음량정격으로 규정하고 있으나, 이 방법은 핸드셋 전화기에만 국한되는 방법이다. 핸드 프리 전화기는 실내의 음장의 영향을 더 많이 받으므로 전송 특성뿐만이 아니라 주위 잡음, 에코, 잔향도 포함하여 평가하여야 한다. 따라서 핸드 프리 전화기의 품질을 평가할 수 있는 새로운 방법이 필요하다. Steeneken은 음성 전송 지수(Speech Transmission Index ; STI) 를 계산하여 음성 전송 특성을 평가하는 객관적인 방법을 제안하였다. 본 논문에서는 STI를 핸드 프리 전화기의 통화품질 평가 방법에 적용 가능성을 고찰하고, 고속으로 STI를 계산할 수 있는 시스템을 구현하였다. 이 시스템을 이용하여 잔향 시간이 다른 세군데의 실내에서 핸드 프리 전화기의 STI를 측정한 결과, 실내의 잔향시간이 길어질수록 STI가 감소되는 것을 알았다. 이 결과는 STI를 음장 특성을 포함하는 명료도 평가 방법에도 응용할 수 있다는 것을 시사하고 있다.

Zinc 함수 여기신호를 이용한 분석-합성 구조의 초 저속 음성 부호화기 (A Very Low-Bit-Rate Analysis-by-Synthesis Speech Coder Using Zinc Function Excitation)

  • 서상원;김종학;이창환;정규혁;이인성
    • 한국음향학회지
    • 제25권6호
    • pp.282-290
    • 2006
  • 본 논문에서는 1.2 kbps 의 전송률을 가지는 초 저속 음성 부호화기를 위한 방법과 구조를 제안한다. ZFE-CELP (Zinc Function Excitation-Code Excited Linear Prediction) 음성 부호화기는 선형예측 분석 후, 추출된 잔여 신호가 유성음일 경우 Zinc Function을 이용하여 부호화하고, 무성음일 경우에는 CELP 구조를 이용하여 부호화한다. 또한 Super-frame (40ms) 의 영향으로 발생하는 하모닉의 불연속 문제를 해결하기 위해 오버 샘플링을 이용한 선형 위상 합성 기법을 이용하고 Zinc 함수의 정확한 표준파형을 추출하기 위하여 분석-합성 구조를 제안한다. 제안된 초 저속음성 부호화기의 성능을 2.4 kbps의 MELP (Multi Pulse Linear Prediction) 부호화기 및 1.9kbps의 ZFE-PWI (Zinc Function Excitation-Prototype Waveform Interpolation) 음성 부호화기와 비교하였다 제안된 부호화 방법은 19kbps ZFE-PWI 부호화기와 유사한 성능을 보이는 것을 확인하였다.