This study intended to verify the effects of face masks on the Korean language in terms of acoustic, aerodynamic, and formant parameters. We chose all types of face masks available in Korea based on filter performance and folding type. Two professional voice actors (a male and a female) with more than 20 years of experience who are native Koreans and speak standard Korean participated in this study as speakers of voice data. Face masks attenuated the high-frequency range, resulting in decreased Vowel Space Area (VSA) and Vowel Articulation Index (VAI)scores and an increased Low-to-High spectral ratio (L/H ratio) in all voice samples. This can result in lower speech intelligibility. However, the degree of increment and decrement was based on the voice characteristics. For female speakers, the Speech Level (SL) and Cepstral Peak Prominence (CPP) increased with increasing face mask thickness. In this study, the presence or filter performance of a face mask was found to affect speech acoustic parameters according to the speech characteristics. Face masks provoked vocal effort when the vocal intensity was not sufficiently strong, or the environment had less reverberance. Further research needs to be conducted on the vocal efforts induced by face masks to overcome acoustic modifications when wearing masks.
Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
/
v.21
no.1
/
pp.17-21
/
2010
Dysphonia is a medical terminology for voice disorders characterized by hoarseness, harshness, weakness, or even loss of voice ; any impairment in ability to produce voice sounds using the vocal organs, larynx, The causes of dysphonia can be classified into two groups, organic and functional. Functional dysphonia includes spasmodic dysphonia, muscle tension dysphonia, mutational dysphonia and conversion dysphonia, etc, The findings of laryngoscopy in these dysphonia are almost normal. Therefore, physicians should diagnosis these diseases from careful history taking and abundant understandings about the phonation pattern, Organic dysphonia is caused by anatomical problems in the larynx, especially on the vocal fold, Some lesions, however, are not easily found because these lesions are too small, or located on the lower lip of vibrating vocal fold. Laryngopharyngeal reflux induced laryngitis, vascular lesions, sulcus vocalis, vocal atropy including presbylaryngis, and mucosal tears are common lesions easily missed in laryngoscopy, Therefore, a high index of suspicion is necessary to avoid missing vocal fold mucosal lesions, and the strobovideolaryngoscopy is indispensable in making the diagnosis,
Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
/
v.8
no.1
/
pp.12-17
/
1997
Measuring phonatory stability using MDVP(Multi-dimensional voice program, Kay Elemetrics Corp., NJ, USA) are becoming popular in many Korean clinics and laboratories, yet questions about standardization and reference values have remained. The purpose of present study was to examine the effects of frequency and intensity variation on the results of acoustic analysis related to phonatory stability. Twenty young adults(ten females and ten males) were asked to sustain vowel /a/ for more than 3 seconds under 9 different pitch and loudness conditions. Using MDVP, nine voice samples were analyzed, and jitter percent, fundamental frequency variation, shimmer percent, peak amplitude variation, noise to harmonic ratio, amplitude tremor intensity index, and degree of subharmonics were compared. The results showed that intensity changes can significantly affect various phonatory stability measures, and the lowest perturbation values can be obtained from slightly louder(10dB) phonatory condition than comfortable level phonation.
Kim, Su-Hwan;Lee, Young-Jae;Kim, Young-Il;Jeong, Sang-Bae
Phonetics and Speech Sciences
/
v.2
no.4
/
pp.137-143
/
2010
In this paper, a speech endpoint detection algorithm is proposed. The proposed algorithm is a kind of state transition-based ones for speech detection. To reject short-duration acoustic pulses which can be considered noises, it utilizes duration information of all detected pulses. For the optimization of parameters related with pulse lengths and energy threshold to detect speech intervals, an exhaustive search scheme is adopted while speech recognition rates are used as its performance index. Experimental results show that the proposed algorithm outperforms the baseline state-based endpoint detection algorithm. At 5 dB input SNR for the beamforming input, the word recognition accuracies of its outputs were 78.5% for human voice noises and 81.1% for music noises.
Proceedings of the Korean Society of Broadcast Engineers Conference
/
1998.06b
/
pp.122-127
/
1998
In this paper, we focus on the information retrieval of human individuals who are recorded on the video database. Our purpose is to index persons by their faces or voice and to retrieve their existing time sections on the video data. The database system can track as well as extract a face or voice of a certain person and construct a model of the individual person in self-organization mode. If he appears again at different time, the system can put the mark of the same person to the associated frames. In this way, the same person can be retrieved even if the system does not know his exact name. As the face and speaker modeling, a subspace method is employed to improve the indexing accuracy.
Kim, Tae Hwan;Choi, Jeong Im;Lee, Sang Hyuk;Jin, Sung Min
Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
/
v.26
no.2
/
pp.117-121
/
2015
Background : Cepstral analysis which is obtained from Fourier transformation of spectrum has been known to be effective indicator to analyze the voice disorder. To evaluate the voice disorder, phonation of sustained vowel /a/ sound or continuous speech have been used but the former was limited to capture hoarseness properly. This study is aimed to compare the effectiveness in analysis of cepstrum between the sustained vowel /a/ sound and continuous speech. Methods : From March 2012 to December 2014, total 72 patients was enrolled in this study, including 24 unilateral vocal cord palsy, vocal nodule and vocal polyp patients, respectively. The entire patient evaluated their voice quality by VHI (Voice Handicap Index) before and after treatment. Phonation of sustained vowel /a/ sample and continuous speech using the first sentence of autumn paragraph was subjected by cepstral analysis and compare the pre-treatment group and post-treatment group. Results : The measured values of pre and post treatment in CPP-a (cepstral peak prominence in /a/ vowel sound) was 13.80, 13.91 in vocal cord palsy, 16.62, 17.99 in vocal cord nodule, 14.19, 18.50 in vocal cord polyp respectively. Values of CPP-s (cepstral peak prominence in text-based speech) in pre and post treatment was 11.11, 12.09 in vocal cord palsy, 12.11, 14.09 in vocal cord nodule, 12.63, 14.17 in vocal cord polyp. All 72 patients showed subjective improvement in VHI after treatment. CPP-a showed statistical improvement only in vocal polyp group, but CPP-s showed statistical improvement in all three groups (p<0.05). Conclusion : In analysis of cepstrum, text-based analysis is more representative in voice disorder than vowel sound speech. So when the acoustic analysis of voice by cepstrum, both phonation of sustained vowel /a/ sound and text based speech should be performed to obtain more accurate result.
Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
/
v.9
no.1
/
pp.66-70
/
1998
Background and Objectives : The managements of unilateral vocal cord palsy include type Ⅰ thyroplasty and arytenoid adduction. One type operation has been shown no satisfactory effect. We evaluated preoperative and postoperative speech of unilateral vocal cord palsy patients who received combined operation of type Ⅰ thyroplasty and arytenoid adduction to help for the management plan of unilateral vocal cord palsy patients. Materials and Methods : We reviewed the postoperative results and complication of 17 surgically treated patients of unilateral vocal cord palsy at Severance hospital from Nov. 1996 to Dec. 1997 retrospectively. They were received combined operation of type Ⅰ thyroplasty and arytenoid adduction. Their pre and post-operative speech were analyzed with MDVP(Multi-Dimension-Voice analysis Program) of CSL(Computerized Speech Lab). Results : After the operation, MPT(Maximal Phonation Time) was increased and MFR(Mean Flow Rate) was decreased in all patients. NHR(Noise to Harmonic Ratio) and VTI(Voice Turbulence Index) were decreased : liner, RAP(Relative Average Perturbation Quotient), PPQ(Pitch Period Perturbation Quotient), sPPQ(smoothed Pitch Period Perturbation Quotient), vFo(fundamental frequency Variation) were decreased : Shimmer, APQ(Amplitude Perturbation Quotient), sAPQ(Smoothed Amplitude Perturbation Qoutient), vAm(Peak Amplitude Variation) were decreased in all the patients. Conclusions : In unilateral vocal cord pals), combined operation of type Ⅰ thyroplasty and arytenoid adduction could obtain satisfactory postoperative voice. MDVP has many parameters and good method for evaluation of voice surgery.
Kim, Keun-Ho;Kim, Sang-Gil;Kang, Nam-Sik;Kim, Jong-Yeol
Korean Journal of Oriental Medicine
/
v.17
no.3
/
pp.97-104
/
2011
Objectives : In this paper, we proposed a method for selecting reliable variables from various vocal features such as frequency derivative features, frequency band ratios, intensities of 5 vowels and an intensity of a sentence, since some features are sensitive to the variation of a subject's utterance. Methods : To obtain the reliable voice variables, the coefficient of variation (CV) was used as the index to evaluate the level of reliability. Since the distributions of a few features are not Gaussian, but are instead skewed to the right or left, we transformed the features by taking the log or square root. Moreover, the definition of the variables that are suitable to represent the vocal property was explained and analyzed. Results : At first, we recorded the vowels and the sentence five times both in the morning and afternoon of the same day, totally ten recordings from each of six subjects (three males and three females). We then analyzed the CVs of each subject's voice to obtain the stable features with a sufficient repeatability. The features having less than 20% CVs for all six subjects were selected. As a result, 92 stable variables from the 222 features were extracted, which included all the transformed variables. Conclusions : Voice can be widely used to classify the four constitution types and to recognize one's health condition from extracting meaningful features as physical quantity in traditional Korean medicine or Western medicine. Therefore, stable voice variables can be useful in the u-Healthcare system of personalized medicine and for improving diagnostic accuracy.
Background: Adductor spasmodic dysphonia (ASD) is caused by the involuntary contraction of laryngeal muscles due to dystonia localized to the larynx. In the case of ASD, conventional treatment is mainly performed with a botulinum toxin injection. However, the botulinum toxin injection has a short-lasting effect and requires repeated injections. Alternatives are needed due to concerns over adverse effects, such as general weakness and airway aspiration caused by the botulinum toxin injection. Case report: A 46-year-old female patient with ASD complained of voice tremor and hoarseness. The combined Korean medical treatments-Ukgan-san-gami, Jakyakgamcho-tang, acupuncture, and transcutaneous electrical nerve stimulation (TENS)-were administered on the first day the patient was hospitalized. The Voice Handicap Index (VHI) was evaluated during the treatment. The VHI taken on the second day totaled 92 points. On the ninth day, 81 points were recorded. Total score gradually improved, and on the 16th day, 62 points were recorded. Combined Korean medical treatment lasted 19 days. Conclusion: The present case report suggests that a combined Korean medical treatment approach with Ukgan-san-gami, Jakyakgamcho-tang, acupuncture, and TENS might be effective for symptoms such as voice tremors and hoarseness. Combined Korean medical treatment can be a therapeutic option for patients with ASD.
Kim, Seong-Tae;Choi, Seung-Ho;Roh, Jong-Lyel;Lee, Bong-Jae;Shim, Mi-Ran;Kim, Sang-Yoon;Nam, Soon-Yuhl
Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
/
v.18
no.1
/
pp.39-43
/
2007
Background and Objectives: There are few studies reported that specifically examine the phonetic characteristics and voice handicap index (VHI) in patients with Allergic Rhinitis. This study was designed to examine phonetic characteristics and VHI in adult patients with allergic rhinitis. Materials and Methods: Forty-two male patients diagnosed as allergic rhinitis were given skin-prick test and others, aged from 20 to 56 years, and were compared with a 16 male control group with no pathology and in the same age group. The VHI was used to measure the changes of patient's perception. Acoustic and aerodynamic analysis test were done, and a nasalance test performed to measure rabbit, baby, and mother passage. Acoustic rhionometry (AR) was performed to evaluate nasal volume and nasal crosssectional area. Statistical analysis was done using independent sample t-test. Results: VHI showed significantly different score in the studied group, higher than that of control group. AR graph showed that there was no significant differences of nasal volume and nasal cross-sectional area. The Shimmer and SFF value in the group of allergic patients were higher than in the control group. MPT value in the group of allergic patients was lower than in the control group. Nasalance in allergic patients showed hypernasality all passage. Conclusion: We suggest that patients with allergic rhinitis have considerable voice problems. Most of them have hypernasality, which may be a compensatory mechanism by nasal obstruction.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.