• 제목/요약/키워드: voice change

검색결과 360건 처리시간 0.029초

백색소음 환경에서 음성안내레벨 적응에 관한 연구 (On an Adaptation of Announcement Sound Level in White Noise Environment)

  • 윤종진;배명진
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.112-118
    • /
    • 2012
  • 일상생활에서 음성안내 시스템을 이용한 안내 방송을 많이 접하게 되는데, 이러한 신호에 주변잡음이 추가되면 그 명료도가 떨어져서 이해하기가 곤란하다. 주변잡음은 항상 일정한 것이 아니라 시시각각 변화하는 불안정한 신호이다. 이렇게 불안정한 신호에 맞춰 출력신호를 조절하기는 어렵다. 본 논문에서는 백색소음 환경에서 잡음의 변화에 따라 음성안내출력신호를 적응적으로 변화시키는 방법을 제안하였다. 주변잡음은 열화된 방송신호에서 저장된 출력신호의 차로 구했다. 이 신호를 이용하여 신호대 잡음비를 추정하였으며, 음성안내레벨은 잡음의 변화에 따라 적응적으로 변하게 된다. 제안한 방법은 청자의 어음변별력을 향상시켜주며, 엠프의 에너지를 효율적으로 사용하는 장점이 있다.

성대구증의 형태에 따른 음향학적 분석 및 치료 결과 (Voice Analysis and Treatment Result According to Configuration of Sulcus Vocalis)

  • 양호철;정병서;김동영;우주현
    • 대한후두음성언어의학회지
    • /
    • 제23권2호
    • /
    • pp.119-123
    • /
    • 2012
  • Background and Objectives : Sulcus vocalis could be classified into type I, type IIa, and type IIb. There have been a little reports about voice quality and treatment results related with types of sulcus vocalis. The authors conducted an analysis of voice and treatment according to different types of sulcus vocalis. Materials and Methods : This study was based on a retrospective chart review. The sulcus types were classified into type I and type II. Objective and subjective voice assessments were analyzed. Patients were treated individually with voice therapy, percutaneous steroid injection, and injection laryngoplasty. Comparison was performed on the voice difference between type I group and type II group, and between pre-treatment and post-treatment of each types. Results : One hundred and one patients were enrolled into this study, and 49 patients were type I and 52 patients were type II. Type I group showed longer mean maximal phonation time (MPT) than type II group, although other voice parameters didn't show any difference between two groups. Even after the management, almost all of the voice parameters didn't show improvement except MPT of type II group. Conclusion:Although the type I sulcus has been known as a non-pathologic lesion, it can result in some degree of voice change and discomfort, and thus need an active management. In this study, voice therapy, percutaneous steroid injection, and injection laryngoplasty showed limited effect to the both types of sulcus vocalis. Further studies for management of sulcus vocalis were needed.

  • PDF

양성 성대 질환 환자의 후두 미세 수술 전후 음성 장애 지수 및 음성 분석의 유용성 (Validity of Voice Handicap Index and Voice Analysis following Laryngeal Microsurgery for Benign Vocal Cord Lesions)

  • 박영학;이정학;주영훈;박성신;방충일;김민식;조승호
    • 대한후두음성언어의학회지
    • /
    • 제16권1호
    • /
    • pp.23-27
    • /
    • 2005
  • Background and Objectives : Voice disorders can cause problems in patients with benign vocal cord lesions emotionally, physically, economically and functionally. Neither subjective nor objective voice examinations can evaluate such factors adequately. The Voice Handicap Index (VHI) subjectively evaluates voice disorders in terms of physical, functional, emotional factors and measures the patient's perception of the impact of voice disorder. The purpose of this study is to evaluate the usefulness of VHI in the patients with benign vocal cord lesions. Materials and Method : The authors evaluated 37 patients who experienced laryngeal microsurgery for benign vocal cord lesions from september 2003 to August 2004. The VHI was used to measure the postoperative changes of the patient's perception and acoustic analysis and aerodynamic tests were also done. Statistical analysis was done using paired t-test and Pearson's correlation. Results : The VHI scores showed statistically significant reductions postoperatively. In acoustic analysis, jitter and shimmer had statistically significant reductions after surgery but noise-to-harmonics ratio did not. A statistically significant change in the average MFR and MPT perioperatively was found. The relationship between VHI and acoustic, aerodynamic analysis attained statistical significance. Conclusion : The VHI is a useful assessment tool to monitor the patient's self-perception of voice change after the surgery of benign vocal cord lesions. The VHI measurement, when combined with acoustic and aerodynamic analyses, will be helpful in comparing functional outcomes after voice surgery.

  • PDF

노인애성환자에 대한 임상적연구 (Clinical Study of Aged Patients with Hoarseness)

  • 안철민;권기환
    • 대한후두음성언어의학회지
    • /
    • 제7권1호
    • /
    • pp.27-31
    • /
    • 1996
  • The voice of aged persons is known generally to be somewhat different from that of other adults, suggesting that laryngeal change occurs with advancing age. However, because knowledge of the voice characteristics of aged persons is limited, it is difficult to judge whether their voices arc normal. Chart review and laryngoscopic examination from ninety-one patients with hoarseness over the age of 60(1st group) and one hundred sixteen patients with hoarseness below the age of 50(2nd group) were done to define aging related voice disorders. The following results were obtained. 1) Associated diseases related to laryngeal disease were hypertension(12%), pulmonary disease(4.4%), thyroid disease(1.1%) in 1st group and hypertension(9.5%), thyroid disease(1.7%) in 2nd group. 2) The underlying diseases causing hoarseness in order of frequency were benign vocal fold lesion(37.7%), inflammatory disease(36.8%), functional dysphonia(17%) in 1st group and benign vocal fold lesion(43.6%), functional dysphonia(26.3%), inflammatory disease(16.5%) in 2nd group. 3) In stroboscopic findings, atrophy and sulcus of vocal cords are more prevalent in males than in females and edema of vocal cords is more common in females. Generally the voice characteristics of aged persons depend on the mass of the vocal folds which may be decreased through atrophy or be increased by edema. However, other factors such as systemic diseases, drug side effects and compensatory mechanism to presbylaryngis must be taken into account in diagnosing and treating voice disorders in aged persons.

  • PDF

후두음성 질환에 대한 인공지능 연구 (Artificial Intelligence for Clinical Research in Voice Disease)

  • 석준걸;권택균
    • 대한후두음성언어의학회지
    • /
    • 제33권3호
    • /
    • pp.142-155
    • /
    • 2022
  • Diagnosis using voice is non-invasive and can be implemented through various voice recording devices; therefore, it can be used as a screening or diagnostic assistant tool for laryngeal voice disease to help clinicians. The development of artificial intelligence algorithms, such as machine learning, led by the latest deep learning technology, began with a binary classification that distinguishes normal and pathological voices; consequently, it has contributed in improving the accuracy of multi-classification to classify various types of pathological voices. However, no conclusions that can be applied in the clinical field have yet been achieved. Most studies on pathological speech classification using speech have used the continuous short vowel /ah/, which is relatively easier than using continuous or running speech. However, continuous speech has the potential to derive more accurate results as additional information can be obtained from the change in the voice signal over time. In this review, explanations of terms related to artificial intelligence research, and the latest trends in machine learning and deep learning algorithms are reviewed; furthermore, the latest research results and limitations are introduced to provide future directions for researchers.

음 변화 관점에서 바라본 한국어 어두 폐쇄음의 발화 및 지각 (Production and perception of Korean word-initial stops from a sound change perspective)

  • 김진우
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.39-51
    • /
    • 2021
  • 본고에서는 2020년에 수집된 자유 발화 자료를 바탕으로 어두 폐쇄음 평음, 격음, 경음의 발화가 어떻게 달라지고 있는지 그리고 지각은 어떻게 이루어지고 있는지에 대해 자세히 살펴보았다. 기존 연구의 통제된 실험에서와 다르게, 자유 발화에서는 30대 남성까지도 VOT(voice onset time)에 의해 평음과 격음의 변별이 이루어지지 않았다. 지각실험은 언어 변화의 주도 계층인 젊은 여성 세대를 대상으로 하였다. 그 결과 어두 폐쇄음의 지각에서 F0이 평음과 나머지 둘을 변별하는 역할을 하였고, 그 다음 VOT가 격음과 경음을 변별하는 역할을 하였다. 특히 F0이 낮을 때에는 VOT의 길이가 짧든 길든 간에 항상 평음으로 지각되었다는 점은 평음의 지각에서 F0이 절대적인 역할을 한다는 것을 보여주었다. 그러나 어떤 F0의 경우에는 VOT에 따라 평음과 격음이 변별되기도 하였는데, 이는 20대 여성의 발화와 지각 체계가 일치하지 않기 때문이다. 음 변화의 관점에서 발화와 지각 체계가 일치하지 않는다는 것은 음 변화가 진행 중이라는 것을 의미하는데, 특히 20대 여성에서처럼 발화의 변화가 지각의 변화에 앞서는 경우는 음 변화가 후반 단계에 있을 때이다. 이처럼 언어 변화를 주도하는 계층에서 여전히 지각에서 이전의 체계를 유지하고 있는 이유는 그들의 부모 세대의 발화에서 VOT에 의한 평음과 격음의 변별이 이루어졌기 때문이며 이를 습득한 것이라고 볼 수 있다. 즉 다른 집단과의 소통을 위해 여전히 VOT를 지각에 사용하고 있는 것이다.

포먼트 이동과 스펙트럼 기울기의 변환을 이용한 음색 변환 (Voice Color Conversion Based on the Formants and Spectrum Tilt Modification)

  • 손성용;한민수
    • 대한음성학회지:말소리
    • /
    • 제45호
    • /
    • pp.63-77
    • /
    • 2003
  • The purpose of voice color conversion is to change the speaker identity perceived from the speech signal. In this paper, we propose a new voice color conversion algorithm through the formant shifting and the spectrum-tilt modification in the frequency domain. The basic idea of this technique is to convert the positions of source formants into those of target speaker's formants through interpolation and decimation and to modify the spectrum-tilt by utilizing the information of both speakers' spectrum envelops. The LPC spectrum is adopted to evaluate the position of formant and the information of spectrum-tilt. Our algorithm enables us to convert the speaker identity rather successfully while maintaining good speech quality, since it modifies speech waveforms directly in the frequency domain.

  • PDF

애성환자에서 음향지표인 RAP, PPQ 및 APQ의 유용성 (Significance of Acoustic Parameter - RAP, PPQ, APQ- in Hoarseness)

  • 안철민;이종혁;강현국;이용배
    • 대한후두음성언어의학회지
    • /
    • 제6권1호
    • /
    • pp.22-26
    • /
    • 1995
  • Change of voice, espicially hoarseness show irregular vibration of vocal cord. So, computerized acoustic analysis has presented many acoustic parameters for objective evaluation of voice. We objectively investigated the vocal vibration of normal persons and hoarseness patients in Korea. The RAP(relative average perturbation), PPQ(pitch period perturbation quotient) and APQ(amplitude perturbation quotient) of normal persons were compared with that of hoarseness patients with multidimensional voice program for the possibility of distinguishing the pathologic vocal vibration from normal. Authors agree that RAP, PPQ and APQ showed interesting differences between the normal and the hoarseness patients by the multivariate statistical analysis. In conculusion, relative average perturbation, pitch period perturbation and amplitude perturbation quotient might be meangingful screening parameters distinguishing hoarseness patients from normal.

  • PDF

VoiceXML과 GPS를 이용한 여행정보 서비스의 구현 (An Implementation of Travel Information Service Using VoiceXML and GPS)

  • 오재규;김선형
    • 한국산학기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.1443-1448
    • /
    • 2007
  • 본 논문에서는 기존의 웹(인터넷)기반의 정보 제공 서비스의 범주를 벗어나, 음성 및 웹 브라우저 기반의 VoiceXML을 이용하여 웹과 음성 인터페이스를 동시에 사용할 수 있고 GPS 정보의 응용이 가능한 분산 환경 기반의 여행 정보 서비스를 제안한다. 기존의 여행 정보 콜 센터의 자동응답 서비스는 사전에 제작된 시나리오대로 운영돼 이용시간이 많이 걸릴 뿐 아니라 응답 내용을 바꿀 경우 시나리오를 다시 짠 후 녹음을 다시 해야 하는 불편함이 있었으나, 제안된 VoiceXML 기반의 여행 정보 시스템은 파일형태로 개별 대화 시나리오를 만들어 서버에 내장하는 방식으로 이루어져 시스템 개편이 쉬우며, GPS 정보를 이용한 사용자의 현 위치를 인지하고 이에 따른 다양한 여행 정보 서비스를 오지 환경과 같은 환경적 제약 변수에서도 쉽게 제공할 수 있다는 장점을 가지고 있다.

  • PDF

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.