통합 검색 | Korea Science

한국어 노인 음성 데이터 증강 및 인식 연구 (A Study of Data Augmentation and Auto Speech Recognition for the Elderly)

김건희;박서윤;김한샘
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.56-60
- /
- 2023
기존의 음성인식은 청장년 층에 초점이 맞추어져 있었으나, 최근 고령화가 가속되면서 노인 음성에 대한 연구 필요성이 증대되고 있다. 그러나 노인 음성 데이터셋은 청장년 음성 데이터셋에 비해서는 아직까지 충분히 확보되지 못하고 있다. 본 연구에서는 부족한 노인 음성 데이터셋 확보에 기여하고자 희소한 노인 데이터셋을 증강할 수 있는 방법론에 대해 연구하였다. 이를 위해 노인 음성 특징(feature)을 분석하였으며, '주파수'와 '발화 속도' 특징을 일반 성인 음성에 합성하여 데이터를 증강하였다. 이후 Whisper small 모델을 파인 튜닝한 뒤 노인 음성에 대한 CER(Character Error Rate)를 구하였고, 기존 노인 데이터셋에 증강한 데이터셋을 함께 사용하는 것이 가장 효과적임을 밝혀내었다.
PDF

노인성 음성

김영호
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어의학회 2003년도 제19회 학술대회
- /
- pp.205-207
- /
- 2003
노년이 되면 후두암이나 신경장애와 같은 질환의 빈도가 증가하는 것이 사실이지만 가장 흔한 음성변화의 원인은 후두의 노화현상에 따른 것이다. 연령과 무관하게 발생하는 성대결절과 같은 질환도 노화의 영향에 따라 그 심각성이 달라지게 된다. 따라서 노인의 음성문제를 다루려면 노화과정에 대한 올바른 이해가 필수적이다. (중략)
PDF

고차 미분에너지 기반 노인 음성에서의 음성 구간 검출 알고리즘 연구 (Development of Voice Activity Detection Algorithm for Elderly Voice based on the Higher Order Differential Energy Operator)

이지연
- 디지털융복합연구
- /
- 제14권11호
- /
- pp.249-255
- /
- 2016
노인 음성은 연령에 따른 호흡, 발성, 공명 등의 생리적 변화에 의하여 다량의 잡음이 발생된다. 따라서 노인 음성으로 음성인식 및 합성, 분석 소프트웨어등과 같은 융복합 헬스케어 기기를 동작시키고자 할 때, 성능을 저하시키는 결과를 야기한다. 그러므로 노인 음성을 분석하여 그들의 목소리로 다양한 헬스케어 기기를 잘 운영할 수 있는 위한 연구 개발이 필요하다. 따라서 본 연구는 노인 음성 잡음을 고려하여 기존의 대칭 구조 고차 미분 에너지 함수를 이용하여 노인 음성에서의 음성 구간 검출 알고리즘을 연구하였으며, 자기상관함수와 AMDF 방법과 비교하여 노인 음성에서의 음성 구간 검출에 보다 우수한 성능을 가지는 것을 확인하였다. 본 논문에서 제시하는 음성 구간 검출 알고리즘은 노인을 위한 음성 인터페이스에 적용함으로써 노인들의 스마트 기기에의 접근성을 높이고, 더 나아가 노인들을 위한 융복합 웨어러블 디바이스 성능 개선 및 다양한 개발이 가능할 것으로 전망한다.
https://doi.org/10.14400/JDC.2016.14.11.249 인용 PDF KSCI

음절 별 발화속도 조절을 통한 노인 음석인식 개선 (Syllabic Speech Rate Control for Improving Elderly Speech Recognition of Smart Devices)

경주원;손귀영;권순일
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 추계학술발표대회
- /
- pp.1711-1714
- /
- 2015
스마트 디바이스가 사회와 소통할 수 있는 도구가 되었음에도 불구하고 아직까지 노인들이 사용하기에는 어려움이 있다. 여기에 음성인식 기술을 이용한 음성인터페이스를 활용함으로써 노인들의 스마트 디바이스에 대한 사용성을 높일 수 있다. 하지만 일반적인 음성인식 시스템은 청장년의 발성 스타일에 맞춰져 있기 때문에, 노화된 노인의 발성이 그대로 입력될 경우 음성인식률이 하락한다. 본 연구에서는 노인의 음절 별 발화속도가 일반적인 음성인식 시스템의 성능을 보증할 수 있는 범위를 벗어나는 경우가 많다는 분석 결과를 토대로 노인의 음절 별 발화속도를 조정한 결과 노인남녀 평균 음성인식률이 15.3% 상승하였다. 이처럼 노인의 음성인식 오류 원인들 중 하나인 발화속도의 재조정으로 음성 인식률을 높일 수 있는 토대를 마련하였다. 이는 노인들이 스마트 디바이스를 이용하여 쉽고 정확한 작업을 수행할 수 있게 됨으로써, 노인들의 사회 참여와 정보 획득이 용이해 지고 더 나아가 세대 간의 소통에도 이바지할 것으로 기대한다.
https://doi.org/10.3745/PKIPS.y2015m10a.1711 인용 PDF

노인성 음성(Aging Voice, Presbyphonia)의 치료

권택균
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어학회 2014년도 제40차 춘계학술대회
- /
- pp.34-37
- /
- 2014
PDF

노인성 음성에 대한 최신 연구동향

임재열
- 대한음성언어의학회:학술대회논문집
- /
- 대한음성언어학회 2014년도 제40차 춘계학술대회
- /
- pp.38-39
- /
- 2014
PDF

노인성 음성의 임상양상 (Clinical Manifestation of Aging Voice)

백민관;김동영
- 대한후두음성언어의학회지
- /
- 제25권1호
- /
- pp.16-19
- /
- 2014
The presbyphonia is a combination of physiological and structural changes due to aging of the larynx in elderly patients with voice problems. Some of these changes are inevitable, while others may be avoidable or reversible. The fatigue of phonation is the most common clinical symptom of the aging voice. The voice problems with aging are produced from variable causes including the organic lesions of the larynx. It is essential that the curers understand physiologic and pathologic changes of aging voice for minimizing glottal incompetence and improving vocal performance and quality of life of the elderly.
PDF

젊은 성인 및 노인 음성장애 환자의 연속발화시 공기역학적 특성 비교 (Aerodynamic Characteristics of Young and Elderly Adult Patients with Voice Disorders during Continuous Speech)

표화영
- 한국콘텐츠학회논문지
- /
- 제19권12호
- /
- pp.270-278
- /
- 2019
본 연구는 젊은 성인 음성장애 환자 집단과 노인 음성장애 환자 집단을 대상으로 문단낭독시 공기역학적 특성을 비교해보고자 시행되었다. 20-45세의 남성 음성장애 환자 12명과 60세 이상의 남성 음성장애 환자 9명이 연구에 참여하였다. PAS(Phonatory Aerodynamic System)의 Running Speech를 이용하여 문단을 낭독하게 하고 공기역학 측정치를 구하였다. 그 결과 노인집단은 젊은 성인집단보다 더 긴 지속시간과 더 적은 기류량 및 기류체적을 보였다. 그러나 그 차이는 발성지속시간에서만 유의하게 나타났다. 공기역학 측정치는 일반적으로 노인보다 젊은 성인이 모든 측면에서 비정상 소견을 보일 것이라고 예상하지만 본 연구결과 노인집단이 보인 측정치는 발성지속시간을 제외하고 기류량과 기류체적은 젊은 성인집단과 비슷한 수치를 보인것으로 나타났다. 그러므로 노인 음성장애 환자의 연속발화시 공기역학 측정치가 갖는 의미를 해석할 때 기류와 기류체적은 연령뿐 아니라 발화자료, 폐 기능 등 다양한 요건을 함께 고려해야 한다.
https://doi.org/10.5392/JKCA.2019.19.12.270 인용 PDF KSCI

제한된 학습 데이터를 사용하는 End-to-End 음성 인식 모델 (End-to-end speech recognition models using limited training data)

김준우;정호영
- 말소리와 음성과학
- /
- 제12권4호
- /
- pp.63-71
- /
- 2020
음성 인식은 딥러닝 및 머신러닝 분야에서 활발히 상용화 되고 있는 분야 중 하나이다. 그러나, 현재 개발되고 있는 음성 인식 시스템은 대부분 성인 남녀를 대상으로 인식이 잘 되는 실정이다. 이것은 음성 인식 모델이 대부분 성인 남녀 음성 데이터베이스를 학습하여 구축된 모델이기 때문이다. 따라서, 노인, 어린이 및 사투리를 갖는 화자의 음성을 인식하는데 문제를 일으키는 경향이 있다. 노인과 어린이의 음성을 잘 인식하기 위해서는 빅데이터를 구축하는 방법과 성인 대상 음성 인식 엔진을 노인 및 어린이 데이터로 적응하는 방법 등이 있을 수 있지만, 본 논문에서는 음향적 데이터 증강에 기반한 재귀적 인코더와 언어적 예측이 가능한 transformer 디코더로 구성된 새로운 end-to-end 모델을 제안한다. 제한된 데이터셋으로 구성된 한국어 노인 및 어린이 음성 인식을 통해 제안된 방법의 성능을 평가한다.
https://doi.org/10.13064/KSSS.2020.12.4.063 인용 PDF KSCI

여성 노인 합창단원의 합창단 유형에 따른 청지각적 음성평가(GRBAS) 및 음성관련 삶의 질(K-VRQOL) 비교 (A comparison of the perceptual-auditory voice quality evaluation (GRBAS) and voice-related quality of life (K-VRQOL) according to choir type of elderly women choir members)

이현정;강빈나;김수지
- 말소리와 음성과학
- /
- 제12권2호
- /
- pp.51-61
- /
- 2020
본 연구의 목적은 음성의 청지각적 평가도구(GRBAS)와 음성관련 삶의 질(K-VRQOL) 척도를 통해 합창활동에 참여하는 여성 노인의 음성 특성과 음성관련 삶의 질을 비교하는 것이다. 연구 대상은 서울 및 부산 소재의 합창단에서 활동 중인 만 60세 이상의 여성 노인으로 총 77명이었다. 합창단은 참여 유형에 따라 합창단(Regular choir)과 찬양단(Church choir) 두 개의 집단으로 분류하였다. 청지각적 음성평가는 /a/ 모음을 발성하는 음성을 듣고 전문가가 청지각적 평가(GRBAS) 척도를 사용하여 평정하였다. 연구 결과, 합창활동 참여 유형에 따라 집단 간 차이를 비교했을 때 찬양단에서 활동하는 여성 노인에 비해 합창단에서 활동하는 여성 노인의 경우 주관적 음성 인식 수준에서 대화 시 음성 사용 만족도가 높은 것으로 나타났다. 또한, 음성관련 삶의 질(K-VRQOL) 척도의 신체 기능 영역에 해당하는 문항에서 만족도가 높은 것으로 분석되었다. 본 연구는 합창활동이 노년기 음성기능의 개선뿐 아니라 음성사용의 주관적 인식 수준을 향상시키는데 긍정적인 결과를 기대할 수 있을 것이라는 점을 확인하였으며, 노인 음성개선을 위한 체계적인 음악 중재 프로그램의 필요성을 시사하고 있다.
https://doi.org/10.13064/KSSS.2020.12.2.051 인용 PDF KSCI

검색결과 50건 처리시간 0.02초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)