• 제목/요약/키워드: Children's speech recognition

검색결과 14건 처리시간 0.019초

한국어에서의 성인과 유아의 음성 인식 비교 (Comparison of Adult and Child's Speech Recognition of Korean)

  • 유재권;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.138-147
    • /
    • 2011
  • 현재 한국의 음성 데이터베이스 구축 현황을 살펴보면 유아에 맞춰진 음성 데이터베이스는 구축이 되지 않은 실정이다. 국외 연구를 분석한 결과, 다양한 언어를 기반으로 유아 대상의 음성 데이터베이스가 구축되어 있다. 이는 성인의 음성과 유아의 음성은 언어학적으로 차이가 있기 때문에 유아는 유아에 맞는 음성 데이터베이스가 필요하다. 한국어에서 성인과 유아의 음성 차이를 알아보기 위해, HMM을 이용하여 유아와 성인의 음성인식을 비교하였다. 유아와 성인의 음성인식 비교는 성별, 나이별, 성도 길이 정규화의 적용 유무에 따라 실험한다. 본 논문에서는 한국어에서 유아의 음성을 유아의 음성인식기로 인식했을 때가 성인의 음성인식기로 인식했을 때 보다 월등히 인식률이 높았으며, 성도 길이 정규화의 적용이 인식률 향상에 도움이 되고 있음을 보여준다.

어린이 음성인식을 위한 동적 가중 손실 기반 도메인 적대적 훈련 (Dynamically weighted loss based domain adversarial training for children's speech recognition)

  • 마승희
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.647-654
    • /
    • 2022
  • 어린이 음성인식의 활용 분야가 증가하고 있지만, 양질의 데이터 부족은 어린이 음성인식 성능 향상의 걸림돌이 되고 있다. 본 논문은 성인의 음성 데이터를 추가로 사용하여 어린이 음성인식 성능을 개선하는 방법을 새롭게 제안한다. 제안하는 방법은 성인 학습 데이터양이 증가할수록 커지는 연령 간 데이터 불균형을 효과적으로 다루기 위해 dynamically weighted loss를 사용하여 트랜스포머 기반 도메인 적대적 훈련하는 방식이다. 구체적으로, 학습 중 미니 배치 내 클래스 불균형 정도를 수치화하고, 데이터가 적을수록 큰 가중치를 갖도록 손실함수를 정의하여 사용하였다. 실험에서는 성인과 어린이 학습 데이터 간 비대칭성에 따른 제안된 도메인 적대적 훈련의 효용성을 검증하였다. 실험 결과, 학습 데이터 내 연령 간 비대칭이 발생하는 모든 조건에서 제안하는 방법이 기존 도메인 적대적 훈련 방식보다 높은 어린이 음성인식 성능을 가짐을 확인할 수 있었다.

한국어 유아 음성인식을 위한 수정된 Mel 주파수 캡스트럼 (Modified Mel Frequency Cepstral Coefficient for Korean Children's Speech Recognition)

  • 유재권;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.1-8
    • /
    • 2013
  • 본 논문에서는 한국어에서 유아 대상의 음성인식 향상을 위한 새로운 특징추출 알고리즘을 제안한다. 제안하는 특징추출 알고리즘은 세 가지 방법을 통합한 기법이다. 첫째 성도의 길이가 성인에 비해 짧은 유아의 음향적 특징을 보완하기 위한 방법으로 성도정규화 방법을 사용한다. 둘째 성인의 음성과 비교했을 때 높은 스펙트럼 영역에 집중되어 있는 유아의 음향적 특징을 보완하기 위해 균일한 대역폭을 사용하는 방법이다. 마지막으로 실시간 환경에서의 잡음에 강건한 음성인식기 개발을 위해 스무딩 필터를 사용하여 보완하는 방법이다. 세 가지 방법을 통해 제안하는 특징추출 기법은 실험을 통해 유아의 음성인식 성능 향상에 도움을 준다는 것을 확인했다.

청각장애 유소아의 신호대소음비에 따른 문장인지 능력 (The Effect of Signal-to-Noise Ratio on Sentence Recognition Performance in Pre-school Age Children with Hearing Impairment)

  • 이미숙
    • 말소리와 음성과학
    • /
    • 제3권1호
    • /
    • pp.117-123
    • /
    • 2011
  • Most individuals with hearing impairment have difficulty in understanding speech in noisy situations. This study was conducted to investigate sentence recognition ability using the Korean Standard-Sentence Lists for Preschoolers (KS-SL-P2) in pre-school age children with cochlear implants and hearing aids. The subjects of this study were 10 pre-school age children with hearing aids, 12 pre-school age children with cochlear implants, and 10 pre-school age children with normal hearing. Three kinds of signal-to-noise (SNR) conditions (+10 dB, +5 dB, 0 dB) were applied. The results for all pre-school age children with cochlear implants and hearing aids presented a significant increase in the score for sentence recognition as SNR increased. The sentence recognition score in speech noise were obtained with the SNR +10 dB. Significant differences existed between groups in terms of their sentence recognition ability, with the cochlear implant group performing better than the hearing aid group. These findings suggest the presence of a sentence recognition test using speech noise is useful for evaluating pre-school age children's listening skill.

  • PDF

한국어-영어 이중언어사용아동의 음운인식능력 (Phonological Awareness in Korean-English Bilingual Children)

  • 박민영;고도흥;이윤경
    • 음성과학
    • /
    • 제13권2호
    • /
    • pp.35-46
    • /
    • 2006
  • This study investigated whether there are differences between Korean-English bilingual and Korean monolingual children on phonological awareness skills. Participants were 11 Korean-English bilingual children and 12 Korean monolingual children. The children's ages ranged between 6 and 7 years. The results were as follows. First, the bilingual children significantly outperformed monolingual children on overall phonological awareness tasks. The bilinguals performed significantly higher than monolinguals on all three types of phonological awareness tasks (segmentation, deletion, and blending). Second, there was a significant difference between the groups with respect to phonological units of the tasks. The bilinguals performed significantly better than monolinguals on the phonemic unit tasks, but two groups did not differ significantly on syllabic unit tasks. There was an interaction effect between unit size(syllables and phonemes) and group (bilinguals and monolinguals). Third, there were correlations for both bilingual and monolingual children between overall phonological awareness skills and word recognition skills.

  • PDF

만 3-5세 유아의 한국어 음성 데이터베이스 구축 (Speech Database for 3-5 years old Korean Children)

  • 유재권;이경옥;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제12권4호
    • /
    • pp.52-59
    • /
    • 2012
  • 유아는 만3~5세 사이에 언어 능력이 빠르게 발달하게 된다. 유아의 언어발달에 맞는 다양한 경험을 위해서는 그 시기에 맞는 콘텐츠 개발이 필요하다. 다양한 콘텐츠 개발을 위해 유아에 맞는 음성 인터페이스를 이용하는 것이 필요하지만, 한국어에서는 유아를 대상으로 한 데이터베이스가 구축이 되지 않았다. 본 논문에서는 한국어에서 만 3~5세 유아들의 객관화되고 정확한 음성 데이터 수집을 설계하기 위하여 발달시기에 맞는 적절한 단어 선정 및 성인과 다른 유아의 행동 특성 유형을 파악하는 과정을 거쳐 음성 데이터 베이스를 구축하였다. 단어의 경우 MCDI-K에서 두 단계를 걸쳐 선정하였고, 유아는 한 단어 당 세 번씩 발성하였다. 이렇게 수집된 음성 데이터는 유아별, 단어별 파일 토큰화 과정을 거쳐 데이터베이스로 구축되었다. 한국어 유아 음성 데이터베이스는 웹 페이지를 통한 기술 이전을 할 계획이며, 이를 통하여 유아들의 언어 발달에 유익한 다양한 콘텐츠 개발에 그 익일을 담당할 것으로 기대한다.

Word Recognition, Phonological Awareness and RAN Ability of the Korean Second-graders

  • Yoon, Hyo-Jin;Pae, So-Yeong;Ko, Do-Heung
    • 음성과학
    • /
    • 제12권1호
    • /
    • pp.7-14
    • /
    • 2005
  • This study investigated the reading ability of Korean second-graders and the relationship between reading and phonological awareness and RAN (Rapid Automatized Naming) ability. A language-based reading assessment battery was used. Children at the end of the Korean second-grade were still at the developmental stage of decoding skill and seemed to be at Chall's stage 1. Findings indicated significant correlations between reading ability and phonological awareness and between reading ability and RAN ability. Therefore, the importance of phonological processing could be extended to syllable-based alphabetic languages.

  • PDF

승마재활 치료에 대한 자폐성 장애 아동 부모의 인식도 조사 (A Study on Recognition Degree of horse therapy for Autistic Disorder's parents)

  • 이근민;김소영;권상남
    • 재활복지공학회논문지
    • /
    • 제6권1호
    • /
    • pp.75-81
    • /
    • 2012
  • 본 연구는 자폐성 장애 아동의 승마재활 치료에 가장 영향을 미치는 학부모의 인식은 어느 정도이며 치료효과에 대한 목적의식은 어떠한지 또한 앞으로 재활승마 치료에 대해 가지는 기대에 대해 알아보고자 하였다. 자폐성 장애 아동의 부모로 100명을 연구대상으로 설문지를 연구도구로 사용하였다. 분석방법은 빈도분석(Frequency Analysis), 교차분석Chi-square Analysis)을 활용하여 각각 분석하였다. 재활승마 치료에 대한 학부모의 인지도에서 재활승마에 대한 인식이 있고, 아동이 재활승마의 경험이 없으며, 6세~10세 학부모의 응답에서 재활승마가 효과가 있을 것이라고 응답하였다. 이해도에서 재활승마는 주로 말을 타는 신체운동이고, 치료와 운동을 겸비한 전문영역으로 구체적인 도움을 주는 방법이라고 하였으며, 재활승마는 바람직하지 못한 행동을 교정 및 개선하는 방법으로 이용되고 재활기관에서 재활승마가 필요한 것으로 이해하고 있었다. 기대도에서 재활승마 치료사가 갖추어야 할 가장 중요한 요소는 치료학(작업치료, 물리치료, 언어치료) 전공자여야 한다고 나왔고, 재활승마는 개별치료, 주 2~3회가 적당하다고 하였다.

  • PDF

증강현실 기반 어휘 지도에서 동사 목록에 대한 기초 연구 (A Basic Study of Verbs List for Vocabulary Learning Based on Augmented Reality)

  • 황보명;권순복;김선종;신범주
    • 재활복지
    • /
    • 제21권2호
    • /
    • pp.233-246
    • /
    • 2017
  • 본 연구는 디지털 세계와 물리적 세계가 접목하는 증강현실을 언어치료에 적용하기 위한 기초 연구이다. 특히, 아동들에게 동사를 지도할 때 증강현실로 구현한 동사 목록이 해당 움직임을 정확하게 나타내고 있는지와 같은 동작 타당도, 그리고 해당 동사 목록이 어휘 지도 목표로 적절한 것인지에 대한 어휘 타당도를 살펴본 연구이다. 선행 연구들을 참고하여 45개의 동사를 어휘 지도 목록으로 선정하고 이 동사들에 대하여 1급 언어재활사 자격증을 소지한 언어치료학과 교수 3명으로 하여금 어휘 타당도를 평가하도록 하였다. 그 결과, 39개 동사에서 높은 어휘 타당도를 얻었다. 높은 어휘 타당도를 얻은 39개 동사에 대한 동작 타당도를 살펴보기 위하여 언어치료 전공 석사과정 대학원생들에게 각 동사를 증강현실로 구현하여 보여주고 생각나는 동사를 기록하게 하였다. 증강현실로 구현된 동작 애니메이션을 보고 난 후 50% 이상의 대학원생이 해당 동사로 기록한 동사는 32개였다. 이차적으로는 이 32개 동사만 증강현실로 구현하여 87명의 언어치료 전공 대학생들에게 보여주고 Likert 5점 척도로 각 동사와 구현된 동작의 일치도를 평가하게 하였다. 최종적으로 30개 동사가 증강현실로 구현하여 지도하기에 타당한 동사 목록으로 선정되었다. 이 연구 결과를 바탕으로 향후 공인 타당도 및 적용 타당화 연구를 지속하여 증강현실을 활용한 어휘 평가 및 지도가 언어치료 임상 현장에서 활용되기를 기대한다.

Recent update on reading disability (dyslexia) focused on neurobiology

  • Kim, Sung Koo
    • Clinical and Experimental Pediatrics
    • /
    • 제64권10호
    • /
    • pp.497-503
    • /
    • 2021
  • Reading disability (dyslexia) refers to an unexpected difficulty with reading for an individual who has the intelligence to be a much better reader. Dyslexia is most commonly caused by a difficulty in phonological processing (the appreciation of the individual sounds of spoken language), which affects the ability of an individual to speak, read, and spell. In this paper, I describe reading disabilities by focusing on their underlying neurobiological mechanisms. Neurobiological studies using functional brain imaging have uncovered the reading pathways, brain regions involved in reading, and neurobiological abnormalities of dyslexia. The reading pathway is in the order of visual analysis, letter recognition, word recognition, meaning (semantics), phonological processing, and speech production. According to functional neuroimaging studies, the important areas of the brain related to reading include the inferior frontal cortex (Broca's area), the midtemporal lobe region, the inferior parieto-temporal area, and the left occipitotemporal region (visual word form area). Interventions for dyslexia can affect reading ability by causing changes in brain function and structure. An accurate diagnosis and timely specialized intervention are important in children with dyslexia. In cases in which national infant development screening tests have been conducted, as in Korea, if language developmental delay and early predictors of dyslexia are detected, careful observation of the progression to dyslexia and early intervention should be made.