• 제목/요약/키워드: Children's speech recognition

검색결과 14건 처리시간 0.019초

웹에서의 저가 음성인식 시스템의 구현 (The Low Cost Implementation of Speech Recognition System for the Web)

  • 박용범;박종일
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1129-1135
    • /
    • 1999
  • DTW 알고리즘을 이용한 고립단어 인식은 화자종속이라는 상황에 있어서는 좋은 인식 율을 제공하여 준다. 그러나 DTW 알고리즘은 검색해야 할 단어가 많을 경우 검색시간이 상대적으로 높아지게 되므로 현실적으로 적용하기가 힘들다. 웹에서의 교육용 학습 지와 같이 상황 의존적 단답형 질의 응답을 요구하는 시스템의 경우에 있어서는 주어진 질문에 대한 응답이 비교적 제한되어 있어 검색대상을 줄일 수 있다. 본 논문에서는 이와 같은 상황에서 사용할 수 있는 저가형 음성 인식기를 DTW로 구현하였다. DTW의 단점을 보완하기 위해 검색할 대상을 상황에 따라 줄이는 방법을 이용하였다. 질문에 따라 관심대상을 선정하여 이들만을 검색대상으로 삼았다. 실제적인 구현을 통하여 검색대상을 줄인 결과 높은 인식 율을 얻을 수 있었고, 그룹을 설정한 만큼의 빠른 검색시간을 얻을 수 있었다.

  • PDF

한국표준 학령전기용 단음절어표 (Korean Standard Monosyllabic Word Lists for Preschoolers, KS-MWL-P)의 심리음향기능곡선 연구 (A Study of Psychometric Function Curve for Korean Standard Monosyllabic Word Lists for Preschoolers (KS-MWL-P))

  • 신현욱;김진숙
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.534-541
    • /
    • 2009
  • 아동을 위한 단어인지도 검사 (word recognition test, WRT)는 아동의 의사소통장애정도를 진단하고, 보청기 사용을 위한 처방을 하고, 청각재활과 언어치료의 계획을 수립하고, 병변부위를 판단하는데 유용하게 사용될 수 있다. 한국표준 학령전기용 단음절어표 (Korean standard monosyllabic word lists for preschoolers, KS-MWL-P)는 문헌에서 주어진 기준을 고려하여 개발되었다. 그러나 KS-MWL-P의 저자들은 어표의 개발과정 중 단지 8명만 참여하여 분석된 심리음향 기능곡선을 검증하기 위하여 더 많은 대상을 포함한 연구를 제안하였다. 그러므로 본 연구의 목적은 KS-MWL-P 어표의 제한성을 보완하기 위하여 심리음향기능분석으로 어표의 동질성을 연구하고자 한다. 정상청력을 가진 23명의 학령전기아동을 대상으로 100개의 KS-MWL-P단어가 그림과 함께 제시되었다. -10에서 40 dB dBIH.까지 여러 강도에서 각 단어의 인지도 검사를 계산하여 20%와 80% 정답률 기준의 선형기울기로 심리음향기능곡선을 수집하고 분석하였다. 연구결과 강도에 따라 정답률이 증가하는 S자형 심리음향기능곡선이 나타났고 각 단어와 표간 통계적 유의성은 나타나지 않았다. 표간 유사한 그래프 형태를 통해 우수한 동질성을 보여주었고 표 1,2,3,4의 평균기울기는 4.48, 3.86, 4.65, 4.50 이었으며 일원 분산분석으로 분석할 때 표간 유의성이 없는 것 (p>0.05)으로 나타나서 표간 난이도의 동질성에 문제가 없는 것으로 확인되었다. 그리고 항목 번호의 순서에 따른 기울기의 P값도 표 1, 2, 3, 4에서 0.93, 0.59, 0.91, 0.70으로 모두 유의하지 않아 모든 표에서 $1{\sim}10$, $1{\sim}20$, $1{\sim}25$의 항목간 차이는 없는 것으로 나타났다. 그러나 KS-MWL-P는 낮은 번호의 항목은 더 어린 연령을 위하여 쉬운 단어로 배치하고자 하였으나 본 연구결과는 그렇지 못한 것으로 나타났다. 이러한 점을 고려할 때 어린 연령대를 위한 쉬운 단어가 낮은 항목에 배치되도록 항목의 배치를 재조정하여야 할 것으로 사료된다. 이러한 점을 제외하면 결론적으로 KS-MWL-P는 학령전기를 위한 임상과 재활의 평가 및 훈련도구로 유용한 것으로 입증되었다.

이미지 분석과 딥 러닝을 통한 영유아 위험물 탐지 (Detection of Dangerous Things to Infants through Image Analysis and Deep Learning)

  • 김휘준;박길섭;서영학;김경섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.845-848
    • /
    • 2017
  • 본 논문은 이미지 탐지 모델인 Faster R-CNN을 통해 영유아가 존재하는 어린이 집, 공원, 놀이터, 거실 등의 2D 이미지를 읽어 영유아에게 위험이 되는 요소를 인식해 위험상황을 감지하는 시스템을 구현하였다. 실생활에서 쉽게 구할 수 있는 데이터를 바탕으로 탐지 모델을 구현 했으며 현재 머신 러닝 분야가 음성인식과 행위데이터를 기반으로 상용화 되어 있는 반면 본 모델은 이미지를 데이터로 한 탐지 모델이 다양한 서비스 분야에서 활용 될 수 있음을 보여준다.

주관적 평가법을 이용한 초등학교 저학년 교실의 청취환경 조사 (Investigation of the listening environment for lower grade students in elementary school using subjective tests)

  • 박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제40권3호
    • /
    • pp.201-212
    • /
    • 2021
  • 본 연구는 만 9세 이하 아동과 같은 청력 비완전자에게 적합한 교실의 음향성능 기준을 제시하기 위한 사전연구로써 수행되었다. 이를 위해 초등학교 저학년 교실의 청취환경 특성을 분석하기 위하여 청주시 소재 초등학교 2곳에서 총 264명의 학생을 대상으로 설문조사 및 음성명료도 평가와 같은 주관적 평가를 진행했다. 설문조사 결과 학생들이 수업 내용 이해에 가장 도움이 되는 정보형식은 교사의 음성이라고 응답했다. 또한 현재 교사의 음성에 대해 음량은 '보통' 수준이며 명료도에는 높은 만족도를 보이고 있었다. 교실의 음향성능에 대해서도 소음의 경우 '보통'이며 잔향감은 '매우 짧다'는 의견이 가장 많아서 청취환경에 대한 전반적인 만족도가 높은 편인 것으로 파악되었다. 또한 초등학교 저학년 학생들을 위해 선별된 시험용 단어목록을 이용해 음성명료도 평가를 수행한 결과 만 8세 아동의 경우 음원으로부터의 종축거리가 음성인지에 영향을 미치는 요인임을 유추해볼 수 있었다.