• 제목/요약/키워드: speech-impaired people

검색결과 32건 처리시간 0.031초

말속도가 인공와우 청각장애인의 문장지각에 미치는 영향 (Effects of Speech Rate on the Sentence Perception of Adults with Cochlear Implantation)

  • 신수진;신지철;윤미선;김덕용
    • 음성과학
    • /
    • 제13권2호
    • /
    • pp.47-58
    • /
    • 2006
  • People tend to control their speech rate to help those with listening problems such as hearing impaired people. The aim of this study was to investigate effects of speech rate on the sentence perception by 10 adults with cochlear implantation. The sample speech included 42 sentences at normal, slow, and very slow speed focusing on the overall duration, vowel or pause duration. The subjects listened to the speech and wrote down what they heard. Each correct syllable of the content words in the sentence was counted to obtain the score. Partial points were given to the incomplete syllables. Results of this study were as follows: 1. The changes of speech rate had some influence on the sentence perception score by the cochlear implanted people. 2. In slow pause condition, the controlled speech rate had a positive effect on the perception score.

  • PDF

언어장애인의 스마트스피커 접근성 향상을 위한 개인화된 음성 분류 기법 (Personalized Speech Classification Scheme for the Smart Speaker Accessibility Improvement of the Speech-Impaired people)

  • 이승권;최우진;전광일
    • 스마트미디어저널
    • /
    • 제11권11호
    • /
    • pp.17-24
    • /
    • 2022
  • 음성인식 기술과 인공지능 기술을 기반으로 한 스마트스피커의 보급으로 비장애인뿐만 아니라 시각장애인이나 지체장애인들도 홈 네트워크 서비스를 연동하여 주택의 전등이나 TV와 같은 가전제품을 음성을 통해 쉽게 제어할 수 있게 되어 삶의 질이 대폭 향상되었다. 하지만 언어장애인의 경우 조음장애나 구음장애 등으로 부정확한 발음을 하게 됨으로서 스마트스피커의 유용한 서비스를 사용하는 것이 불가능하다. 본 논문에서는 스마트스피커에서 제공되는 기능 중 일부 서비스를 대상으로 언어장애인이 이용할 수 있도록 개인화된 음성분류기법을 제안한다. 본 논문에서는 소량의 데이터와 짧은 학습시간으로도 언어장애인이 구사하는 문장의 인식률과 정확도를 높여 스마트스피커가 제공하는 서비스를 실제로 이용할 수 있도록 하는 것이 목표이다. 본 논문에서는 ResNet18 모델을 fine tuning하고 데이터 증강과 one cycle learning rate 최적화 기법을 추가하여 적용하였으며, 실험을 통하여 30개의 스마트스피커 명령어 별로 10회 녹음한 후 3분 이내로 학습할 경우 음성분류 정확도가 95.2% 정도가 됨을 보였다.

A Design and Implementation of Speech Recognition and Synthetic Application for Hearing-Impairment

  • Kim, Woo-Lin;Ham, Hye-Won;Yun, Sang-Un;Lee, Won Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.105-110
    • /
    • 2021
  • 본 논문에서는 STT(Speech-to-Text), TTS(Text-to-Speech) API와 가속도 센서 기반의 청각 장애인의 의사소통을 도와주는 안드로이드 모바일 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 청각 장애인의 대화 상대가 말하는 것을 마이크로 녹음하고 STT API를 이용하여 텍스트로 변환하여 청각 장애인에게 보여주는 기능을 제공한다. 또한, TTS API를 이용하여 청각 장애인이 문자를 입력하면 음성으로 변환하여 대화 상대에게 들려준다. 청각 장애인이 스마트폰을 흔들면 이 애플리케이션이 실행하도록 가속도 센서 기반의 백그라운드 서비스 기능을 제공한다. 본 논문에서 구현한 애플리케이션은 청각 장애인들이 다른 사람과 의사소통을 할 때 영상통화로 수화를 이용하지 않고 쉽게 대화할 수 있는 기능을 제공한다.

난청인의 통화 청취도 향상을 위한 전화기 개발연구 (A Study on the Development of Telephone for Improvement of the Hearing Impaired's Listening)

  • 이상민;우효창;김동욱;송철규;이영묵;김원기
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 추계학술대회
    • /
    • pp.111-113
    • /
    • 1996
  • The impaired person and the elderly who has hearing loss have been continuously increased and these people's desire for participating society as a producer has been increased also. So they strongly request the aid device which can compensate their handicap. The healing aid telephone is one of the basic aid devices that helps the hearing impaired to communicate with other people and to acquire useful information. We design the new model of the hearing aid telephone and test it's efficiency in three fields - electrical, speech perception, user test. From the result of the test we certify that the new model is better for the hearing impaired to understand the meaning of telephone speech than the old general models. We expect that the advanced healing aid telephone can be developed by the research about speech perception characteristics of the hearing impaired in engineering and clinical side.

  • PDF

중증언어장애자 의사소통지원시스템에 관한 연구 (A study on Communication Aid System for the Person of a Serious Speech Impaired)

  • 박정화;박수현
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.45-52
    • /
    • 2010
  • 언어 및 신체장애가 있는 사람들은 의사소통을 하는데 많은 시간이 소요되거나 불가능한 경우도 있으므로 컴퓨터를 이용한 보완 대체 의사소통시스템은 장애인들의 의사소통을 도와주는 중요한 도구이다. 그러나 신체장애를 가진 사람들은 키보드, 마우스 등의 입력장치를 원활하게 사용하지 못하므로 단순한 입력만으로 시스템을 사용하여 의사소통을 할 수 있어야 한다. 따라서 본 논문에서는 간단한 입력만으로 의사소통을 할 수 있는 의사소통지원시스템을 설계하고 구현하였다. 장애인들이 많이 사용하는 빈출문장들을 수집하여 9개 생활언어 그룹으로 분류하여 제시하므로, 몇 번의 선택 동작만을 이용하여 자신이 원하는 문장을 찾을 수 있도록 하였다. 원하는 문장이 없는 경우에는 천지인 자판을 제공하므로 문장을 만들 수 있고, 만들어진 문장을 빈출문장 그룹에 포함시켜서 다음번에 사용할 수 있도록 하였다. 또한 각 그룹에 속한 문장들은 사용자의 사용 빈도에 따라 순위를 바꾸어 줌으로써 가능한 입력 횟수를 감소시킬 수 있도록 개발하였다.

디지털 보청기에서의 포먼트 강조에 의한 마스킹 효과 연구 (A Study of Acoustic Masking Effect from Formant Enhancement in Digital Hearing Aid)

  • 전유용;길세기;윤광섭;이상민
    • 전자공학회논문지SC
    • /
    • 제45권5호
    • /
    • pp.13-20
    • /
    • 2008
  • 청력 손실을 보상하고 난청인이 다른 사람들과 대화할 수 있도록 디지털 보청기 알고리즘은 개발 되어 왔음에도 불구하고, 디지털 보청기 사용자들은 음성을 듣는데 어려움이 있다고 불만을 토로한다. 그 이유는 피드백이나 잔여 노이즈 등에 의해 디지털 보청기를 통한 음성의 질이 이해하기에 불충분하기 때문이다. 또 다른 이유로 포먼트들 사이에서 일어나는 마스킹 현상이 될 수 있다. 이 연구에서 정상 청각 피험자와 노인성 난청을 갖고 있는 난청인 피험자의 마스킹 특성을 측정하여 음성에서의 마스킹에 의한 음성 인지 저하를 확인하기 위한 실험을 하였다. 실험은 순음검사, 어음 청취 역치 검사, 낱말 분별력 검사, 수음 마스킹 검사, 어음 마스킹 검사의 5개 테스트로 이루어졌다. 어음 마스킹 검사에서 각각 어음 세트에 25개의 어음이 사용되었다. 각 어음의 왜곡을 객관적으로 평가하기 위해서 log likelihood ratio (LLR)를 도입하였다. 결과적으로 포먼트 향상의 양을 늘리면 늘릴수록 어음 인지는 낮아졌고, 각 어음 세트에서 각각의 향상된 어음은 통계적으로 비슷한 LLR을 갖지만 어음인지는 그렇지 않게 나타났다. 이것은 왜곡이 아닌 음향 마스킹이 어음 인지에 영향을 준다는 것을 의미한다. 실제로 피험자들 대부분이 맞추지 못한 음성을 주파수 분석한 결과 첫 번째와 두 번째 포먼트 사이의 레벨 차이가 약 35dB이며 이는 순음 마스킹 실험 결과(정상 청각 피험자:36.36dB, 난청인 피험자:32.86dB)와 비슷한 양상을 보였다. 실험 결과에서 볼 수 있듯이 음향 마스킹의 특성은 정상 청각인과 난청인 사이에서 다르게 나타난다. 그렇기 때문에 보청기 착용 전 마스킹 특성을 검사하고, 피팅 시에 적용해야 한다.

시각장애인의 정보 접근성 향상을 위한 모바일 신문 어플리케이션 인터페이스 (A Mobile Newspaper Application Interface to Enhance Information Accessibility of the Visually Impaired)

  • 이승환;홍성호;고승희;최희연;황성수
    • 한국HCI학회논문지
    • /
    • 제11권3호
    • /
    • pp.5-12
    • /
    • 2016
  • 최근 TTS(Text-to-Speech)기능을 활용한 시각 장애인의 스마트폰 사용이 계속 증가하고 있다. TTS기능은 어플리케이션 내부의 문자 정보를 음성정보로 전환하며, 어플리케이션 내 정보를 순차적으로만 접근할 수 있다. 이러한 이유로 어플리케이션 내부의 버튼 및 콘텐츠의 배치가 효과적으로 이루어져야 한다. 그러나 기존에 제안된 모바일 어플리케이션, 특히 다양한 콘텐츠가 포함된 신문 어플리케이션의 경우 TTS 사용 환경을 고려하지 않았다. 따라서 시각 장애인들이 이용하기에 매우 어려운 상황이다. 또한 전맹인 이외에도 저시력 장애인을 고려한 인터페이스가 필요한 상황이다. 따라서 본 논문은 다양한 시각장애인의 접근성과 요구를 반영한 모바일 신문 어플리케이션 인터페이스를 제안한다. 제안하는 인터페이스는 TTS 사용 환경을 고려한 버튼 배치 및 검색 기능 및 이미 읽은 기사 분류 기능을 통해 빠르게 어플리케이션을 사용할 수 있게 하였다. 또한 잘못 발음되는 단어를 필터링하고 버튼에 대한 충분한 설명을 통해 어플리케이션을 원활하게 사용할 수 있게 하였다. 마지막으로 저시력 장애인을 위해 글자 크기 확대, 화면 반전 기능 등을 구현하였다. 실험 결과 제안하는 인터페이스가 일반 신문 어플리케이션 및 기존에 제안된 시각장애인용 인터페이스보다 기사 검색 속도 및 어플리케이션 사용성 측면에서 높은 성능을 나타내는 것을 확인하였다.

난청인의 주파수 선택도와 비대칭적 청각 필터를 고려한 난청 시뮬레이터 개발에 관한 연구 (A Study on Development of a Hearing Impairment Simulator considering Frequency Selectivity and Asymmetrical Auditory Filter of the Hearing Impaired)

  • 주상익;강현덕;송영록;이상민
    • 전기학회논문지
    • /
    • 제59권4호
    • /
    • pp.831-840
    • /
    • 2010
  • In this paper, we propose a hearing impairment simulator considering reduced frequency selectivity and asymmetrical auditory filter of the hearing impaired, and we verified the reduced frequency selectivity and asymmetrical auditory filter affected in speech perception through experiments. The reduced frequency selectivity has made embodied by spectral smearing using LPC(linear prediction coding). The shapes of auditory filter are asymmetrical different with each center frequency. Hearing impaired person which has hearing loss was differently changed with that of normal hearing people and it has different value for speech of quality through auditory filter. The experiments confirmed subjective test and objective test. The subjective experiments are composed of 4 kinds of tests: pure tone test, SRT(speech reception threshold) test, and WRS(word recognition score) test without spectral smearing, and WRS test with spectral smearing. The experiment of the hearing impairment simulator was performed from 9 subjects who have normal ears. The amount of spectral smearing was controlled by LPC order. The asymmetrical auditory filter of proposed hearing impairment simulator was simulated and then some tests to estimate the filter's performance objectively were performed. The objective experiment as simulated auditory filter's performance evaluation method used PESQ(perceptual evaluation of speech quality) and LLR(log likelihood ratio) for speech through auditory filter. The processed speech was evaluated objective speech quality and distortion using PESQ and LLR value. When hearing loss processed, PESQ and LLR value have big difference according to asymmetrical auditory filter in hearing impairment simulator.

난청인의 난청 정도에 따른 비대칭 청각 필터 구현의 객관적 평가 (An Objective Estimation for Simulating of Asymmetrical Auditory Filter of the Hearing Impaired According to Hearing Loss Degree)

  • 주상익;전유용;송영록;이상민
    • 재활복지공학회논문지
    • /
    • 제3권1호
    • /
    • pp.27-34
    • /
    • 2009
  • 난청인의 청력 손실은 개인별로 다양하므로 기존의 대칭적으로 주파수 밴드별 청각 필터를 구현하는 방법은 다양한 형태의 난청인의 청력 손실을 적절하게 모사해주지 못한다. 각 중심주파수와 음성의 입력크기에 따라 청각 필터의 형태가 비대칭적으로 바뀌고 청력손실이 있는 난청인은 청력 손실에 따라 청각필터의 형태가 정상인들과는 다른 형태로 바뀌게 되며 음질에도 차이가 있다. 본 연구에서는 난청인의 난청 정도에 따라 변하는 비대칭 청각 특성을 잘 반영한 청각필터를 구현하여 몇 가지 실험을 통해 각 구현된 청각 필터의 성능을 객관적으로 평가하였다. 실험은 구현된 청각 필터를 통한 음성의 perceptual evaluation of speech quality (PESQ) 와 log likelihood ratio (LLR)를 사용하였으며 그 값을 통해 처리된 음성의 객관적인 음질과 왜곡정도를 평가 하였다. 청력 손실을 주었을 때 대칭과 비대칭 청각 필터사이의 PESQ 와 LLR 값을 실험해 본 결과 청각 필터 간의 큰 차이를 보였다. 위 실험 결과들로 대칭과 비대칭 청각 필터의 형태에 따라서 음성의 음질에 영향을 받는다는 것을 알 수 있었다. 특히, 난청이 있을 때 중심 주파수별 청각 필터의 비대칭적 형태 변화가 난청인이 받아들이는 음질에 영향이 있었다.

  • PDF

디지털 음성 도서에서 MathML 수식의 수준별 독음 변환 기법 (A Study on Phased Reading Techniques of Mathematical Expression in the Digital Talking Book)

  • 황정수;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제17권8호
    • /
    • pp.1025-1032
    • /
    • 2014
  • Until now, there were few supports on reading the mathematical expressions except text based expressions, so it is important to provide the reading of the mathematical expressions. Also, there are various of obstacles for people who are not visually impaired when reading the mathematical expressions such as the situation of presbyopia, reading the mathematical expressions in the vehicles, and so on. Therefore, supports for people to read mathematical expressions in various situations are needed. In the previous research, the main goal was to transform the mathematical expressions into Korean text based on Content MathML. In this paper, we expanded the range of the research from a reading disabilities to people who are not reading disabilities. We tested appropriacy of the rules we made to convert the MathML based expressions into speech and defined 3 math-to-speech rules in korean based on levels. We implemented the mathematical expressions by using 3 math-to-speech rules. We took comprehension test to find out whether our math to speech rules are well-defined or not.