• 제목/요약/키워드: Voice language

검색결과 411건 처리시간 0.027초

우리나라 교사의 음성 특성과 음성장애 위험 요인에 관한 체계적 문헌고찰 (A Systematic Review on Voice Characteristics and Risk Factors of Voice Disorder of Korea Teachers)

  • 차슬기;변해원
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.149-154
    • /
    • 2018
  • 직업적 음성 사용자들의 범위가 확대됨에 따라 음성에 대한 관심이 증가하고 있다. 특히 교사는 음성장애 위험이 높은 직업군에 포함되기 때문에 음성문제 발생과 음성장애 발병 요인에 대한 규명이 필요하다. 본 연구는 교사의 음성 특성과 음성장애 위험 요인에 대한 체계적 연구 분석을 통해 교사의 음성장애 위험 요인을 확인하고 이를 위한 기초자료를 제공하였다. 2000년부터 2018년까지 '직업', '교사', '직업적 음성 사용자', '음성', '음성장애', '위험' 키워드를 조합하여 414편의 연구가 검색되었으며 그 중 8편의 연구를 최종 분석 대상으로 선정하였다. 질적 평가는 Qualsyst: checklist for assessing the quantitative studies 항목을 수정하여 비뚤림 평가를 실시하였다. 연구 결과 교사는 음성 사용에 있어 음성의 오남용이 자주 발생하였으며 이는 환경에 영향을 받는 것으로 확인되었다. 이러한 결과를 통해 교사의 음성 오남용 환경 개선과 주기적인 음성 교육이 필요함을 제안한다.

사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구 (A Study on VoiceXML Application of User-Controlled Form Dialog System)

  • 권형준;노용완;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML은 음성을 통해 웹 자원 탐색을 제공하기 위한 목적으로 설계된 XML 기반의 새로운 마크업 언어이다. VoiceXML로 만들어진 어플리케이션은 기계 주도 폼 다이얼로그 구조와 상호 주도 폼 다이얼로그 구조로 분류된다. 이와 같은 다이얼로그 구조들은 어플리케이션 개발자에 의해 서비스 시나리오가 결정되기 때문에 사용자가 자유롭게 웹 자원을 탐색하는 서비스를 구축할 수 없다. 본 논문에서는 사용자의 의도에 따라 서비스 시나리오가 결정되는 음성 웹 서비스의 구축을 위해 사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션 구조를 제안한다. 제안하는 어플리케이션은 사용자에 의해 요청된 정보로부터 인식 후보들을 자동적으로 검출하여 음성 앵커로 사용하고 각각의 음성 앵커론 새로운 음성 노드로 연결한다. 제안하는 시스템의 예로 IT 용어사전을 내장한 뉴스 서비스를 구현하여 음성 앵커의 검출 및 등록 여부를 확인하였고, 음성 인식률 및 사용자가 의도한 정보를 성공적으로 제공했는지 판단하는 척도가 되는 적중률과 응답 속도를 측정하였다. 실험 결과, 제안한 시스템이 기존의 VoiceXML 폼 다이얼로그 구조의 시스템보다 더 자유로운 웹 자원의 탐색이 가능함을 확인하였다.

파킨슨병 환자의 말 특성과 언어치료 관련 국내문헌연구 (A Study of Korean Literature Review Related to Speech Characteristics and Speech Therapy in Patients with Parkinson Disease)

  • 강하늘;유재연
    • 대한후두음성언어의학회지
    • /
    • 제30권2호
    • /
    • pp.87-94
    • /
    • 2019
  • The purpose of this study was to investigate the speech characteristics and speech therapy of Parkinson disease (PD). This study selected 28 papers published in Korea from 1998 to 2018 after searching the terms 'Parkinson voice' and 'Parkinson speech therapy.' Literature review had been conducted in the two aspects of speech characteristics and speech therapy. The speech characteristics were divided into respiration, phonation, articulation, prosody, vowel production, and voice questionnaire. Speech therapy was divided into Lee Sliverman voice treatment (LSVT) and other voice therapy. PD patients did not differ in respiration function compared to normal elderly people, but their speech and articulation function were poorer. There was also a difference in the speech rate, frequency of pause, and accuracy of vowel production compared with normal elderly people. PD had a lower VHI score and their voice related quality of life was a little poorer. The LSVT was typically used in speech therapy for PD. The methods of speech therapy for PD have been shown to improve respiration and phonation. It is necessary to establish voice norms in PD patients and develop effective speech therapy in the following study.

Voxceleb과 한국어를 결합한 새로운 데이터셋으로 학습된 ECAPA-TDNN을 활용한 화자 검증 (Speaker verification with ECAPA-TDNN trained on new dataset combined with Voxceleb and Korean)

  • 윤금재;박소영
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.209-224
    • /
    • 2024
  • 화자검증(speaker verification)이란 두개의 음성 데이터로부터 같은 화자의 목소리 인지 아닌지를 판단하는것을 말한다. 범죄현장에서 범인의 목소리만이 증거로 남는경우, 두개의 목소리를 객관적이고 정확하게 비교할 수 있는 화자 검증 시스템 또는 화자 매칭 시스템의 구축이 시급하다. 본 연구에서는 한국어에 대한 화자검증 딥러닝 모형을 새롭게 구축하고, 학습에 필요한 적절한 형태의 학습데이터셋에 대해 연구한다. 음성데이터는 고차원이면서 백그라운드 노이즈를 포함하는 등의 변동성이 큰 특징이 있다. 따라서 화자 검증 시스템을 구축하기위해 딥러닝 기반의 방법 선택하는경우가 많다. 본 연구에서는 ECAPA-TDNN 모형을 선택하여 화자 매칭 알고리즘을 구축하였다. 구축한 모형을 학습시키는데 사용한 Voxceleb은 대용량의 목소리 데이터로 다양한 국적을 가진 사람들로부터 음성데이터를 포함하지만 한국어에 대한 정보는 포함하지 않는 다. 본 연구에서는 한국어 음성데이터를 학습에 포함시켰을때와 포함시키지 않았을때 학습 데이터 내 해당언어의 존재 유무가 모델의 성능에 미치는 영향에 대해 파악하였다. Voxceleb으로만 학습한 모델과 언어와 화자의 다양성을 최대로 하기 위해 Voxceleb과 한국어 데이터셋을 결합한 데이터셋으로 학습한 모델을 비교하였을 때, 모든 테스트 셋에 대해 한국어를 포함한 학습데이터의 성능이 개선됨을 보인다.

효과적인 인간-로봇 상호작용을 위한 딥러닝 기반 로봇 비전 자연어 설명문 생성 및 발화 기술 (Robot Vision to Audio Description Based on Deep Learning for Effective Human-Robot Interaction)

  • 박동건;강경민;배진우;한지형
    • 로봇학회논문지
    • /
    • 제14권1호
    • /
    • pp.22-30
    • /
    • 2019
  • For effective human-robot interaction, robots need to understand the current situation context well, but also the robots need to transfer its understanding to the human participant in efficient way. The most convenient way to deliver robot's understanding to the human participant is that the robot expresses its understanding using voice and natural language. Recently, the artificial intelligence for video understanding and natural language process has been developed very rapidly especially based on deep learning. Thus, this paper proposes robot vision to audio description method using deep learning. The applied deep learning model is a pipeline of two deep learning models for generating natural language sentence from robot vision and generating voice from the generated natural language sentence. Also, we conduct the real robot experiment to show the effectiveness of our method in human-robot interaction.

열과 온도 수업에서 나타난 초등학생들의 중간 언어 분석 (Analysis of Elementary Students' Interlanguage in Science Class about Heat and Temperature)

  • 이일연;장신호
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제34권1호
    • /
    • pp.123-130
    • /
    • 2015
  • For effective science learning, teachers need to rearrange scientific language so that students can understand the contents with their incomplete language resources. Interlanguage is the interplay between everyday language and scientific language. The purpose of the study was to analyze the patterns of interlanguage during 4th grade science class to learn "Heat and Temperature" and to find the features of meaning sharing inside classroom in which a teacher and students participated. The data analysis shows that elementary students' interlanguage has different features compared to scientific language that involves passive voice and content-specialized nouns. Students' interlanguage implied the quality of class community's knowledge-sharing, according to the degree of how students can connect scientific language and everyday language in more effective ways. The implication to elementary science education was discussed.

파킨슨병 환자의 음성장애지수 및 음성관련 삶의 질 연구 (Voice Handicap Index and Voice-Related Quality of Life in Idiopathic Parkinson's Disease)

  • 유경;장인수;김락형
    • 동의신경정신과학회지
    • /
    • 제24권2호
    • /
    • pp.155-162
    • /
    • 2013
  • Objectives : The purpose of this study is to evaluate the voice handicaps of the idiopathic Parkinson's Diseases (PD) and their voice-related quality of life. Methods : Voice handicap index-10 (VHI-10) and Voice related Quality of Life were completed by 17 idiopathic PD patients, and Unified Parkinson's Disease Rating Scale (UPDRS) part I, II, III were assessed. The relations between VHI-10, VRQOL and UPDRS scores were analysed. Results : VHI-10 score of PD patients was $14.35{\pm}8.07$ and VRQOL total score of PD patients was $59.12{\pm}20.25$, social-emotional $59.93{\pm}20.50$, physical function $58.58{\pm}21.77$. There were significant relations between VHI-10, VRQOL score and UPDRS II (activities of daily living). Conclusions : These results suggest that voice impairments affect the daily living of PD patients and their quality of lives.

동굴관광용 고층수직이동 승강기의 긴급 음성구동 제어 (Voice Recognition Sensor Driven Elevator for High-rise Vertical Shift)

  • 최병섭;강태현;윤여훈;장훈규;소대화
    • 동굴
    • /
    • 제88호
    • /
    • pp.1-7
    • /
    • 2008
  • Recently, it is one of very interest technology of Human Computer Interaction(HCI). Nowadays, it is easy to find out that, for example, inside SF movies people has talking to computer. However, there are difference between CPU language and ours. So, we focus on connecting to CPU. For 30 years many scientists experienced in that technology. But it is really difficult. Our project goal is making that CPU could understand human voice. First of all the signal through a voice sensor will move to BCD (binary code). That elevator helps out people who wants to move up and down. This product's point is related with people's safety. Using a PWM for motor control by ATmega16, we choose a DC motor to drive it because of making a regular speed elevator. Furthermore, using a voice identification module the elevator driven by voice sensor could operate well up and down perfectly from 1st to 10th floor by PWM control with ATmega16. And, it will be clearly useful for high-rise vertical shift with voice recognition sensor driven.

VoiceXML을 이용한 VUI 지원 웹브라우저 개발 (Development of a Voice User Interface for Web Browser using VoiceXML)

  • 예상후;장민석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권2호
    • /
    • pp.101-111
    • /
    • 2005
  • 현재의 웹정보들은 주로 HTML로 기술되어 있으며, 이러한 정보를 얻기 위해 사용자들은 마우스와 키보드와 같은 입력장치를 사용한다. 이와 같이 기존의 GUI 환경은 인간의 가장 자연스러운 정보획득 수단의 하나인 음성을 지원하지 못하고 있다. 이러한 문제를 해결하기 위해 음성 인터페이스를 가진 여러 제품들이 개발되고 있다. 하지만 이들은 상호대화성이나 기존 웹환경을 수용한다는 측면에서 부족한 면을 가지고 있다. 본 논문에서는 현재 무르익어 가는 음성인식 기술과 XML의 파생언어인 VoiceXML을 이용하여, 기존의 인터페이스 환경을 XML 기반의 대화형 음성인터페이스 환경으로 대체하고자 한다. 이를 통해 기존의 인터페이스 환경을 수용한 VUI(Voice User Interface) 환경을 사용자에게 제공할 수 있다. 기존의 환경을 수용하기 위해 "XML Island" 기술을 이용하여 VoiceXML 문서를 HTML 문서에 포함시키며, 대표적인 정보획득화면인 메뉴, 게시판, 검색 엔진에 대한 대화형 음성 시나리오를 제안하고 있다.