• Title/Summary/Keyword: stt&tts

Search Result 21, Processing Time 0.037 seconds

A Design and Implementation of Speech Recognition and Synthetic Application for Hearing-Impairment

  • Kim, Woo-Lin;Ham, Hye-Won;Yun, Sang-Un;Lee, Won Joo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.26 no.12
    • /
    • pp.105-110
    • /
    • 2021
  • In this paper, we design and implement an Android mobile application that helps hearing impaired people communicate based on STT(Speech-to-Text) and TTS(Text-to-Speech) APIs and accelerometer sensor of a smartphone. This application provides the ability to record what the hearing-Impairment person's interlocutor is saying with a microphone, convert it to text using the STT API, and display it to the hearing-Impairment person. In addition. In addition, when a hearing-impaired person inputs a text using the TTS API, it is converted into voice and told to the interlocutor. When a hearing-impaired person shakes their smartphone, an accelerometer based background service function is provided to run the application. The application implemented in this paper provides a function that allows hearing impaired people to communicate easily with other people when communicating with others without using sign language as a video call.

Design and Implementation of an Application for an Exhibition of Disabled Artists (장애인 예술 작품 전시 애플리케이션 설계 및 구현)

  • Won Joo Lee;Seung Gyeom Kim;Ha Ram Kang;Tae Hun Kim;Jun Hyeok Lee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.227-228
    • /
    • 2023
  • 본 눈문에서는 안드로이드 플랫폼 기반의 스마트폰에서 장애 예술인 활동에 도움이 되는 애플리케이션을 설계 및 구현하였다. 이 애플리케이션의 특징은 TTS, STT 기능을 이용한다. STT 기능은 청각 장애인이 예술 작품을 올리면 작품에 대한 정보를 입력받고, TTS 활용하여 작품에 대한 설명을 음성으로 서비스하도록 구현한다. Naver Map을 사용하여 사용자가 전시회에 대한 위치를 등록하면 Naver Map을 통하여 전시회를 찾아올 수 있도록 길 안내 서비스를 구현한다.

  • PDF

A Study on Quantitative Evaluation Method for STT Engine Accuracy based on Korean Characteristics (한국어 특성 기반의 STT 엔진 정확도를 위한 정량적 평가방법 연구)

  • Min, So-Yeon;Lee, Kwang-Hyong;Lee, Dong-Seon;Ryu, Dong-Yeop
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.21 no.7
    • /
    • pp.699-707
    • /
    • 2020
  • With the development of deep learning technology, voice processing-related technology is applied to various areas, such as STT (Speech To Text), TTS (Text To Speech), ChatBOT, and intelligent personal assistant. In particular, the STT is a voice-based, relevant service that changes human languages to text, so it can be applied to various IT related services. Recently, many places, such as general private enterprises and public institutions, are attempting to introduce the relevant technology. On the other hand, in contrast to the general IT solution that can be evaluated quantitatively, the standard and methods of evaluating the accuracy of the STT engine are ambiguous, and they do not consider the characteristics of the Korean language. Therefore, it is difficult to apply the quantitative evaluation standard. This study aims to provide a guide to an evaluation of the STT engine conversion performance based on the characteristics of the Korean language, so that engine manufacturers can perform the STT conversion based on the characteristics of the Korean language, while the market could perform a more accurate evaluation. In the experiment, a 35% more accurate evaluation could be performed compared to the existing methods.

A Voice-enabled Chatbot Mobile Application (음성지원 챗봇 모바일 애플리케이션)

  • Choi, In-Kyung;Choi, Yun-Jeong;Lee, Ye-Rin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.438-439
    • /
    • 2019
  • 사회적 문제와 인공지능 기술의 발달로 챗봇 서비스에 대한 관심이 점점 증가하고 있으며, 그 결과 TTS(Text to Speech) 및 STT(Speech to Text) 기술을 기반으로 한 보조형 프로그램에 대한 개발이 다양한 모바일 환경에서 진행중이다. 본 논문에서는 문자를 소리로 변환해주는 TTS(Text to Speech) 기술과 소리를 문자로 변환해주는 STT(Speech to Text) 기술을 사용하여 음성지원 챗봇 시스템을 제작하고 이를 안드로이드 기반의 모바일 애플리케이션으로 구현한 '음성지원 챗봇 모바일 애플리케이션'을 제안하고, 이와 관련하여 관련 기술 및 기대효과에 대해 소개한다.

Voice-assisted Hand-off Control Device for Aircraft Assisted Piloting Environment (항공기 보조 조종 환경을 위한 음성 지원 핸드오프 제어 장치)

  • Park, Myeong-Chul;Cha, Hyun-Jun;Kim, Tae-Hyung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.485-486
    • /
    • 2021
  • 항공기에는 많은 시스템이 있고 다양한 장치들이 있다. 이 장치들은 사용자의 명령을 입력받아 사용되는데 자동을 제외한 거의 모든 시스템들은 사용자의 직접적인 조작으로 작동된다. 하지만 여전히 완전 자동화는 되지 않아 사소하고 섬세한 부분에서 조종사는 수동으로 작동시켜 주어야하는 부분들이 있다. 사소한 부분들을 신경써야 하기에 조종사에게 피로는 필수적을 따라왔다. 본 연구에선 현재의 기술에서 더 나아가 음성인식(STT, TTS)을 활용하여 항공기의 다양한 장치들을 원격제어할 수 있게 개발하여 완전 자동화를 목적으로 한다. 음성을 이용한 방식은 조종사에게 손을 사용하지 않는 편리함을 제공한다. 조종사에게 원거리에서 음성으로 조작할 수 있게 해줌으로써 손을 사용하여 조작하지 않아 편의성을 제공할 수 있고 명령을 통해 컴퓨터가 처리함으로써 조종이 간단해진다. 본 연구로 인해 사소한 부분까지 신경쓸 필요가 없어져 조종사의 실수나 피로로인해 일어나는 사고를 방지할 수 있다.

  • PDF

A Study on Dialect Expression in Korean-Based Speech Recognition (한국어 기반 음성 인식에서 사투리 표현에 관한 연구)

  • Lee, Sin-hyup
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.333-335
    • /
    • 2022
  • The development of speech recognition processing technology has been applied and used in various video and streaming services along with STT and TTS technologies. However, there are high barriers to clear written expression due to the use of dialects and overlapping of stop words, exclamations, and similar words for voice recognition of actual conversation content. In this study, for ambiguous dialects in speech recognition, we propose a speech recognition technology that applies dialect key word dictionary processing method by category and dialect prosody as speech recognition network model properties.

  • PDF

Mission Alarm App (미션 알람 앱)

  • Kang-Woo Kim;Jin-Woo Jung;Jae-Ik Han;Joon-Ho Park
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.281-282
    • /
    • 2024
  • 본 논문에서는 사용자들의 운동 능력과 영어 학습 능력 향상을 위한 앱을 개발한다. 지정한 시간에 알람을 울리고, 운동 및 학습을 완료하는 경우에만 알람이 종료한다. 알람이 활성화되면 사용자가 강제적으로 종료할 수 없는 기능을 선택할 수 있다. TTS 기능을 적용하여 알람이 활성화되었을 때, 안내 음성이 나오도록 설계하였다. 학습 기능에 STT를 적용하여 영어 단어와 문장을 마이크에 인식하는 방식의 영어 문제를 제시하였다. 또한, OpenAI를 활용하여 매일 자정 새로운 영어 문제를 생성하고 서버에 저장한다. 이러한 기능들은 사용자의 선택권을 보장하며 건강 증진 및 자기 주도적인 학습에 도움을 줄 것이다.

  • PDF

A Drowsiness Detection System using ChatGPT and Image Processing (ChatGPT와 영상처리를 이용한 졸음 감지 시스템)

  • Hyeon-Jun Lee;Hyeon-Sang Soon;Seong-Hun Jo;Chang-Hui Seo;Ji-Yun Kang;Se-Jin Oh
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.259-260
    • /
    • 2024
  • 졸음운전으로 인한 교통사고는 매년 꾸준하게 일어나 이에 대한 다방면의 해결책이 요구되고 있다. 본 논문에서는 위 문제를 개선하고자 ChatGPT와 영상처리를 이용한 졸음 감지 시스템을 구현하였다. 이 시스템은 운전자의 얼굴 부분을 영상처리로 인식하여 눈동자의 종횡비를 구해 PERCLOS 공식에 따른 운전자의 졸음을 판별시키고, 경고와 동시에 ChatGPT가 운전자에게 특정 주제를 키워드로 TTS와 STT를 통해 대화한다. 운전자의 졸음을 판별하기 위해 임베디드 보드에서 연결된 캠을 통해 졸음 판별을 하고, ChatGPT도 마찬가지로 보드에서 연결한 스피커, 마이크를 통해 운전자와 대화한다. 이를 활용하여 운전자의 졸음 자각을 통한 안전운전 및 사고 발생률의 감소를 기대할 수 있다.

  • PDF

The Development of Customized Communication System for the Senior Living Alone (독거노인을 위한 맞춤형 의사소통 시스템의 개발)

  • Kim, Ga-Young;Lee, Hyun-Dong;Kim, Dong-Hyun;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.183-184
    • /
    • 2018
  • 우리나라의 노인자살률은 OECD 국가 중에 1위이다. 인위적 고독사인 '자살'의 가장 큰 원인인 우울증을 의사소통을 통해 예방하고자 한다. 본 논문에서는 상황에 따라 독거노인에게 스피커가 먼저 질문하는 형식인 시스템을 제안한다. 음성인식 시스템인 스피커를 활용하여 독거노인의 의사소통을 증대시키고, 질문뿐만이 아니라 식사 여부, 약 복용 여부 관련 일상 알람도 주기 때문에 규칙적인 생활을 하는 데 도움을 준다.

  • PDF

Designing Voice Interface for The Disabled (장애인을 위한 음성 인터페이스 설계)

  • Choi, Dong-Wook;Lee, Ji-Hoon;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.697-699
    • /
    • 2019
  • IT 기술의 발달에 따라 전자기기의 이용량은 증가하였지만, 시각장애인들이나 지체 장애인들이 이용하는 데에 어려움이 있다. 따라서 본 논문에서는 Google Cloud API를 활용하여 음성으로 프로그램을 제어할 수 있는 음성 인터페이스를 제안한다. Google Cloud에서 제공하는 STT(Speech To Text)와 TTS(Text To Speech) API를 이용하여 사용자의 음성을 인식하면 텍스트로 변환된 음성이 시스템을 통해 응용 프로그램을 제어할 수 있도록 설계한다. 이 시스템은 장애인들이 전자기기를 사용하는데 많은 편리함을 줄 것으로 예상하며 나아가 장애인들뿐 아니라 비장애인들도 활용 가능할 것으로 기대한다.