• 제목/요약/키워드: Speech Based Phone Services

검색결과 6건 처리시간 0.021초

VoiceXML 기반 음성인식시스템을 이용한 서비스 개발 (The Interactive Voice Services based on VoiceXML)

  • 김학균;김은향;김재인;구명완
    • 대한음성학회지:말소리
    • /
    • 제43호
    • /
    • pp.113-125
    • /
    • 2002
  • As there are needs to search the Web information via wire or wireless telephones, VoiceXML forum was established to develop and promote the Voice eXtensible Markup Language (VoiceXML). VoiceXML simplifies the creation of personalized interactive voice response services on the Web, and allows voice and phone access to information on Web sites, call center databases. Also, it can utilize the Web-based technologies, such as CGI(Common Gateway Interface) scripts. In this paper, we have developed the voice portal service platform based on VoiceXML called TeleGateway. It enables integration of voice services with data services using the Automatic Speech Recognition (ASR) and Text-To-Speech (TTS) engines. Also, we have showed the various services on voice portal services.

  • PDF

음성 인식을 이용한 지능망 기반 일기예보 서비스 개발 (Development of a Weather Forecast Service Based on AIN Using Speech Recognition)

  • 박성준;김재인;구명완;전주식
    • 대한음성학회지:말소리
    • /
    • 제51호
    • /
    • pp.137-149
    • /
    • 2004
  • A weather forecast service with speech recognition is described. This service allows users to get the weather information of all the cities by saying the city names with just one phone call, which was not provided in the previous weather forecast service. Speech recognition is implemented in the intelligent peripheral (IP) of the advanced intelligent network (AIN). The AIN is a telephone network architecture that separates service logic from switching equipment, allowing new services to be added without having to redesign switches to support new services. Experiments in speech recognition show that the recognition accuracy is 90.06% for the general users' speech database. For the laboratory members' speech database, the accuracies are 95.04% and 93.81%, respectively in simulation and in the test on the developed system.

  • PDF

음성 입출력 API를 이용한 모바일 접근성 지원 인터페이스 구현 (Implementation of Interface to Support Mobile Accessibility Using Speech I/O APIs)

  • 오승철;윤영선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.71-80
    • /
    • 2013
  • 최근에 모바일 기기의 확산으로 인하여 모바일 접근성에 대한 많은 논의가 이뤄지고 있다. 모바일 접근성이란 모바일 기기를 사용하여 애플리케이션을 이용하고자 하는 장애인, 고령자 등을 포함한 모든 사람들에게 모바일 기기의 활용 가능성이 제공됨을 말한다. 본 논문에서는 음성 서비스 기술을 이용하여 모바일 접근성을 향상하기 위한 인터페이스를 제안하고 구현하였다. 제안된 방법은 안드로이드 스마트폰에서 구현하였으며, 시스템에서 제공하는 음성 인식과 음성 합성 기술을 이용하였다. 또한, 전맹인과 저시력자들의 인터넷 접근을 도와주기 위하여 접근성을 고려한 웹 리더 기능을 응용 프로그램 차원에서 설계하고 구현하였다.

분산형 음성인식 DSP 네트워킹 시스템을 위한 반음소 모델기반의 신뢰도를 사용한 결정규칙과 인터럽트-폴링 (Decision Rule using Confidence Based Anti-phone Model and Interrupt-Polling Method for Distributed Speech Recognition DSP Networking System)

  • 송기창;강철호
    • 한국멀티미디어학회논문지
    • /
    • 제13권7호
    • /
    • pp.1016-1022
    • /
    • 2010
  • 지능형 홈네트워크의 복잡하고 다양한 서비스를 음성인식을 이용해 편리하게 제어하기 위해서는 원거리 음성인식 및 분산 음성인식 네트워킹에 관한 방법은 필수적 요소이다. 이를 통해 가정의 어느 공간에서든 음성을 이용한 홈컨트롤이 가능해 진다. 본 논문에서는 분산형 음성인식 DSP 시스템 구성을 위하여 서버-클라이언트 형태로 구분된 DSP 확장형 모듈을 개발하였으며, 클라이언트 모듈이 전달하는 인식 결과의 신뢰도를 통합 분석하여 서버 모듈이 지능적으로 인식 결과를 판단하는 기법을 제안한다. 모의 실험 결과, 제안한 판단 기법은 기존의 다수결의 법칙이나, 선도착 우선의 법칙보다 우수한 인식 성능을 나타내었다. 또한, 선도착 클라이언트 결과가 도착한 후 무조건 일정 시간 타 클라이언트 결과를 기다려야 하는 기존의 지연(Delay) 방식의 단점을 해결하기 위하여, 인터럽트 폴링 기법을 제안한다. 제안한 인터럽트 폴링 기법은 서버 모듈이 클라이언트 모듈에게 현재 상태를 물어보고 클라이언트의 결과를 기다려야 할지 선택함으로써 불필요한 인식 지연시간을 없애고 인식율의 성능을 유지할 수 있다.

한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계 (Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean)

  • 김동헌;이상준
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.225-236
    • /
    • 2013
  • 음성인식 기술은 단순한 단어 인식을 넘어 자연스럽게 발성한 연속 음성도 인식할 수 있는 수준으로 발전해 왔다. 아이폰에 탑재된 자연어 음성인식 처리 소프트웨어인 시리(Siri)가 2010년에 발표되면서, 음성인식에 대한 연구가 관심을 받고 있다. 한국어 음성 인식 소프트웨어들은 대부분 단어 위주의 인식 서비스로 구성 되어 있으며, 잡음처리 및 음성 에너지 조절 기능들이 부족해 만족할 만한 인식률을 보이지 못하고 있다. 또한 요구된 발성 규칙을 따르지 못한 음성 질의들은 아예 처리하지 못하고 있는 실정이다. 본 논문에서는 이러한 현실적 어려움을 개선할 수 있도록 다목적 전처리 프로세서를 제안하였다. 이 처리기는 음성인식 엔진에 독립적이며, 잡음 제거 기능, 규칙에 따르지 않은 음성 질의도 처리 할 수 있는 핵심어 추출 기능, 그 핵심어를 수식하는 전술부 및 그 해당 음성 질의로부터 수행하기를 원하는 후술부 까지도 추출할 수 있는 기능을 갖추도록 하였다. 실험을 통해, 잡음 제거 효과 평가, 핵심어 인식 성공률, 연속음 인식 성공률을 측정하여 제안한 방법의 타당성을 확인하였다.

Research on Developing a Conversational AI Callbot Solution for Medical Counselling

  • Won Ro LEE;Jeong Hyon CHOI;Min Soo KANG
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.9-13
    • /
    • 2023
  • In this study, we explored the potential of integrating interactive AI callbot technology into the medical consultation domain as part of a broader service development initiative. Aimed at enhancing patient satisfaction, the AI callbot was designed to efficiently address queries from hospitals' primary users, especially the elderly and those using phone services. By incorporating an AI-driven callbot into the hospital's customer service center, routine tasks such as appointment modifications and cancellations were efficiently managed by the AI Callbot Agent. On the other hand, tasks requiring more detailed attention or specialization were addressed by Human Agents, ensuring a balanced and collaborative approach. The deep learning model for voice recognition for this study was based on the Transformer model and fine-tuned to fit the medical field using a pre-trained model. Existing recording files were converted into learning data to perform SSL(self-supervised learning) Model was implemented. The ANN (Artificial neural network) neural network model was used to analyze voice signals and interpret them as text, and after actual application, the intent was enriched through reinforcement learning to continuously improve accuracy. In the case of TTS(Text To Speech), the Transformer model was applied to Text Analysis, Acoustic model, and Vocoder, and Google's Natural Language API was applied to recognize intent. As the research progresses, there are challenges to solve, such as interconnection issues between various EMR providers, problems with doctor's time slots, problems with two or more hospital appointments, and problems with patient use. However, there are specialized problems that are easy to make reservations. Implementation of the callbot service in hospitals appears to be applicable immediately.