• 제목/요약/키워드: AI 음성인식 서비스

검색결과 36건 처리시간 0.031초

AI기반 음성인식 서비스 특성과 상호 작용성 및 이용 의도 간의 구조적 관계 (The Structural Relationships of between AI-based Voice Recognition Service Characteristics, Interactivity and Intention to Use)

  • 이서영
    • 한국IT서비스학회지
    • /
    • 제20권5호
    • /
    • pp.189-207
    • /
    • 2021
  • Voice interaction combined with artificial intelligence is poised to revolutionize human-computer interactions with the advent of virtual assistants. This paper is analyzing interactive elements of AI-based voice recognition services such as sympathy, assurance, intimacy, and trust on intention to use. The questionnaire was carried out for 284 smartphone/smart TV users in Korea. The collected data was analyzed by structural equation model analysis and bootstrapping. The key results are as follows. First, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy, and trust have positive effects on interactivity with the AI-based voice recognition service. Second, the interactivity with the AI-based voice recognition service has positive effects on intention to use. Third, AI-based voice recognition service characteristics such as interactional enjoyment and intimacy have directly positive effects on intention to use. Fourth, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy and trust have indirectly positive effects on intention to use the AI-based voice recognition service by mediating the effect of the interactivity with the AI-based voice recognition service. It is meaningful to investigate factors affecting the interactivity and intention to use voice recognition assistants. It has practical and academic implications.

AI 를 활용한 대화형 음성인식 키오스크 (Interactive Voice Recognition Kiosk Using AI)

  • 한지혜 ;김상현;김수민 ;이혜원 ;임길환 ;이경용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.953-954
    • /
    • 2023
  • 고령 사회로 접어들고 디지털 문맹이 대두되면서 기계 조작에 미숙한 정보취약계층이나 고령층들이 느끼는 불편함을 개선하고자 본 연구는 기존의 터치형 키오스크와는 차별된 음성/얼굴인식 기술을 활용한 키오스크 개발을 제안하며, 모든 연령층을 고려한 AI 기술의 활용으로 맞춤형 주문 서비스를 제공하여 고객 만족도를 높이고, 보다 쉽고 빠르게 주문할 수 있도록 한다.

Alexa를 이용한 대학안내 시스템 (The University Gusdance System using the Alexa)

  • 김태진;김동현
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2061-2066
    • /
    • 2017
  • 음성인식 기술은 사용자의 음성을 인식하여 명령을 실행하는 기술로 현재는 자연어 처리 기법과 접목되어 인공지능 음성인식 서비스로 제공되어 지고 있다. 이러한 인공지능 음성인식 서비스는 IoT기기를 제어하거나 뉴스 또는 날씨와 같은 정보 제공 분야에서 활용되고 있다. 정보 제공 분야의 하나인 대학 정보는 주로 웹을 통하여 제공되나 너무 많은 데이터를 제공하기 때문에 사용자가 신속하게 원하는 정보를 검색할 수 없는 문제가 있다. 이 논문에서는 사용자가 찾고자 하는 정보를 음성으로 인식하고 제공하기 위한 대학 안내 시스템을 설계하고 구현한다. 대학정보를 각 주제별로 분류하고 이를 제공하기 위한 람다 함수를 설계한다. 그리고 알렉사 스킬 키트를 이용하여 노드제이에스로 구현된 모듈을 아마존웹서비스에 업로드하여 음성인식을 이용하여 대학 정보를 제공한다.

AI 기술 기반 지능형 시니어 도우미 음성인식 시스템 (An AI Technology-based Intelligent Senior Assistant Voice Recognition System)

  • 홍필두
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.355-357
    • /
    • 2019
  • 고령화 사회로 진입하고 있는 지금, 시니어 세대에게는 새로운 디바이스나 IoT기술에 대한 사용자 접점은 매우 불편하다. 이를 개선하기 위하여 우리는 AI 기술 기반 지능형 시니어 도우미 음성인식 시스템을 제안한다. 제안 시스템은 Cloud platform기반 API를 구현하여 머신러닝 처리 활용을 위한 데이터를 축적하며, 치매진단, 치매예방활동을 위한 콘텐츠를 제공하며,시니어 세대를 위한 챗봇 콘텐츠를 제공한다. 우리가 제안한 개념모델을 이용한 서비스를 API로 제공함으로서 시니어 세대에 대한 IoT기반 등 새로운 디바이스의 접근성 및 편리성을 증대하는 계기가 될 것으로 기대한다.

  • PDF

가상현실 기반의 인공지능 영어회화 시스템 (English Conversation System Using Artificial Intelligent of based on Virtual Reality)

  • 천은영
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.55-61
    • /
    • 2019
  • 외국어 교육을 실현하기 위하여 기존의 다양한 교육 매체들이 제공되고 있지만, 교구 및 매체프로그램에 대한 비용이 많이 들고 실시간 대응력이 떨어지는 단점이 존재한다. 이 논문에서는 VR과 음성인식을 기반으로 한 인공지능 유형의 영어회화 시스템을 제안한다. 시스템 구축을 위해 Google CardBoard VR과 Google Speech API를 이용하며 가상현실 환경 제공 및 대화를 위한 인공지능 알고리즘을 개발하였다. 제안하는 음성인식 서버시스템에서는 사용자가 발화한 문장을 단어 단위로 분리해 데이터베이스에 저장된 데이터 단어들과 비교하여 확률적으로 가장 높은 것을 답으로 제공할 수 있으며 사용자들이 가상현실의 인물과 적절한 대화 및 응답이 가능하다. 대화가 제공되는 기능은 상황별 대화와 주제에 독립적이며, AI 비서와 나눈 대화 내용을 사용자 시스템에서 실시간 확인이 가능하도록 구현하였고 실험을 통하여 음성인식에 대한 응답비율을 확인하였다. 이 논문에서 제안하는 가상현실과 음성인식 기능을 접목한 시스템을 통하여 4차 산업혁명에 관련한 가상교육 콘텐츠 서비스 확장에 이바지할 것을 기대한다.

사용자 인터페이스를 적용한 AI 키오스크 (AI Kiosk with User Interface Application)

  • 박윤진;최다연;김수영;장지원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.842-843
    • /
    • 2023
  • Covid-19으로 인한 언택트(Untact) 문화의 확산으로 키오스크 주문과 같은 비대면 서비스가 증가하였다. 본 연구에서는 비대면 서비스로 인해 발생하는 정보격차 및 접근성 문제를 해결하기 위해 AI 기술과 사용자 인터페이스를 결합하여 개인 맞춤화된 키오스크를 소개한다. 본 연구에서 개발된 AI 키오스크는 자연어 처리기술을 활용한 음성 주문을 통해 편리성을 증진하고, 딥러닝 기술을 이용한 연령대 인식, 사용자의 알레르기 정보를 고려한 메뉴 추천을 통해 사용자에게 맞춤화된 서비스를 제공한다. 개발된 키오스크를 통해 개인화된 서비스를 개선할 수 있으며 더불어 정보 취약계층 간의 정보격차를 해소할 수 있다.

AI 아나운서 : 인공지능 기술을 이용한 정보 전달 소프트웨어 (AI Announcer : Information Transfer Software Using Artificial Intelligence Technology)

  • 김혜원;이영은;이홍창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.937-940
    • /
    • 2020
  • 본 논문은 AI 기술을 기반으로 텍스트 스크립트를 자동으로 인식하고 영상 합성 기술을 응용하여 텍스트 정보를 시각화하는 AI 아나운서 소프트웨어 연구에 대하여 기술한다. 기존의 AI 기반 영상 정보 전달 서비스인 AI 앵커는 텍스트를 인식하여 영상을 합성하는데 오랜 시간이 필요하였으며, 특정 인물 이미지로만 영상 합성이 가능했기 때문에 그 용도가 제한적이었다. 본 연구에서 제안하는 방법은 Tacotron 으로 새로운 음성을 학습 및 합성하여, LRW 데이터셋으로 학습된 모델을 사용하여 자연스러운 영상 합성 체계를 구축한다. 단순한 얼굴 이미지의 합성을 개선하고 다채로운 이미지 제작을 위한 과정을 간략화하여 다양한 비대면 영상 정보 제공 환경을 구성할 수 있을 것으로 기대된다.

자동차 음성인식 인터랙션의 안전감과 만족도 인식 영향 요인 : 에이전트 퍼소나와 사용자 경험 속성을 중심으로 (Determinants of Safety and Satisfaction with In-Vehicle Voice Interaction : With a Focus of Agent Persona and UX Components)

  • 김지현;이가현;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.573-585
    • /
    • 2018
  • 커넥티드카 시스템에서 인공지능 음성인식 인터페이스 기기를 통한 주행 안내 및 엔터테인먼트 서비스가 상용화되고 있다. 이 연구는 차량용 음성 에이전트의 개발사를 IT와 자동차 제조사로 구분하여, 운전자의 안전감과 만족도에 영향을 미치는 에이전트의 퍼소나와 사용자 경험 속성들을 탐색하는 것을 목적으로 하였다. 자동차 시뮬레이터 주행 실험에서, 참가자들은 음성인식 에이전트를 통해 엔터테인먼트와 내비게이션조작 과제를 수행하고 안전감과 만족도를 평가하였다. 회귀분석 결과 안전감에 영향을 미치는 주요 선행요인은 에이전트 제조사의 신뢰도였으며, 퍼소나 요인은 따뜻함과 매력으로 나타났고, UX요인에서는 효율성과 배려로 나타났다. 만족도에서는 선행요인 중 에이전트 제조사의 일치 여부와 운전자 성별이, 퍼소나 속성은 거리감 적음, UX 측면에서는 편리성, 효율성, 사용 용이성, 배려가 유의미한 영향 요인으로 나타났다. 이 연구의 의의와 기여점은 자율주행 환경에서 대화형 VUI를 핵심 인터랙션 모드로 발전시키기 위해 어떤 요인들을 우선해야 할 것인지 선별한 실증적 결과를 제시한 데 있다.

CNN(Convolutional Neural Network) 알고리즘을 활용한 음성신호 중 비음성 구간 탐지 모델 연구 (A Study on a Non-Voice Section Detection Model among Speech Signals using CNN Algorithm)

  • 이후영
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.33-39
    • /
    • 2021
  • 음성인식 기술은 딥러닝과 결합되며 빠른 속도로 발전하고 있다. 특히 음성인식 서비스가 인공지능 스피커, 차량용 음성인식, 스마트폰 등의 각종 기기와 연결되며 음성인식 기술이 산업의 특정 분야가 아닌 다양한 곳에 활용되고 있다. 이러한 상황에서 해당 기술에 대한 높은 기대 수준을 맞추기 위한 연구 역시 활발히 진행되고 있다. 그중에서 자연어처리(NLP, Natural Language Processing)분야에서 음성인식 인식률에 많은 영향을 주는 주변의 소음이나 불필요한 음성신호를 제거하는 분야에 연구가 필요한 상황이다. 이미 많은 국내외 기업에서 이러한 연구를 위해 최신의 인공지능 기술을 활용하고 있다. 그중에서 합성곱신경망 알고리즘(CNN)을 활용한 연구가 활발하게 진행되고 있다. 본 연구의 목적은 합성곱 신경망을 통해서 사용자의 발화구간에서 비음성 구간을 판별하는 것으로 5명의 발화자의 음성파일(wav)을 수집하여 학습용 데이터를 생성하고 이를 합성곱신경망을 활용하여 음성 구간과 비음성 구간을 판별하는 분류 모델을 생성하였다. 이후 생성된 모델을 통해 비음성 구간을 탐지하는 실험을 진행한 결과 94%의 정확도를 얻었다.

스마트 스피커의 교육적 활용에 관한 연구 (A Study on the Educational Uses of Smart Speaker)

  • 장지연
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.33-39
    • /
    • 2019
  • 교육업계에 교육과 정보기술(IT)을 융합한 '에듀테크' 바람이 불고 있다. 4차 산업혁명 핵심 기술이 최근 교육 분야에 적극 활용되고 있는데 학습자들은 인공지능 기반 학습 플랫폼을 이용해 자신이 부족한 부분을 스스로 진단하고, 클라우드 학습 플랫폼으로 온라인상에서 개인 맞춤형 교육을 받는다. 최근 인공지능 기술과 음성인식 기술을 접목한 스마트 스피커와 같은 새로운 교육 매체가 등장하게 되어 다양한 교육서비스가 시도되고 있다. 본 연구에서는 기존 교육의 한계를 극복하기 위해 스마트 스피커를 교육적으로 활용하는 방안을 제시하고자 하였다. 이를 위해 스마트 스피커의 개념 및 특성을 알아보고 스마트 스피커에서 제공하는 콘텐츠를 분석하여 시사점을 도출하였다. 또한 스마트 스피커이용의 문제점에 대해서도 고찰하였다.