• Title/Summary/Keyword: AI 음성인식 서비스

Search Result 36, Processing Time 0.022 seconds

스마트 세대의 AI기반 음성인식 서비스 구매의도 영향요인에 관한 연구

  • Park, Hae-Ryong
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.05a
    • /
    • pp.645-645
    • /
    • 2017
  • 이른바 제4차 산업혁명시대에 즈음하여 산업 기술간 융합과 함께 IOT, AI등 첨단 하이테크 제품, 서비스의 수요가 더욱 증가되는 추세이다. 현재의 스마트세대는 1인 가구가 증가 추세이며 나 홀로족인 혼술, 혼밥 등 솔로 마케팅 연구가 많이 진행 되어 지고 있다. 본 연구는 이에 발맞추어 스마트세대를 대상으로 이성적, 감성적 커뮤니케이션과 구매자의 개인적 특성을 중심으로 AI기반 음성인식 서비스의 구매의도 영향을 알아보고자 한다.

  • PDF

Cyber Threats Analysis of AI Voice Recognition-based Services with Automatic Speaker Verification (화자식별 기반의 AI 음성인식 서비스에 대한 사이버 위협 분석)

  • Hong, Chunho;Cho, Youngho
    • Journal of Internet Computing and Services
    • /
    • v.22 no.6
    • /
    • pp.33-40
    • /
    • 2021
  • Automatic Speech Recognition(ASR) is a technology that analyzes human speech sound into speech signals and then automatically converts them into character strings that can be understandable by human. Speech recognition technology has evolved from the basic level of recognizing a single word to the advanced level of recognizing sentences consisting of multiple words. In real-time voice conversation, the high recognition rate improves the convenience of natural information delivery and expands the scope of voice-based applications. On the other hand, with the active application of speech recognition technology, concerns about related cyber attacks and threats are also increasing. According to the existing studies, researches on the technology development itself, such as the design of the Automatic Speaker Verification(ASV) technique and improvement of accuracy, are being actively conducted. However, there are not many analysis studies of attacks and threats in depth and variety. In this study, we propose a cyber attack model that bypasses voice authentication by simply manipulating voice frequency and voice speed for AI voice recognition service equipped with automated identification technology and analyze cyber threats by conducting extensive experiments on the automated identification system of commercial smartphones. Through this, we intend to inform the seriousness of the related cyber threats and raise interests in research on effective countermeasures.

고령친화 AI음성 O2O 서비스의 서비스가치가 태도와 이용의도에 미치는 영향에 관한 연구

  • Lee, Myeong-Suk;Go, In-Gon
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2021.11a
    • /
    • pp.125-128
    • /
    • 2021
  • 한국은 2025년 전체 인구 중 65세 이상 인구가 20%을 상회하는 초고령 사회 진입이 전망되면서 노화수준에 맞는 고령친화적인 제품서비스 공급이 요구된다. 특히 시니어 소비자가 사용하기 편리한 인터페이스를 갖춘 서비스가 필요하다. 이에 시니어들은 노화(aging)에 대한 문제의식에 비용을 지불하며 젊은 소비자들과 유사한 소비행태를 보이고, 노화 수준별 건강 유지 및 건강 불안, 돌봄 공백, 사회적 고립 증가 등 사회문제가 복합적으로 심화되면서 고령친화적인 스마트한 Aging Service 공급이 요구된다. 이러한 시기와 맞물려 with코로나시대 시니어 소비자가 사용하기 편리한 인터페이스를 갖는 제품·서비스로 4차 산업혁명의 중심인 AI(Artificial Intelligence)와 정보통신 기술의 노력이 가시화되고 있다. 따라서 IT 기술에 덧입혀 시니어들의 욕구에 부합하는 AI 음성인식 기능을 탑재한 제품 및 서비스가 향후 고령친화산업 성장을 주도할 것으로 전망된다. 이에 본 연구는 '고령친화 AI 음성 O2O 서비스'의 서비스 가치가 태도와 이용의도에 영향을 미치는가를 분석하기 위해 선행이론을 토대로 전문가 델파이 방법을 통해 고령친화 AI 음성 O2O 서비스의 정의를 도출하고 실증분석으로 '고령친화 AI 음성 O2O 서비스'의 서비스가치(상황기반 제공성, 즉시연결성, 위치정확성)와 태도 및 이용의도간의 인과관계를 조사하기 위해 본 연구를 진행하였다.

  • PDF

A Study on the Comparison of the Commercial API for Recognizing Speech with Emotion (상용 API 의 감정에 따른 음성 인식 성능 비교 연구)

  • Janghoon Yang
    • Annual Conference of KIPS
    • /
    • 2023.05a
    • /
    • pp.52-54
    • /
    • 2023
  • 최근 인공지능 기술의 발전에 따라서 다양한 서비스에서 음성 인식을 활용한 서비스를 제공하면서 음성 인식에 대한 중요성이 증가하고 있다. 이 논문에서는 국내에서 많이 사용되고 있는 대표적인 인공지능 서비스 API 를 제공하는 구글, ETRI, 네이버에 대해서 감정 음성 관점에서 그 차이를 평가하였다. AI Hub 에서 제공하는 감성 대화 말뭉치 데이터 셋의 일부인 음성 테스트 데이터를 사용하여 평가한 결과 ETRI API 가 문자 오류율 (1.29%)과 단어 오류율(10.1%)의 성능 지표에 대해서 가장 우수한 음성 인식 성능을 보임을 확인하였다.

Multifaceted Evaluation Methodology for AI Interview Candidates - Integration of Facial Recognition, Voice Analysis, and Natural Language Processing (AI면접 대상자에 대한 다면적 평가방법론 -얼굴인식, 음성분석, 자연어처리 영역의 융합)

  • Hyunwook Ji;Sangjin Lee;Seongmin Mun;Jaeyeol Lee;Dongeun Lee;kyusang Lim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.55-58
    • /
    • 2024
  • 최근 각 기업의 AI 면접시스템 도입이 증가하고 있으며, AI 면접에 대한 실효성 논란 또한 많은 상황이다. 본 논문에서는 AI 면접 과정에서 지원자를 평가하는 방식을 시각, 음성, 자연어처리 3영역에서 구현함으로써, 면접 지원자를 다방면으로 분석 방법론의 적절성에 대해 평가하고자 한다. 첫째, 시각적 측면에서, 면접 지원자의 감정을 인식하기 위해, 합성곱 신경망(CNN) 기법을 활용해, 지원자 얼굴에서 6가지 감정을 인식했으며, 지원자가 카메라를 응시하고 있는지를 시계열로 도출하였다. 이를 통해 지원자가 면접에 임하는 태도와 특히 얼굴에서 드러나는 감정을 분석하는 데 주력했다. 둘째, 시각적 효과만으로 면접자의 태도를 파악하는 데 한계가 있기 때문에, 지원자 음성을 주파수로 환산해 특성을 추출하고, Bidirectional LSTM을 활용해 훈련해 지원자 음성에 따른 6가지 감정을 추출했다. 셋째, 지원자의 발언 내용과 관련해 맥락적 의미를 파악해 지원자의 상태를 파악하기 위해, 음성을 STT(Speech-to-Text) 기법을 이용하여 텍스트로 변환하고, 사용 단어의 빈도를 분석하여 지원자의 언어 습관을 파악했다. 이와 함께, 지원자의 발언 내용에 대한 감정 분석을 위해 KoBERT 모델을 적용했으며, 지원자의 성격, 태도, 직무에 대한 이해도를 파악하기 위해 객관적인 평가지표를 제작하여 적용했다. 논문의 분석 결과 AI 면접의 다면적 평가시스템의 적절성과 관련해, 시각화 부분에서는 상당 부분 정확도가 객관적으로 입증되었다고 판단된다. 음성에서 감정분석 분야는 면접자가 제한된 시간에 모든 유형의 감정을 드러내지 않고, 또 유사한 톤의 말이 진행되다 보니 특정 감정을 나타내는 주파수가 다소 집중되는 현상이 나타났다. 마지막으로 자연어처리 영역은 면접자의 발언에서 나오는 말투, 특정 단어의 빈도수를 넘어, 전체적인 맥락과 느낌을 이해할 수 있는 자연어처리 분석모델의 필요성이 더욱 커졌음을 판단했다.

  • PDF

음성 합성과 동작 인식 기술을 활용한 CLOVA Dubbing과 Avatar 서비스

  • Bae, Sun-Min
    • Broadcasting and Media Magazine
    • /
    • v.26 no.1
    • /
    • pp.31-37
    • /
    • 2021
  • 코로나로 인해 사회는 급속한 변화를 겪고 있고, 그 변화의 중심에는 온라인 플랫폼 기업과 서비스가 있다. AI 기술의 발전 속도는 여전히 가속되고 있고, 특히 음성 합성과 실시간 동작 인식, 아바타 생성 기술은 콘텐츠 생성 및 비대면 서비스에서 그 활용이 더욱 기대된다.

Review of Educational Applications of Artificial Intelligence Speakers (인공지능 스피커의 교육적 활용 방안 고찰)

  • Ahn, Jeoung-Eun;Jun, Youngcook
    • Proceedings of The KACE
    • /
    • 2018.01a
    • /
    • pp.93-95
    • /
    • 2018
  • 음성인식 기술이 인공지능의 핵심 연구 분야로 떠오르면서 음성인식 기술은 인공지능(AI)과 결합하여 음성비서, 자율 주행차, 실시간 음성검색, 음성 통역 등 다양한 분야에서 활용될 것으로 기대되고 있다. 문자가 아닌 음성으로 검색하는 새로운 검색 시장이 확대되면서 '음성이용자인터페이스(VUI: Voice User Interface)' 인 음성비서 서비스 기능을 가진 인공지능(AI) 스피커 시장 경쟁이 시간이 갈수록 가열되고 있다. 이에 인공지능 스피커의 등장배경부터 현재 국내외 음성인식 기기 소개 그리고 앞으로의 교육의 방향에 맞는 음성인식 기기의 교육적 활용 방안에 대해서 알아보고자 한다.

  • PDF

Intelligent Records and Archives Management That Applies Artificial Intelligence (인공지능을 활용한 지능형 기록관리 방안)

  • Kim, Intaek;An, Dae-Jin;Rieh, Hae-young
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.17 no.4
    • /
    • pp.225-250
    • /
    • 2017
  • The Fourth Industrial Revolution has become a focus of attention. Artificial intelligence (AI) is the key technology that will lead us to the industrial revolution. AI is also used to facilitate efficient workflow in records and archives management area, particularly abroad. In this study, we introduced the concept of AI and examined the background on how it rose. Then we reviewed the various applications of AI with prominent examples. We have also examined how AI is used in various areas such as text analysis, and image and speech recognition. In each of these areas, we have reviewed the application of AI from the viewpoint of records and archives management and suggested further utilization of the methods, including module and interface for intelligent records and archives information services.

Artificial intelligence wearable platform that supports the life cycle of the visually impaired (시각장애인의 라이프 사이클을 지원하는 인공지능 웨어러블 플랫폼)

  • Park, Siwoong;Kim, Jeung Eun;Kang, Hyun Seo;Park, Hyoung Jun
    • Journal of Platform Technology
    • /
    • v.8 no.4
    • /
    • pp.20-28
    • /
    • 2020
  • In this paper, a voice, object, and optical character recognition platform including voice recognition-based smart wearable devices, smart devices, and web AI servers was proposed as an appropriate technology to help the visually impaired to live independently by learning the life cycle of the visually impaired in advance. The wearable device for the visually impaired was designed and manufactured with a reverse neckband structure to increase the convenience of wearing and the efficiency of object recognition. And the high-sensitivity small microphone and speaker attached to the wearable device was configured to support the voice recognition interface function consisting of the app of the smart device linked to the wearable device. From experimental results, the voice, object, and optical character recognition service used open source and Google APIs in the web AI server, and it was confirmed that the accuracy of voice, object and optical character recognition of the service platform achieved an average of 90% or more.

  • PDF

AI 음성인식 기반 차량 인포테인먼트 포렌식 기술 동향

  • Shin, Yeonghun;Kim, Minju;Jeong, Daan;Shon, Taeshik
    • Review of KIISC
    • /
    • v.29 no.6
    • /
    • pp.23-28
    • /
    • 2019
  • 최근의 차량 인포테인먼트 시스템은 모바일 네트워크 및 스마트폰과 연결하여 다양한 서비스를 제공한다. 과거에는 제조사에서 독자적으로 개발한 OEM 인포테인먼트 시스템이 주를 이뤘지만, Android Auto, Apple CarPlay, Amazon Echo Auto 등의 개방형 플랫폼 생태계가 구축됨에 따라 다양한 차량들이 AI 음성인식 기반 차량 인포테인먼트 시스템을 탑재하고 있다. 이러한 차량 내 인포테인먼트 시스템은 스마트폰과 연동되며, 사용자에 대한 방대한 정보를 저장하고 처리함으로써 사용자의 선호도에 따른 On-Demand 서비스 등 다양한 편리성을 제공한다. 하지만 사용자에 대한 다양한 정보를 차량에 연동하여 사용하는 만큼 개인정보 문제로 이어질 수 있다. 그렇기 때문에 차량 인포테인먼트 시스템은 스마트폰과 같이 포렌식 관점에서 많은 증거를 획득할 수 있는 매체가 된다. 더욱이 스마트폰과 연동되는 시스템이기에 기존 모바일 포렌식 기법을 적용할 수 있다. 따라서 본 논문에서는 차량 인포테인먼트 시스템을 대상으로 수행된 포렌식 연구 분석을 통해 기존 연구에서의 포렌식 기법과 보완점을 도출하고자 한다.