• Title/Summary/Keyword: 음성 명령

Search Result 112, Processing Time 0.023 seconds

Design and Implementation of Order Settlement System Using Artificial Intelligence Speaker (인공지능 스피커를 활용한 주문결제 시스템의 설계 및 구현)

  • Kim, Dong-Hyun;Choi, Byung-Hyun;Ban, Chae-Hoon
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.6
    • /
    • pp.1181-1186
    • /
    • 2019
  • Recently, we have been able to quickly order and pay with kiosks even at fast food restaurants, small private restaurants and cafes. However, people with disabilities who are uncomfortable with their arms and who are sitting in wheelchairs are difficult to use by pressing graphical buttons to use kiosks. Older people also feel uncomfortable to use kiosks because of their cognitive abilities to accept new information as they get older. In this paper, to solve this problem, we design and implement a order-payment system to add the voice command element of the AI speaker to the visual command element when the user interacts with the kiosk.

Adaptable Wiper Speed Control to the Driver Using Fuzzy Inference (퍼지추론을 적용한 운전자 중심의 와이퍼 속도 제어)

  • 박정숙;김민정;김은진;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.157-160
    • /
    • 2001
  • 본 논문에서는 강수량과 자동차 주행속도 등의 환경조건에 따라 와이퍼 속도를 일정하게 적용한 기존의 시스템을 개선하여 운전자의 개인 특성에 의해서도 속도 변경이 가능하게 함으로서 인간에게 조금 더 친밀감을 제공하는 시스템을 구현하였다. 초기 와이퍼 속도는 입력받은 강수량과 자동차 주행 속도로 추론하여 구하였다. 추론된 와이퍼 속도를 운전자의 개인 특성에 따라 변경하고자 할 경우, 해당 음성명령을 입력받아 재 추론하였다. 음성인식을 위해서는 고립단어 인식에 적절한 DTW방식을 사용하였고, 와이퍼 속도는 퍼지 추론을 적용하여 구하였다.

  • PDF

Trends of Hardware Accelerator for the Embedded Speech Recognition (내장형 음성인식기를 위한 전용 하드웨어가속기 기술개발 동향)

  • Kim, J.Y.;Kim, T.J.;Lee, J.H.;Eum, N.W.
    • Electronics and Telecommunications Trends
    • /
    • v.29 no.4
    • /
    • pp.91-100
    • /
    • 2014
  • 사람의 말소리를 문자로 변환하여 기기의 제어명령으로 활용하는 것이 음성인식 기술이다. 음성인식에 대한 기술개발 요구는 수십 년 전부터 있어 왔고, 꾸준히 제품화되고 있는 분야라 하겠다. 제품으로의 상용화가 가능한 알고리즘 및 데이터 처리체계는 HMM(Hidden Markov Model)이라는 수학적 모델링으로 정형화되어 있으며, 대규모의 반복적 데이터 수집과 정교한 학습 데이터베이스의 구축이 음성인식기술의 핵심요소라는 것이 일반적인 시각이다. 이러한 이유로 인해, 대용량 음성인식 데이터베이스의 수집, 가공 등이 가능한 인프라를 갖춘 기관 및 업체들이 음성인식기술 시장을 점유할 수 있는 것이다. 그러나, 이러한 음성인식의 서비스 제공 체계는 사물인터넷 또는 웨어러블 디바이스 등으로 음성인식 사용자 인터페이스가 확대되고 통신 및 네트워크가 연결이 불가한 경우 그 한계를 보일 수 있다. 본고에서는 이러한 문제를 해결하기 위한 내장형 음성인식기의 하드웨어가속기 기술개발에 대한 내용과 국내외 현황을 살펴보기로 한다.

  • PDF

Post-Processing of Speech Recognition Using User Utterance Sequential Pattern (사용자 발화 순차패턴을 이용한 음성인식 후처리)

  • Song, Won-Moon;Kim, Eun-Ju;Kim, Myung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.709-711
    • /
    • 2005
  • 최근 음성인식 분야에서는 발화된 음성의 단순한 신호 처리위주의 인식 결과로부터 좀 더 신뢰할 수 있는 결과를 얻기 위하여 여러 가지 후처리 기법들이 연구되고 있다. 본 논문에서는 개인 사용자를 위한 음성 명령어 인식 환경에서 사용자의 발화 정보를 후처리에 적용함으로써 사용자 정보를 고려한 음성인식 후처리 기법을 제안한다. 먼저 이전에 사용했던 음성 명령어들로부터 명령어 발화 순차 패턴 규칙을 추출 한 후 사용자가 사전에 발화한 명령어를 바탕으로 구성된 순차 패턴을 비교하여 순차 규칙상 얻어 질 수 있는 단어를 결정한다. 이렇게 얻어진 단어를 고려하여 음성인식기 인식단어 후보들의 확률값을 적절히 보정한 후 최종 인식 단어를 재결정한다. 이러한 과정에서 적절한 보정을 위하여 발화 순차 패턴의 신뢰도와 인식기의 결과단어를 고려한 보정 방법을 제안한다. 실험을 통하여 제안한 후처리를 이용한 음성인식이 HMM을 이용한 기본 음성인식에 비해 오류율을 $15\%$이상 낮추어 인식률에 상당한 기여를 하였음을 확인할 수 있다.

  • PDF

The University Gusdance System using the Alexa (Alexa를 이용한 대학안내 시스템)

  • Kim, Tae Jin;Kim, Dong Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.11
    • /
    • pp.2061-2066
    • /
    • 2017
  • The voice recognition technology is to recognize the voice of an user and execute the command. Recently, the voice recognition is evolving to the artificial intelligence voice recognition by adding the scheme of the natural language processing. The AI voice recognition is exploited to control the IoT devices or provide the information, such as the news or the wether. The University Information which is one of fields serviced by the information provider is mainly presented on the web. However, since too much information are presented on the web, it is difficult for an user to find efficiently the specific information which the user want to know. In this paper, we design and implement the university guidance system to recognize the user voice searching the information and provide the result using the voice. To do this, we classify the university data and design the lambda function to provide the data.

Enhancement of Ship's Wheel Order Recognition System using Speaker's Intention Predictive Parameters (화자의도예측 파라미터를 이용한 조타명령 음성인식 시스템의 개선)

  • Moon, Serng-Bae
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.32 no.5
    • /
    • pp.791-797
    • /
    • 2008
  • The officer of the deck(OOD) may sometimes have to carry out lookout as well as handling of auto pilot without a quartermaster at sea. The purpose of this paper is to develop the ship's auto pilot control module using speech recognition in order to reduce the potential risk of one man bridge system. The feature parameters predicting the OOD's intention was extracted from the sample wheel orders written in SMCP(IMO Standard Marine Communication Phrases). We designed a pre-recognition procedure which could make some candidate words using DTW(Dynamic Time Warping) algorithm, a post-recognition procedure which made a final decision from the candidate words using the feature parameters. To evaluate the effectiveness of these procedures the experiment was conducted with 500 wheel orders.

The Relationship between Voice Recognition Games and Education: Current Research Trends and Future Perspectives (음성인식 게임과 교육의 연관성: 현재 연구 동향과 전망)

  • Se Jeong Heo;Sung Jin Kim;Young Hyun Yoon;Jai Soon Baek
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.397-398
    • /
    • 2023
  • 본 논문은 음성인식 기술을 활용한 게임과 교육 분야의 연계성에 대한 연구를 제시한다. 음성인식 게임은 사용자의 음성 명령을 인식하고 상호작용을 가능하게 함으로써 학습자의 참여와 흥미를 유발한다. 관련 연구들은 음성인식 게임이 언어 학습, 수학 학습, 학습 장애 학생 지원 등 다양한 교육 분야에서 효과적으로 활용될 수 있다는 것을 보여준다. 음성인식 게임은 교육 환경에서의 음성인식 기술의 잠재력을 제시하며, 추가 연구가 필요하다는 결론을 도출한다.

  • PDF

Mobile Control System using Semantic Analysis of User's Intent (화자 의도 분석을 통한 모바일 기기 제어 시스템)

  • Park, Hee-Guen;Jang, Jung-Hoon;Ahn, Young-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.282-284
    • /
    • 2012
  • 음성 인식 기술의 발전과 더불어 다양한 분야에서 음성 인식 시스템이 활용되고 있다. 본 논문에서는 사용자 음성으로부터 입력된 문장의 의도를 파악하여 모바일 기기를 제어할 수 있는 시스템에 대해서 기술한다. 사용자의 의도를 파악하기 위해, 동일한 의미를 가진 문장 형태들을 LSP(Lexico Semantic/Syntactic Pattern)로 구성하였고, 이를 이용하여 입력된 문장의 의도를 파악할 수 있는 문장-의미 분석 시스템을 구현하였다. 사용자의 음성 인식은 구글 안드로이드 음성 인식 모듈을 이용하였으며, 음성 인식 모듈과 문장-의미 분석 시스템을 통해 얻어진 화자의 의도는 모바일 기기의 동작과 연결된다. 본 논문은 자연적인 음성 명령을 통해 자연스러운 모바일 제어가 가능하다는 것을 보여준다.

Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer (형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템)

  • Park, Dae-Geun;Lee, Wan-Bok
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.2
    • /
    • pp.159-165
    • /
    • 2019
  • Based on deep learning technology, speech recognition method has began to be applied to commercial products, but it is still difficult to be used in the area of VR contents, since there is no easy and efficient way to process the recognized text after the speech recognition module. In this paper, we propose a Korean Language Command System, which can efficiently recognize and respond to Korean speech commands. The system consists of two components. One is a morphological analyzer to analyze sentence morphemes and the other is a retrieval based model which is usually used to develop a chatbot system. Experimental results shows that the proposed system requires only 16% commands to achieve the same level of performance when compared with the conventional string comparison method. Furthermore, when working with Google Cloud Speech module, it revealed 60.1% of success rate. Experimental results show that the proposed system is more efficient than the conventional string comparison method.

Integrated Analysis System for Monitoring and Therapy of Phonation (발성 검사 및 치료를 위한 통합 장치)

  • 남기창;김수찬;김한수;남지인;남도현;김덕원;최홍식
    • Proceedings of the IEEK Conference
    • /
    • 2003.07c
    • /
    • pp.2883-2886
    • /
    • 2003
  • 좋은 발성을 위하여 음성이 만들어지려면, 뇌의 언어중추의 명령에 의하여 신경망을 통하여 ‘호흡기관(폐와 흉곽. 호흡관련 근육들)’과 ‘발성기관(주로 후두 즉 성대)’ 그리고 ‘조음, 공명기관(인두, 구강 및 비강)’의 근육들이 유기적으로 작용하여야 한다. 이런 협력 체제에 문제가 생기면, 다양한 종류의 질환이 유발될 수 있다[1,2]. 현재 임상에서 음성 분석을 위해 사용되는 시스템은 대부분 성대의 진동을 측정하기 위해 stroboscopy, 전기성문파형검법 (EGG, electroglottography), 후두근전도 중의 한 방법과 음성 분석을 위한 분석 프로그램으로 구성되어 있다. 그러나, 발성은 호흡과 매우 밀접한 관계가 있어 음성, 성대의 진동, 호흡 관계를 종합적으로 관찰할 필요가 있다. 본 연구에서는 발성 시 성대 점막의 접촉 양상은 ECG 로 측정하며, 발성의 주 에너지원이 되는 호흡의 변화를 2 channel 인덕턴스 호흡감시 장치(RIP: repiratory inductive plethymography)를 이용하여 흉곽의 움직임과 상 복강의 움직임에 대하여 측정하며, 발성되는 음성은 마이크로폰을 통하여 측정하는 ‘EGG, 음성, 호흡 통합검사 장치’를 개발하였다.

  • PDF