• 제목/요약/키워드: voice commands

검색결과 47건 처리시간 0.037초

Interactive Adaptation of Fuzzy Neural Networks in Voice-Controlled Systems

  • Pulasinghe, Koliya;Watanabe, Keigo;Izumi, Kiyotaka;Kiguchi, Kazuo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.42.3-42
    • /
    • 2002
  • Fuzzy Neural Network (FNN) is a compulsory element in a voice-controlled machine due to its inherent capability of interpreting imprecise natural language commands. To control such a machine, user's perception of imprecise words is very important because the words' meaning is highly subjective. This paper presents a voice based controller centered on an adaptable FNN to capture the user's perception of imprecise words. Conversational interface of the machine facilitates the learning through interaction. The system consists of a dialog manager (DM), the conversational interface, a Knowledge base, which absorbs user's perception and acts as a replica of human understanding of imprecise words,...

  • PDF

시각장애인용 웹사이트 자동생성 툴 개발 (Development of Automatic Creating Web-Site Tool for the Blind)

  • 백현기;하태현
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.467-474
    • /
    • 2007
  • 본 연구는 시각장애인을 위해 음성 인식, 음성 합성 기술을 이용하여 일반인과 마찬가지로 개인의 특성에 맞는 홈페이지를 구축하게 하는 웹 사이트 자동 생성 툴을 개발 하였다. 이 연구에서 개발한 툴을 이용하여 시각 장애인은 개인 맞춤 정보 생성 기능과 관리기능을 통해 일반인과 의사소통을 원활하게 할 수 있다. 또한 이 툴은 기본적인 명령어를 음성인식으로 처리할 수 있게 지원하며, 음성출력이 지원되는 TTS등을 추가적으로 제공한다. 따라서 본 연구개발의 결과물은 시각장애인들이 사회적 소외감을 없애며, 정보화 시대에 동등한 위치에서 생활 할 수 있도록 하는데 중요한 역할을 할 것이다.

  • PDF

후처리를 이용한 음성 다이얼링 시스템의 성능향상 (Performance Improvement of Voice Dialing System using Post-Processing)

  • 김원구
    • 한국음향학회지
    • /
    • 제19권5호
    • /
    • pp.9-12
    • /
    • 2000
  • 음성 다이얼링 시스템은 화자의 음성을 인식하여 원하는 전화번호로 자동으로 전화를 걸어주는 시스템으로 주로 이동 전화나 휴대형 통신 장비에 유용하게 사용된다. 개인 음성 다이얼링 시스템의 경우, 다이얼링에 사용되는 모든 구문은 사용자가 선택하고 사용자의 음성을 사용하여 학습되어 음성 인식을 위한 HMM을 생성한다. 이러한 시스템은 화자독립 시스템 보다 매우 적은 메모리 공간과 계산량으로 구현이 가능하다. 그러나 이러한 시스템은 학습시 각 단어당 2-3개의 음성만을 사용하므로 음성인식 시스템의 성능을 개선하기 위한 각 상태에서의 상태지속분포을 추정하기는 매우 어렵다. 따라서 본 논문에서는 성능개선을 위한 후처리기를 제안하였다. 전화선을 통하여 구성된 데이터베이스를 이용한 실험에서 제안된 후처리기가 인식 시스템의 성능을 향상시킴을 확인하였다.

  • PDF

A Fuzzy-Neural Network Based Human-Machine Interface for Voice Controlled Robots Trained by a Particle Swarm Optimization

  • Watanabe, Keigo;Chatterjee, Amitava;Pulasinghe, Koliya;Izumi, Kiyotaka;Kiguchi, Kazuo
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.411-414
    • /
    • 2003
  • Particle swarm optimization (PSO) is employed to train fuzzy-neural networks (FNN), which can be employed as an important building block in real life robot systems, controlled by voice-based commands. The FNN is also trained to capture the user spoken directive in the context of the present performance of the robot system. The system has been successfully employed in a real life situation for navigation of a mobile robot.

  • PDF

An Experimental Study on Barging-In Effects for Speech Recognition Using Three Telephone Interface Boards

  • Park, Sung-Joon;Kim, Ho-Kyoung;Koo, Myoung-Wan
    • 음성과학
    • /
    • 제8권1호
    • /
    • pp.159-165
    • /
    • 2001
  • In this paper, we make an experiment on speech recognition systems with barging-in and non-barging-in utterances. Barging-in capability, with which we can say voice commands while voice announcement is coming out, is one of the important elements for practical speech recognition systems. Barging-in capability can be realized by echo cancellation techniques based on the LMS (least-mean-square) algorithm. We use three kinds of telephone interface boards with barging-in capability, which are respectively made by Dialogic Company, Natural MicroSystems Company and Korea Telecom. Speech database was made using these three kinds of boards. We make a comparative recognition experiment with this speech database.

  • PDF

그로브 제스처 센서를 활용한 모션 및 음성 인식 스마트 미러에 관한 연구 (A Study on the Motion and Voice Recognition Smart Mirror Using Grove Gesture Sensor)

  • 최희태;고창훈;정지민;신예슬;박형근
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1313-1320
    • /
    • 2023
  • 본 논문에서는 그로브 제스처를 사용하여 스마트 미러의 화면을 제어하고 음성인식 기능을 통해 화면에 웹 브라우저 검색 기능과 거울화면을 제어할 수 있는 스마트 미러를 제안하였다. 스마트 미러의 하드웨어 구성은 LCD모니터에 아크릴 판을 결합하고 반사율 37% 투과율 36%의 하프미러필름을 아크릴판에 부착하여 거울처럼 사용함과 동시에 거울에 디스플레이를 표시하도록 제작하였다. 제안한 스마트 미러는 사용자가 직접 거울을 터치하거나 키보드를 조작하는 등의 번거로운 작업 없이 그로브 제스처 센서를 통해 간단한 손동작만으로 화면을 제어할 수 있는 기능을 구현하였으며 음성인식 기능과 GoogleAssistant를 도입하여 사용자가 내린 음성명령에 일치하는 결과를 화면에 출력하였다.

스마트 스피커 대상 가청 주파수 대역을 활용한 적대적 명령어 공격 방법 제안 (Proposal of Hostile Command Attack Method Using Audible Frequency Band for Smart Speaker)

  • 박태준;문종섭
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.1-9
    • /
    • 2022
  • 최근 스마트 스피커의 기능이 다양해지면서 스마트 스피커의 보급률이 증가하고 있다. 보급이 증가함에 따라 스마트 스피커에 대해 비정상적인 행위를 발생시키는 기법이 제안되고 있으며 여러 가지 공격 중 Voice Controllable System(VCS)에 대해 비정상적인 행위를 발생시키는 DolphinAttack은 초음파(f>20kHz)를 이용하여 사용자의 인식 없이 VCS를 제3자가 제어하는 방법이다. 하지만 기존의 제어 방법은 초음파 대역을 사용하기 때문에 초음파 신호를 출력할 수 있는 초음파 스피커나 초음파 전용 장비의 설치가 필요했다. 본 논문에서는 추가적인 장비, 즉, 초음파 장비의 설치 없이 사람의 가청 주파수 대역이지만 노화에 의해 듣기 힘든 주파수(18k~20kHz)로 변조된 음성신호를 출력하여, 스마트 스피커를 제어하는 방법을 제안한다. 스마트 스피커의 경우 마이크가 내장되어 있어, 변조된 음성신호를 수신할 수 있다. 본 논문에서 제안한 방법으로 수행한 결과, 가청 대역임에도 불구하고 사람은 음성명령을 인식하지 못하였으며, 스마트 스피커에 대해 82~96%의 확률로 제어가 가능했다.

에코를 활용한 개인용 컴퓨터 조작 시스템의 설계 (The Design of Controller System for a Personal Computer Using Echo)

  • 이태준;김동현;안성우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.143-144
    • /
    • 2018
  • 일반적으로 개인용 컴퓨터를 조작하기 위하여 사용자는 시각과 손을 사용해야 한다. 시각과 손이 불편한 대부분 장애우들은 개인용 컴퓨터를 조작하기 매우 어려우며 장애우를 보조하기 위한 장치들은 가격이 비싼 문제가 있다. 이 논문에서는 아마존 에코를 이용하여 음성으로 개인용 컴퓨터를 조작하기 위한 시스템을 제안한다. 제안한 시스템은 설계한 스킬이 저장된 아마존 웹 서버에서 개인용 컴퓨터로 접근하여 개인용 컴퓨터의 마우스를 제어하고 이를 이용하여 응용 프로그램을 조작한다.

  • PDF

감성 상호작용을 갖는 교육용 휴머노이드 로봇 D2 개발 (Design and implement of the Educational Humanoid Robot D2 for Emotional Interaction System)

  • 김도우;정기철;박원성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1777-1778
    • /
    • 2007
  • In this paper, We design and implement a humanoid robot, With Educational purpose, which can collaborate and communicate with human. We present an affective human-robot communication system for a humanoid robot, D2, which we designed to communicate with a human through dialogue. D2 communicates with humans by understanding and expressing emotion using facial expressions, voice, gestures and posture. Interaction between a human and a robot is made possible through our affective communication framework. The framework enables a robot to catch the emotional status of the user and to respond appropriately. As a result, the robot can engage in a natural dialogue with a human. According to the aim to be interacted with a human for voice, gestures and posture, the developed Educational humanoid robot consists of upper body, two arms, wheeled mobile platform and control hardware including vision and speech capability and various control boards such as motion control boards, signal processing board proceeding several types of sensors. Using the Educational humanoid robot D2, we have presented the successful demonstrations which consist of manipulation task with two arms, tracking objects using the vision system, and communication with human by the emotional interface, the synthesized speeches, and the recognition of speech commands.

  • PDF

시니어 사용자를 위한 챗봇활용 음성인식 스피커 개발 방법 (An Approach to Develop a Speech Recognition Speaker Using Chatbot for Senior Users)

  • 노건호;이경용;문미경
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.330-338
    • /
    • 2018
  • 인구 고령화가 진행됨에 따라 혼자 사는 1인 가구의 증가로 인해 외로움, 소외감, 우울증 등 각종 부정적인 문제가 사회 전반에 걸쳐 증가하고 있다. 이로 인해 혼자 자립생활을 하는 노인층을 위해 심리적 불안감 해소, 위험 상태의 인지, 가족 안부 확인 등을 손쉽게 할 수 있는 IT기술의 요구가 더욱 높아지고 있다. 본 논문에서는 시니어 사용자가 집에서 음성으로 간단한 대화식 명령을 줄 수 있고 사용자의 상태를 모니터링 할 수 있는 음성인식 스피커의 개발내용에 대해 기술한다. 이 스피커는 사용자 음성 분석과 챗봇 서비스를 통해 대화 내용을 파악하고 사용자가 원하는 서비스를 연결하여 그 결과를 다시 음성으로 제공해준다. 시니어 사용자가 본 스피커를 사용함으로써 자연스러운 대화기능을 통해 말벗이 되어 심리적 안정을 취할 수 있으며, 상태 모니터링 기능을 통해 위험 상태 인지를 좀 더 용이하게 할 수 있을 것으로 기대한다.