• 제목/요약/키워드: 음성 명령

검색결과 112건 처리시간 0.03초

음성지시에 의한 선박 조종 및 윈치 제어 시스템 (Ship s Maneuvering and Winch Control System with Voice Instruction Based Learning)

  • 서기열;박계각
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.517-523
    • /
    • 2002
  • 본 논문에서는 자연언어를 이용하는 인간의 학습방법에 기초한 LIBL방법의 실용화를 위하여 음성지시기반학습(VIBL : Voice Instruction Based Learing)을 선박의 조타 시스템, 주기원격제어시스템(MERCS), 윈치기기에 적용하여 항해사의 조타명령과 같은 언어적 지시가 조타수를 경유하여 수행되는 과정을 대체하는 VIBL법을 이용한 조타기, 주기 원격 조종장치, 윈치 기기를 제어하는 시스템을 제안하고자 한다. 구체적인 연구방법으로는 조타수의 적절한 조타조작모델을 퍼지추론 규칙을 이용하여 구현하고, 적절한 의미소 및 평가규칙을 제시한 언어지시 기반 학습방법을 선박의 조타시스템에 적용하여 지시자의 음성언어지시에 보다 효율적으로 응답하는 지능형 조타기 제어 시스템을 구현하고, 지시자의 음성지시를 인식하여 주기 원격 조종 장치와 윈치 기기를 제어하는 시스템을 구현한다. 음성언어지시를 인식하여 텍스트로 변환하기 위한 기법과 퍼지추론을 이용하여 조타수의 경험을 바탕으로 한 조타 조작 모델을 구축하였고, 지능형 조타 시스템을 위한 타각, 방위도달시간, 정상상태의 의미소를 제안하여, 조타수 조작 모델 규칙을 수정하기 위한 평가규칙을 제시하였다. 또한, 구현된 음성인식 선박조종 시뮬레이터에 적용하여 그 유효성을 확인하였다.

다중 사용자 자율 주행 운전 환경에서 사회적 지위에 따른 에이전트의 제어권이 사용자 경험 요소에 미치는 영향 (Understanding how agent control based on social status affects user experience factors in multi-user autonomous driving environments)

  • 김지연;하주혜;오창훈
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.735-745
    • /
    • 2023
  • 본 연구는 자율주행차량의 다중 사용자 환경에서 사회적 지위에 따른 에이전트의 제어권이 차량 소유주의 경험에 어떠한 영향을 미치는지 확인한다. 본 연구의 사용자 조사에서 참가자들은 사회적 지위가 높은 동승자 명령 수행 여부와 과제 중심적 시나리오(주행 상황, 비주행 상황)를 결합한 4가지를 시청한 후 이에 대한 유용성과 통제감을 설문 평가하였다. 그 결과, 유용성의 모든 항목(편리성, 효과성, 효율성)은 주행중 상황과 동승자 명령의 비이행에서 반대 조건에 비해 더 높은 평가를 받았다. 사후 인터뷰 결과, 참가자들은 에이전트가 사회적 지위를 고려하는 것보다 목적 달성을 효과적으로 하였을 때 더욱 긍정적으로 평가하는 것으로 나타났으며, 에이전트에 대한 통제권은 차량 소유주가 가지고 있어야 한다는 의견이 지배적이었다. 이 연구 결과는 향후 자율주행 상황에서 에이전트와 운전자 및 동승자 간의 인터랙션 방식의 디자인을 위한 가이드라인이 될 수 있다는 점에서 의의가 있다.

립모션 기반의 윈도우즈 애플리케이션 제어 모델에 관한 연구 (A Study on the Windows Application Control Model Based on Leap Motion)

  • 김원
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.111-116
    • /
    • 2019
  • 최근 컴퓨터 능력의 급속한 발전으로 인간과 컴퓨터간의 상호 작용을 편리하게 연결할 수 있는 많은 기술들이 연구되고 있는 상황으로, 전통적인 입력장치를 사용한 GUI에서 3D 모션, 햅틱, 멀티 터치와 같은 신체를 이용한 NUI로 패러다임이 변화되고 있는 추세이다. 인간의 동작을 센서를 이용하여 컴퓨터에 전달하는 많은 연구가 이루어지고 있으며, 3D 객체를 획득할 수 있는 광학 센서의 개발과 더불어 산업 및 의료 분야, 사용자 인터페이스 분야 등으로 응용 범위가 확장되고 있다. 본 논문에서는 립모션을 기반으로 사용자의 손동작에 따라 기본 입력장치인 마우스를 대신하여 제스처를 통한 타 프로그램 실행 및 윈도우즈 제어가 가능하며, 안드로이드 앱과 융합하여 메인 클라이언트와 연결을 통하여, 음성인식과 버튼을 사용해 각종 미디어와 음성 명령 기능을 통한 제어가 가능한 모델을 제안한다. 제안 모델을 통하여 영상, 음악과 같은 인터넷 미디어를 클라이언트 컴퓨터 뿐만 아니라 앱을 통한 원거리 제어가 가능하여, 편리하게 미디어를 시청할 수 있을 것으로 기대된다.

스마트 거울의 제작을 통해 이루어진 공학 교육 실천 방법론에 관한 연구 (A Study on the Practical Methodology of Engineering Education through the Making of Smart Mirror)

  • 서명덕;권지영;장은영
    • 실천공학교육논문지
    • /
    • 제10권1호
    • /
    • pp.9-15
    • /
    • 2018
  • 음성 인식 기반 API를 이용하여 디지털 사이니지(Digital Signage)를 구성하고, 상용화된 다른 제품들과 차별되도록 사용자의 음성 명령으로 날씨, 지도, 운동 정보, 일정, 영상 등의 정보를 얻는 VRSM(Voice Recognition Smart Mirror)을 제안하여, 독자적인 졸업인증제의 결과물로 평가받는 과정을 통해, 공학교육의 효과적인 실천 방안을 제시한다. 전공에서 2인 1조로 3학기동안 진행되는 작품 설계 및 제작 기회를 경험하였다. 종합설계를 통해 공학적 접근 방법과 창의적 사고 기회를 경험하였으며, 그 중간 결과에 대해 본 학회의 학술대회에 참가하여 우수 학술상을 수상하였고, 기타 학회의 논문 경진대회에서도 입상의 결과를 얻었다. 이 과정을 통해 얻어진 실무 능력의 향상이 자신감과 취업 기회 획득에 유리함을 실제 취업들을 통해 입증하였다.

상지장애인을 위한 시선 인터페이스에서의 객체 확대 및 음성 명령 인터페이스 개발 (Object Magnification and Voice Command in Gaze Interface for the Upper Limb Disabled)

  • 박주현;조세란;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제24권7호
    • /
    • pp.903-912
    • /
    • 2021
  • Eye tracking research for upper limb disabilities is showing an effect in the aspect of device control. However, the reality is that it is not enough to perform web interaction with only eye tracking technology. In the Eye-Voice interface, a previous study, in order to solve the problem that the existing gaze tracking interfaces cause a malfunction of pointer execution, a gaze tracking interface supplemented with a voice command was proposed. In addition, the reduction of the malfunction rate of the pointer was confirmed through a comparison experiment with the existing interface. In this process, the difficulty of pointing due to the small size of the execution object in the web environment was identified as another important problem of malfunction. In this study, we propose an auto-magnification interface of objects so that people with upper extremities can freely click web contents by improving the problem that it was difficult to point and execute due to the high density of execution objects and their arrangements in web pages.

문서 편집 접근성 향상을 위한 음성 명령 기반 모바일 어플리케이션 개발 (Voice Activity Detection Algorithm using Wavelet Band Entropy Ensemble Analysis in Car Noisy Environments)

  • 박주현;박세아;이무늬;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제21권11호
    • /
    • pp.1342-1352
    • /
    • 2018
  • Voice Command systems are important means of ensuring accessibility to digital devices for use in situations where both hands are not free or for people with disabilities. Interests in services using speech recognition technology have been increasing. In this study, we developed a mobile writing application using voice recognition and voice command technology which helps people create and edit documents easily. This application is characterized by the minimization of the touch on the screen and the writing of memo by voice. We have systematically designed a mode to distinguish voice writing and voice command so that the writing and execution system can be used simultaneously in one voice interface. It provides a shortcut function that can control the cursor by voice, which makes document editing as convenient as possible. This allows people to conveniently access writing applications by voice under both physical and environmental constraints.

한국 중학생의 영어 읽기 발화에서 문장유형에 따른 유창성 등급과 초분절 요소의 관계 (The relationship between fluency levels and suprasegmentals according to the sentence types in the English read speech by Korean middle school English learners)

  • 김화영
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.51-66
    • /
    • 2022
  • 본 연구의 목적은 한국인 영어 학습자가 영어문장을 읽을 때 어떠한 초분절 요소가 영어 원어민 화자에 가깝게 구현되는데 영향을 미치는지를 밝혀 영어 발음교육에 도움이 되고자 하는 것이다. 본 연구에서는 연구대상자를 중학생 영어학습자로 선택하고, 다양한 유형의 문장(평서문, 의문문, 명령문, 감탄문)과 음절수로 연구 자료를 구성하였다. 이들 영어 문장 발화의 분석대상으로는 초분절 요소 중 발화속도, 휴지빈도, 휴지길이, F0 범위, 리듬을 이용하였고 음성분석 결과는 평균분석, 상관분석 및 회귀분석을 실시하였다. 그 결과, 발화속도, 휴지빈도, 휴지길이, F0 범위가 유창성 등급 평가에 영향을 미친다는 결과를 얻었다. 모든 초분절 요소와 유창성 등급 간의 회귀분석에서는 유창성 등급에 영향을 미치는 초분절 요소는 발화속도와 F0 범위이다. 리듬은 유창성 등급과의 관계에서 통계적으로 유의미하지 않았다. 따라서, 영어 발음교육을 할 때 발화속도를 높이고, F0 범위를 크게 하도록 교육하는 것이 필요하다. 또한, 발화시 휴지개수와 휴지시간을 줄이도록 하는 교육이 유창성을 높이는데 도움이 된다. 문장유형을 분류하여 분석한 결과, 감탄문의 경우 다른 문장유형에 비해 발화속도가 더 빠르고, 휴지빈도는 더 적고, 휴지길이는 더 짧으며, 리듬값은 더 높았다.

HMM을 기반으로 한 자율이동로봇의 음성명령 인식시스템의 개발 (Development of Autonomous Mobile Robot with Speech Teaching Command Recognition System Based on Hidden Markov Model)

  • 조현수;박민규;이현정;이민철
    • 제어로봇시스템학회논문지
    • /
    • 제13권8호
    • /
    • pp.726-734
    • /
    • 2007
  • Generally, a mobile robot is moved by original input programs. However, it is very hard for a non-expert to change the program generating the moving path of a mobile robot, because he doesn't know almost the teaching command and operating method for driving the robot. Therefore, the teaching method with speech command for a handicapped person without hands or a non-expert without an expert knowledge to generate the path is required gradually. In this study, for easily teaching the moving path of the autonomous mobile robot, the autonomous mobile robot with the function of speech recognition is developed. The use of human voice as the teaching method provides more convenient user-interface for mobile robot. To implement the teaching function, the designed robot system is composed of three separated control modules, which are speech preprocessing module, DC servo motor control module, and main control module. In this study, we design and implement a speaker dependent isolated word recognition system for creating moving path of an autonomous mobile robot in the unknown environment. The system uses word-level Hidden Markov Models(HMM) for designated command vocabularies to control a mobile robot, and it has postprocessing by neural network according to the condition based on confidence score. As the spectral analysis method, we use a filter-bank analysis model to extract of features of the voice. The proposed word recognition system is tested using 33 Korean words for control of the mobile robot navigation, and we also evaluate the performance of navigation of a mobile robot using only voice command.

중국 인공지능 스피커 사용자 경험에 관한 연구 - 티몰 지니와 샤오미 스마트 스피커를 중심으로 - (A Study on the User Experience of Smart Speaker in China - Focused on Tmall Genie and Mi AI Speaker -)

  • 소신정;김승인
    • 디지털융복합연구
    • /
    • 제16권10호
    • /
    • pp.409-414
    • /
    • 2018
  • 최근 중국의 스마트 스피커 사용량이 지속해서 증가하고 있다. 본 연구는 중국 스마트 스피커 사용자의 사용자 경험을 조사하는 것에 목적이 있다. 따라서 본 연구는 스마트 스피커의 이론적 배경에 관한 문헌 연구와 세계적으로 인기있는 스마트 스피커 브랜드에 대한 사례 연구를 하였다. 이에 따라 중국에서 가장 많이 팔린 스마트 스피커 제품인 티몰지니와 샤오미 스마트 스피커 사용자 8명을 심층 인터뷰하였다. 인터뷰는 피터 모빌의 허니콤 모델의 7가지 원칙에 바탕으로 문제를 설정했다. 그 결과, 스마트 스피커의 유용성과 사용성에서 사용자들의 불편함을 알 수 있었다. 또한, 신뢰성에서는 사용자들이 스마트 스피커를 이용하면서 큰 불만을 느끼는 것을 확인할 수 있었다. 따라서 향후 스마트 스피커 사용자들에게 기능성과 사용성을 보완하기 위해 사용자 경험 측면을 고려해야 할 것이다.

음성명령기반 26관절 보행로봇 실시간 작업동작제어에 관한 연구 (A Study on Real-Time Walking Action Control of Biped Robot with Twenty Six Joints Based on Voice Command)

  • 조상영;김민성;양준석;구영목;정양근;한성현
    • 제어로봇시스템학회논문지
    • /
    • 제22권4호
    • /
    • pp.293-300
    • /
    • 2016
  • The Voice recognition is one of convenient methods to communicate between human and robots. This study proposes a speech recognition method using speech recognizers based on Hidden Markov Model (HMM) with a combination of techniques to enhance a biped robot control. In the past, Artificial Neural Networks (ANN) and Dynamic Time Wrapping (DTW) were used, however, currently they are less commonly applied to speech recognition systems. This Research confirms that the HMM, an accepted high-performance technique, can be successfully employed to model speech signals. High recognition accuracy can be obtained by using HMMs. Apart from speech modeling techniques, multiple feature extraction methods have been studied to find speech stresses caused by emotions and the environment to improve speech recognition rates. The procedure consisted of 2 parts: one is recognizing robot commands using multiple HMM recognizers, and the other is sending recognized commands to control a robot. In this paper, a practical voice recognition system which can recognize a lot of task commands is proposed. The proposed system consists of a general purpose microprocessor and a useful voice recognition processor which can recognize a limited number of voice patterns. By simulation and experiment, it was illustrated the reliability of voice recognition rates for application of the manufacturing process.