• Title/Summary/Keyword: Voice Recognition Technique

Search Result 43, Processing Time 0.022 seconds

차량환경에서 음성명령어기 사용을 위한 음성개선방법 (Speech Enhancement for Voice commander in Car environment)

  • 백승권;한민수;남승현;이봉호;함영권
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-16
    • /
    • 2004
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다 특히 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단일 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman 필터를 이용하여 시간상 단구간 정적 잡음을 제거한다. 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다.

모바일-매니퓰레이터 구조 로봇시스템의 안정한 모션제어에 관한연구 (A Study on Stable Motion Control of Mobile-Manipulators Robot System)

  • 박문열;황원준;박인만;강언욱
    • 한국산업융합학회 논문집
    • /
    • 제17권4호
    • /
    • pp.217-226
    • /
    • 2014
  • Since the world has changed to a society of 21st century high-tech industries, the modern people have become reluctant to work in a difficult and dirty environment. Therefore, unmanned technologies through robots are being demanded. Now days, effects such as voice, control, obstacle avoidance are being suggested, and especially, voice recognition technique that enables convenient interaction between human and machines is very important. In this study, in order to conduct study on the stable motion control of the robot system that has mobile-manipulator structure and is voice command-based, kinetic interpretation and dynamic modeling of two-armed manipulator and three-wheel mobile robot were conducted. In addition, autonomous driving of three-wheel mobile robot and motion control system of two-armed manipulator were designed, and combined robot control through voice command was conducted. For the performance experiment method, driving control and simulation mock experiment of manipulator that has two-armed structure was conducted, and for experiment of combined robot motion control which is voice command-based, through driving control, motion control of two-armed manipulator, and combined control based on voice command, experiment on stable motion control of voice command-based robot system that has mobile-manipulator structure was verified.

음성인식모듈을 이용한 선박조타용 임베디드 시스템 개발 (Development of an Embedded System for Ship′s Steering Gear using Voice Recognition Module)

  • 서기열;홍태호;김화영;박계각
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.144-148
    • /
    • 2004
  • Recently, various studies had been made for automatic control system of small ships, in order to improve maneuvering and to reduce labor and working on board. To achieve efficient operation of small ships, it had accomplished to rapid development of automatic technique, but the ship operation had been more complicated because of the need to handle various gauges and instruments. To solve these problems, there are examples to be applied to the speech information processing technologies which is one of the human interface methods in the system operation of ship, but the implementation of definite system is still incomplete. Therefore, the purpose of this paper is to implement the control system for ship steering using the voice recognition module.

  • PDF

VoiceXML을 이용한 음성 DB 수집 시스템 구현 (An Implementation of Speech DB Gathering System Using VoiceXML)

  • 김동현;노용완;홍광석
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.39-50
    • /
    • 2005
  • 음성 DB는 음성학, 음성인식, 음성합성 등을 연구할 때 가장 기본적으로 필요한 요소이다. 음성 DB의 양과 질이 개발하고자하는 시스템의 성능을 좌우한다고 할 정도로 음성 DB의 중요성 및 역할은 막중하다. 최근 음성포탈을 비롯한 다양한 전화 서비스 기술의 발달로 인하여 전화 음성 DB 수집의 필요성이 시급한 상황이다. 기존 CTI 분야의 IVR 애플리케이션 전화음성 DB 수집 시스템은 C/C++언어나 전용 개발 도구를 사용하여 이루어져 왔으며, 이로 인하여 각 응용서비스간 자원의 재활용이 어려운 실정이며 많은 인력과 시간을 필요하다는 문제점을 가지고 있다. 그러나, VoiceXML의 전화 음성 DB 수집시스템은 XML에 내포된 태그형식을 갖는 언어로써 쉽고, 간단한 문법체계를 가지고 있어 조금만 노력을 기울이면 손쉽게 작성할 수 있어 인력과 시간을 절약할 수 있는 장점을 가지고 있다. 또한 단지 웹서버에 연결된 DB의 내용만을 변경함으로써 다양한 전화 음성 DB를 수집할 수 있는 장점을 가지고 있다. 본 논문에서는 음성인식이나 음성합성 등 음성정보처리기술의 개발에 가장 중요한 요소인 음성 DB를 Voiceful을 사용하여 전화 음성 DB를 수집하는 시스템을 소개한다.

  • PDF

CHMM 어휘인식에서 채널 유사성을 이용한 선택적 음성 특징 추출 (Selective Speech Feature Extraction using Channel Similarity in CHMM Vocabulary Recognition)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.453-458
    • /
    • 2013
  • HMM 음성 인식 시스템은 환경적 잡음과 여러 음성의 혼합으로 인하여 정확한 음성을 인지하지 못하는 단점이 있다. 따라서 본 논문은 잡음 음성으로 부터 원하는 음성만 선택하여 추출하기 위한 음성 특징 추출 기법을 CHMM을 이용하여 제안한다. 선택적 음성 추출을 위한 채널 유사성 상관 관계를 이용하여 음성 특징을 추출하는 방법을 사용하였다. 제안 기법의 실험 평가한 결과 평균 분리 왜곡도가 0.430dB 감소됨을 보임으로써 제안한 방법의 우수성을 확인하였다.

음성지시에 의한 선박 조종 및 윈치 제어 시스템 (Ship s Maneuvering and Winch Control System with Voice Instruction Based Learning)

  • 서기열;박계각
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.517-523
    • /
    • 2002
  • 본 논문에서는 자연언어를 이용하는 인간의 학습방법에 기초한 LIBL방법의 실용화를 위하여 음성지시기반학습(VIBL : Voice Instruction Based Learing)을 선박의 조타 시스템, 주기원격제어시스템(MERCS), 윈치기기에 적용하여 항해사의 조타명령과 같은 언어적 지시가 조타수를 경유하여 수행되는 과정을 대체하는 VIBL법을 이용한 조타기, 주기 원격 조종장치, 윈치 기기를 제어하는 시스템을 제안하고자 한다. 구체적인 연구방법으로는 조타수의 적절한 조타조작모델을 퍼지추론 규칙을 이용하여 구현하고, 적절한 의미소 및 평가규칙을 제시한 언어지시 기반 학습방법을 선박의 조타시스템에 적용하여 지시자의 음성언어지시에 보다 효율적으로 응답하는 지능형 조타기 제어 시스템을 구현하고, 지시자의 음성지시를 인식하여 주기 원격 조종 장치와 윈치 기기를 제어하는 시스템을 구현한다. 음성언어지시를 인식하여 텍스트로 변환하기 위한 기법과 퍼지추론을 이용하여 조타수의 경험을 바탕으로 한 조타 조작 모델을 구축하였고, 지능형 조타 시스템을 위한 타각, 방위도달시간, 정상상태의 의미소를 제안하여, 조타수 조작 모델 규칙을 수정하기 위한 평가규칙을 제시하였다. 또한, 구현된 음성인식 선박조종 시뮬레이터에 적용하여 그 유효성을 확인하였다.

Recognition of the Korean Character Using Phase Synchronization Neural Oscillator

  • Lee, Joon-Tark;Kwon, Yang-Bum
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제28권2호
    • /
    • pp.347-353
    • /
    • 2004
  • Neural oscillator can be applied to oscillator systems such as analysis of image information, voice recognition and etc, Conventional learning algorithms(Neural Network or EBPA(Error Back Propagation Algorithm)) are not proper for oscillatory systems with the complicate input patterns because of its too much complex structure. However, these problems can be easily solved by using a synchrony characteristic of neural oscillator with PLL(phase locked loop) function and a simple Hebbian learning rule, Therefore, in this paper, it will introduce an technique for Recognition of the Korean Character using Phase Synchronization Neural Oscillator and will show the result of simulation.

Recognition of the Korean Alphabet using Phase Synchronization of Neural Oscillator

  • Lee, Joon-Tark;Bum, Kwon-Yong
    • 한국지능시스템학회논문지
    • /
    • 제14권1호
    • /
    • pp.93-99
    • /
    • 2004
  • Neural oscillator can be applied to oscillatory systems such as analyses of image information, voice recognition and etc. Conventional EBPA (Error back Propagation Algorithm) is not proper for oscillatory systems with the complicate input`s patterns because of its tedious training procedures and sluggish convergence problems. However, these problems can be easily solved by using a synchrony characteristic of neural oscillator with PLL(Phase Locked Loop) function and by using a simple Hebbian learning rule. Therefore, in this paper, a technique for Recognition of the Korean Alphabet using Phase Synchronized Neural Oscillator was introduced.

Human interface 기술의 일환으로서 ASR과 fuzzy set theory를 이용한 developed-ERES/WCS 설계에 관한 연구 (A study on a design of developed-ERES/WCS using the ASR and fuzzy set theory as a part of human interface technique)

  • 이순요;이창민;박세권
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1988년도 한국자동제어학술회의논문집(국내학술편); 한국전력공사연수원, 서울; 21-22 Oct. 1988
    • /
    • pp.76-81
    • /
    • 1988
  • As a means of human interface, this study designs Developed-ERES/WCS with voice recognition capability and fuzzy set theory. In the advanced teleoperator system, when an error occurs on the automatic mode, the error is recovered after the automatic mode is changed into the manual mode intervened by a human. The purpose of this study is to reduce human work load and to shorten error recovery time during error recovery.

  • PDF

언어장애인의 스마트스피커 접근성 향상을 위한 개인화된 음성 분류 기법 (Personalized Speech Classification Scheme for the Smart Speaker Accessibility Improvement of the Speech-Impaired people)

  • 이승권;최우진;전광일
    • 스마트미디어저널
    • /
    • 제11권11호
    • /
    • pp.17-24
    • /
    • 2022
  • 음성인식 기술과 인공지능 기술을 기반으로 한 스마트스피커의 보급으로 비장애인뿐만 아니라 시각장애인이나 지체장애인들도 홈 네트워크 서비스를 연동하여 주택의 전등이나 TV와 같은 가전제품을 음성을 통해 쉽게 제어할 수 있게 되어 삶의 질이 대폭 향상되었다. 하지만 언어장애인의 경우 조음장애나 구음장애 등으로 부정확한 발음을 하게 됨으로서 스마트스피커의 유용한 서비스를 사용하는 것이 불가능하다. 본 논문에서는 스마트스피커에서 제공되는 기능 중 일부 서비스를 대상으로 언어장애인이 이용할 수 있도록 개인화된 음성분류기법을 제안한다. 본 논문에서는 소량의 데이터와 짧은 학습시간으로도 언어장애인이 구사하는 문장의 인식률과 정확도를 높여 스마트스피커가 제공하는 서비스를 실제로 이용할 수 있도록 하는 것이 목표이다. 본 논문에서는 ResNet18 모델을 fine tuning하고 데이터 증강과 one cycle learning rate 최적화 기법을 추가하여 적용하였으며, 실험을 통하여 30개의 스마트스피커 명령어 별로 10회 녹음한 후 3분 이내로 학습할 경우 음성분류 정확도가 95.2% 정도가 됨을 보였다.