• 제목/요약/키워드: 음성 구동

검색결과 66건 처리시간 0.029초

조이스틱 및 음성인식 겸용 이동기제어시스템 개발 (Development of Joystick & Speech Recognition Moving Machine Control System)

  • 이상배;강성인
    • 한국지능시스템학회논문지
    • /
    • 제17권1호
    • /
    • pp.52-57
    • /
    • 2007
  • 본 논문은 실시간 음성인식명령으로 구동되는 지능형 이동기제어시스템을 제안한다. 제안된 이동기제어시스템은 메인모듈, 음성인식모듈, 모터구동모듈, 센서모듈로 구성된다. 80C196KC로 구현된 메인모듈에서 퍼지논리가 적용된 지능형 제어시스템을 제안한다. 사용자의 몸무게 및 여러 가지 주변 환경요인들에 의한 비선형성을 개선하기 위해서 피드백제어가 가능한 모터구동모듈과 센서모듈이 구현된다. 또한 제안된 시스템에서 이동로봇의 제어를 위한 9개의 단어를 사용하여 동작을 테스트하였고, 제어입력으로 음성명령과 조이스틱 사용 시 이동로봇의 성능을 평가하였다.

중증 장애우용 음성구동 휠체어를 위한 강인한 음성인식 알고리즘 (Robust Speech Recognition Algorithm of Voice Activated Powered Wheelchair for Severely Disabled Person)

  • 석수영;정현열
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.250-258
    • /
    • 2007
  • 현재의 음성인식 기술은 하드웨어 기술의 발전과 더불어 여러 분야에 응용되고 있지만 음성구동 휠체어와 같은 고신뢰성이 요구되는 응용분야에서는 아직도 그 성능이 불충분하다. 실 환경에서 음성을 통해 안전하게 휠체어를 제어하기 위해서는 도로의 소음 등과 같은 주변잡음의 영향에 의한 음성인식 성능의 저하, 사용자의 기침소리나 숨소리 등과 같은 비음성 입력시의 오동작, 명령어의 불명확한 발성과 일반인과는 다른 발성 속도 및 발성 주파수 등을 고려한 인식시스템이 필요하다. 이를 위하여 본 논문에서는 비음성 입력시의 오동작을 방지하기 위해 인식기의 전처리 단에서 YIN 기본주파수 추출방법을 적용한 후 프레임 별 신뢰도에 기반한 고정도로 음성/비음성을 판별할 수 있는 방법을 제안하고, 불명확한발성에 대한 인식 성능 향상을 위해 화자 적응화 방법 및 개인적인 발성 변이를 표현할 수 있는 다중 후보 단어사전을 구성하여 인식성능 제고를 도모하였다. 잡음이 포함된 실 환경하에서 수집한 데이터를 대상으로 인식실험을 수행한 결과 기존의 켑스트럼 방법에서는 오류 없이 비음성을 찾아내는 재현율은 62%로 나타났으나 본 논문에서 제안한 YIN방법에 기반을 둔 신뢰도 측정방법에서는 95.1%를 나타나 우수한 성능을 나타내었다. 실 환경에서 수집된 2211개의 불명확한 발성을 대상으로 인식실험을 수행한 결과 2000상태 16 혼합수 HMnet 모델을 이용한 경우 인식률이 78.6%로 나타났으나 MAP적응화 방법 및 다중 후보 인식사전을 적용한 결과 99.5%의 인식 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

근거리 통신망과 사설교환기의 음성통신을 위한 게이트웨이의 구현 (Implementation of a Gateway Protocol between LAN and PABX for Voice Communication)

  • 안용철;신병철
    • 한국통신학회논문지
    • /
    • 제19권7호
    • /
    • pp.1346-1363
    • /
    • 1994
  • 패킷 음성 프로토콜은 지금까지 많이 연구되고 구현되어왔다. 하지만 음성통신을 위한 근거리 통신망과 사설교환기사이의 연동에 대한 연구는 아직 많은 편은 아니다. 본 논문에서는 근거리 통신망과 기존의 사설교환기사이의 음성통신을 위한 게이트웨이를 설계하고 구현하였다. 구현한 게이트웨이의 프로토콜은 CCITT의 G.764 패킷 음성 프로토콜을 수정. 사용하였다. 연동을 위한 하드웨어 시스템을 구현하였으며, 이는 전화선과의 인터페이스 부분, 음성처리부분, PC 인터페이스 부분 및 제어부분, 그리고 DTMF(Dual Tone Multiple Frequency) 접속부분으로 나누어진다. 그리고 소프트웨어는 근거리 통신망 접속용 네트웍카드를 구동하는 패킷 드라이버를 이용하기위한 인터페이스 부분과 게이트웨이를 구동하는 드라이버, 그리고 프로토콜 처리부분으로 구성되어있다.

  • PDF

장애인을 위한 사용자 의도 파악 시스템 개발에 관한 연구 (Development of Intention Reading System for the Disabled)

  • 이영진;추길환;김재헌;정명진
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.3018-3020
    • /
    • 1999
  • 본 논문에서는 손과 발을 자기의 의지대로 움직일 수 없는 장애인들이 전동 휠체어나 로봇 팔과 같은 보조 장치를 손, 발의 사용 없이 조작 할 수 있는 시스템 개발을 위한 연구에 대해서 소개한다. 손과 발을 사용하지 않고 전동 휠체어나 로봇 팔을 조작하려면 장애인의 의도를 파악하고 이 정보에 의한 구동 방식이 필요하게 된다. 본 연구에서는 장애인의 눈동자의 움직임과 머리의 움직임 그리고 음성 신호를 이용하여 보조 장치들을 구동시키고자 한다. 이를 구현하기 위해서는 시선의 방향을 측정할 수 있는 기술과 머리의 위치와 방향을 측정하는 기술, 그리고 음성으로 표현되는 간단한 명령들을 인식할 수 있는 기술이 필요하며, 이러한 기술의 통합을 바탕으로 보조장치들을 구동시키기 위한 편리한 사용자 지향의 인터페이스 기술을 개발하고자 한다.

  • PDF

켑스트럼 파라미터와 다중대역 여기신호를 사용한 음성 합성 시스팀 (A Speech Synthesis System based on Cepstral Parameters and Multiband Excitation Signal)

  • 김기순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.211-215
    • /
    • 1995
  • 명료하고 자연스러운 한국어 음성을 생성하기 위하여 다중대역 여기신호를 이용한 음성 합성 시스팀을 제안한다. 분석계에서는 켑스트럼 파라미터를 사용하여 유성/무성 판별 스펙트럼을 이용한 유/무성 구간 자동판별법을 제안하고, 현재 단순 임펄스와 백색잡음만으로도 구성된 음원과 간단한 유성/무성 판별로 구동되어지는 합성음의 음질상의 한계를 개선하기 위하여 합성계에서는 음질개선 방안으로 유성음 구동시 다중대역 여기신호를 도입하여 합성시 이용한다. 제안된 방법에 대한 청취실험을 한 결과, 유성음 부분 특히 잡음이 많이 섞여 있는 유성음화 마찰음과 모음의 천이부분 등에서 일반적으로 사용되고 있는 간단한 유성/무성 파라미터를 사용한 합성음에 비하여 다중대역 여기신호를 사용한 합성음의 명료도가 매우 우수함을 확인하였다.

  • PDF

PVQ를 이용한 RPE 구동 시퀀스 양자화 연구 (A Study on Excitation Sequence Quantization in RPE Speech Coding)

  • 강상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.164-167
    • /
    • 1995
  • RPE 음성부호화기에서 합성 필터로 인한 구동벡터 양자화잡음의 증폭효과를 분석하고 regular pulse 시퀀스의 양자화로 인한 성능감쇄를 줄이기 위해 pyramid vector 양자화방식을 도입하였다. 제안된 방식의 성능평가는 구동시퀀스 양자화를 위해 adaptive PCM을 이용하는 GSM 표준 RPE 방식과의 객관적 및 주관적 성능비교를 통해 수행하였다.T JDSMDQLRY 결과 제안된 방식은 대략 1dB의 SNR 및 segmental SNR 값 증가를 가져왔고, 또한 비공식 청취시험결과 명료도의 증가를 느낄 수 있었다.

  • PDF

카오스 발생회로를 이용한 음성비화통신 제어시스템 (Speech Secure Communication Control System Using Chaos Generation Circuit)

  • 여지환;이익수
    • 한국지능시스템학회논문지
    • /
    • 제6권2호
    • /
    • pp.72-80
    • /
    • 1996
  • 본 논문은 카오스 발생회로(chaos generation circuit)를 설계 및 구현하고, 카오스 회로들간의 카오스 동기화(chaos synchronization) 알고리즘을 기초로 하여 카오스 변조통신을 구성하여 음성비화시스템의 구현에 관하여 실험적으로 검증했다. Pecorra와 Carroll 은 카오스 신호로서 카오스 시스템을 구동하면 카오스 동기화가 가능하다고 발표했다. 이러한 제어기법은 카오스 신호의 마스킹과 복원 알고리즘의 등장을 초래했다. 본 연구는 카오스 신호를 발생하기 위하여 상태변수 기법을 이용하여 로렌쯔(Lorenz) 카오스 발생회로를 하드웨어로 구현했다. 수치 실험 및 보드상의 실험에서 카오스 회로는 카오스의 동적특성을 나타냈으며, 카오스 발생회로들간의 카오스 동기제어를 아루었다. 음성비화를 위한 카오스 신호의 변조는 카오스 신호에 음성신호를 가산하여 송신하며, 광대역)spread spectrum)의 카오스 변조통신 (chaotic modulation communication)에서 음성정보는 수신시스템의 카오스 부시스템에서 카오스 신호를 빼내어 신호를 복원한다. 보드상에서 하드웨어로 구현한 카오스 변.복조 통신시스템을 구성하여 음성신호와 비화통신에 카오스 지능제어기법을 적용하였다.

  • PDF

음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가 (Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System)

  • 김태수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF