• 제목/요약/키워드: automatic voice system

검색결과 81건 처리시간 0.023초

음성인식 시스템에서의 Voice Web Browsing에 관한 연구 (A Study on Voice Web Browsing in Automatic Speech Recognition Application System)

  • 윤재석
    • 한국정보통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.949-954
    • /
    • 2003
  • 본 연구에서는 지금까지의 GUI 중심의 웹 어플리케이션을 VUI 중심의 웹 어플리케이션으로 구현하기 위한 음성 인식 항공 정보 시스템을 설계 구현하였다. 이러한 ASP(Active Solver Page)로써 구현한 윈도우 서버 기반에서 운용되는 시스템에 관한 Web 관련 ASR(Automatic Speech Recognition)연구가 최근 상당한 연구가 이루어지고 있지만 ASP의 웹과의 제한성으로 인해 시스템의 속도면, 이식성 등에서 제약을 가져왔다. 이와 같은 제약성을 해결하기 위해 본 연구에서는 음성 정보 및 동적 VoiceXML을 구현하는 자바 빈즈(JAVA Beans) 컴포넌트 구조에 대해서 연구하였다. 또한 본 연구에서는 Remote An(Abstract Windows Toolkit)기술을 이용하여 GUI 및 VUI 에서의 음성 및 그래픽 정보를 동시에 전달 가능하게 하는 Voice 웹 브라우징의 가능성을 확인하였다.

JAVABeans Component 구조를 갖는 음성인식 시스템에서의 Voice Web Browsing에 관한 연구 (A Study on Voice Web Browsing in JAVA Beans Component Architecture Automatic Speech Recognition Application System.)

  • 장준식;윤재석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.273-276
    • /
    • 2003
  • 본 연구에서는 지금까지의 GUI 중심의 웹 어플리케이션을 VUI 중심의 웹 어플리케이션으로 구현하기 위한 음성 인식 항공 정보 시스템을 설계 구현하였다 기존의 ASP(Active Server Page)로써 구현한 윈도우 서버 기반에서 운용되는 시스템에 관한 Web 관련 ASR(Automatic Speech Recognition) 연구가 최근 상당한 연구가 이루어지고 있지만 ASP의 웹과의 제한성으로 인해 시스템의 속도면, 이식성 등에서 제약을 가져왔다. 이와 같은 제약성을 해결하기 위해 본 연구에서는 음성 정보 및 동적 VoiceXML을 구현하는 자바 빈즈(JAVA Beans) 컴포넌트 구조에 대해서 연구해 보았다. 또한 본 연구에서는 Remote An(Abstract Windows Toolkit)기술을 이용하여 GUI 및 VUI에서의 음성 및 그래픽 정보를 동시에 전달 가능하게 하는 Voice 웹 브라우징에 대해서 연구하여 보았다.

  • PDF

자기공명영상 검사에서 외국인 환자를 위한 자동음성 시스템 개발 (Development of Automatic Voice System for Foreign Patients in Testing of Magnetic Resonance Imaging)

  • 구은회
    • 한국방사선학회논문지
    • /
    • 제10권1호
    • /
    • pp.59-64
    • /
    • 2016
  • 본 연구의 목적은 자기공명영상을 이용하여 외국인 환자를 검사할 때 언어의 소통을 위하여 자동음성시스템을 개발하고자 하였다. 자동음성을 위해 사용된 문장은 병원에서 자주 사용하고 있는 12개의 문장과 5개의 외국어를 선택하였다. 이러한 번역된 문장은 Oddcast's website로 부터 무료로 재공 되며 Wav 파일로서 각 언어 특징에 소리로 기록하게 된다. 기록된 오디오 파일은 Mobile phone 환경에서 적용되는 PHP 프로그램을 사용하여 MS-파워포인트(extension; ppsx) 와 Web-enabled system 형태로 재생하게 된다. 음성 시스템 개발은 방사선사에게 언어 소통의 어려움에 관하여 스트레스를 해소될 것이며, 다양한 언어로 설계된 자동음성시스템은 외국인 환자를 검사 할 때 환자에게 진단적 정보를 증가시킬 것이다. 본 연구를 위해 개발된 음성 시스템은 한국의 방사선사와 외국인 환자 사이에서 검사의 이해를 증가시킬 수 있기 때문에 임상실무에서 더욱더 유용하게 이용될 것이라고 기대된다.

다양한 음성을 이용한 자동화자식별 시스템 성능 확인에 관한 연구 (Variation of the Verification Error Rate of Automatic Speaker Recognition System With Voice Conditions)

  • 홍수기
    • 대한음성학회지:말소리
    • /
    • 제43호
    • /
    • pp.45-55
    • /
    • 2002
  • High reliability of automatic speaker recognition regardless of voice conditions is necessary for forensic application. Audio recordings in real cases are not consistent in voice conditions, such as duration, time interval of recording, given text or conversational speech, transmission channel, etc. In this study the variation of verification error rate of ASR system with the voice conditions was investigated. As a result in order to decrease both false rejection rate and false acception rate, the various voices should be used for training and the duration of train voices should be longer than the test voices.

  • PDF

음성명령에 의한 모바일로봇의 실시간 무선원격 제어 실현 (Real-Time Implementation of Wireless Remote Control of Mobile Robot Based-on Speech Recognition Command)

  • 심병균;한성현
    • 한국생산제조학회지
    • /
    • 제20권2호
    • /
    • pp.207-213
    • /
    • 2011
  • In this paper, we present a study on the real-time implementation of mobile robot to which the interactive voice recognition technique is applied. The speech command utters the sentential connected word and asserted through the wireless remote control system. We implement an automatic distance speech command recognition system for voice-enabled services interactively. We construct a baseline automatic speech command recognition system, where acoustic models are trained from speech utterances spoken by a microphone. In order to improve the performance of the baseline automatic speech recognition system, the acoustic models are adapted to adjust the spectral characteristics of speech according to different microphones and the environmental mismatches between cross talking and distance speech. We illustrate the performance of the developed speech recognition system by experiments. As a result, it is illustrated that the average rates of proposed speech recognition system shows about 95% above.

비상재난 발생 시 외부 VHF 장비와 연동하는 소형선박용 재난자동속보장치 (Automatic Distress Notification System Working with an External VHF Device in Small Ship)

  • 정헌
    • 한국화재소방학회논문지
    • /
    • 제27권1호
    • /
    • pp.14-19
    • /
    • 2013
  • 본 논문은 소형 선박의 비상재난 발생 시 외부 VHF 장비와 연동하여 재난 상황을 자동으로 속보하는 기능을 수행하는 소형 선박용 재난자동속보장치에 대한 내용이다. 재난자동속보장치는 소형 선박의 재난 발생을 방지 또는 신속 대응하기 위한 시스템인 소형 선박재난분석시스템의 일부 장치에 해당하는 것으로서 선박재난분석시스템으로부터 재난 인지 신호와 GPS 위치 정보를 입력 받는다. 비상 상황 발생 시 위치 정보를 구조 요청의 음성 신호로 변환하여 외부 VHF 장비를 통해 송출한다. VHF 장비와 재난자동속보장치가 물에 잠기기 전까지 계속적인 음성 구조 신호를 송출할 수 있도록 한다. 본 연구를 통해 소형선박에 발생할 수 있는 갑작스런 재난상황의 대응과 인명손실을 예방할 수 있으리라 기대한다.

Automatic Log-in System by the Speaker Certification

  • Sohn, Young-Sun
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권2호
    • /
    • pp.176-181
    • /
    • 2004
  • This paper introduces a Web site login system that uses user's native voice to improve the bother of remembering the ID and password in order to login the Web site. The DTW method that applies fuzzy inference is used as the speaker recognition algorithm. We get the ACC(Average Cepstrum Coefficient) membership function by each degree, by using the LPC that models the vocal chords, to block the recorded voice that is problem for the speaker recognition. We infer the existence of the recorded voice by setting on the basis of the number of zeros that is the value of the ACC membership function, and on the basis of the average value of the ACC membership function. We experiment the six Web sites for the six subjects and get the result that protects the recorded voice about 98% that is recorded by the digital recorder.

CTI 호출 제어 방식을 이용한 행정 업무 지원 시스템의 개발 (A Development of Administrative Affairs Supporting System using Call Control Mode of CTI)

  • 최준기;조성범;정상수;이상정
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.46-60
    • /
    • 1999
  • 최근들어 CTI(Computer Telephony Integration) 기술은 영상 회의, 파일 전송, 음성 사서함, 자동 메시지 전송, 자동 재다이얼 기능 등의 전통적인 분야에서부터 통합 메시징 및 네트워크 팩스 분야에 이르기까지 다양한 분야에 걸쳐서 활용되고 있다. 본 논문에서는 전화망을 이용한 CTI 응용분야로 대학에서 입시기간동안 수험생들의 전화 과중에 따른 업무와 학사 행정 서비스를 개선할 수 있는 CTI를 이용한 응용 시스템에 대하여 연구한다. 구현된 시스템은 최근 주목받고 있는 객체 모델링 기법(Object Modeling Technique)을 이용하여 데이터베이스를 설계하고, CTI 호출 제어 시스템을 이용하여 합격자 확인 자동 호출(Automatic Calling System), 합격자 발표 자동 안내(Automatic Response System) 등을 지원하도록 개발한다. 특히 합격자 자동 호출 시스템 구현시 합격 여부를 통지해 줄 때의 음성처리를 위하여 TTS(Text To speech) 모듈을 설계 구현한다.

  • PDF

화자식별 기반의 AI 음성인식 서비스에 대한 사이버 위협 분석 (Cyber Threats Analysis of AI Voice Recognition-based Services with Automatic Speaker Verification)

  • 홍천호;조영호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.33-40
    • /
    • 2021
  • 음성인식(ASR: Automatic Speech Recognition)은 사람의 말소리를 음성 신호로 분석하고, 문자열로 자동 변화하여 이해하는 기술이다. 초기 음성인식 기술은 하나의 단어를 인식하는 것을 시작으로 두 개 이상의 단어로 구성된 문장을 인식하는 수준까지 진화하였다. 실시간 음성 대화에 있어 높은 인식률은 자연스러운 정보전달의 편리성을 극대화하여 그 적용 범위를 확장하고 있다. 반면에, 음성인식 기술의 활발한 적용에 따라 관련된 사이버 공격과 위협에 대한 우려 역시 증가하고 있다. 기존 연구를 살펴보면, 자동화자식별(ASV: Automatic Speaker Verification) 기법의 고안과 정확성 향상 등 기술 발전 자체에 관한 연구는 활발히 이루어지고 있으나, 실생활에 적용되고 있는 음성인식 서비스의 자동화자 식별 기술에 대한 사이버 공격 및 위협에 관한 분석연구는 다양하고 깊이 있게 수행되지 않고 있다. 본 연구에서는 자동화자 식별 기술을 갖춘 AI 음성인식 서비스를 대상으로 음성 주파수와 음성속도를 조작하여 음성인증을 우회하는 사이버 공격 모델을 제안하고, 상용 스마트폰의 자동화자 식별 체계를 대상으로 실제 실험을 통해 사이버 위협을 분석한다. 이를 통해 관련 사이버 위협의 심각성을 알리고 효과적인 대응 방안에 관한 연구 관심을 높이고자 한다.

대화형 음성 인식 항공정보 시스템에서의 ASP 모듈에 관한 연구 (A Study On the ASP Module in Conversational Automatic Speech Recognition Flight Information System)

  • 윤재석;장준식
    • 한국정보통신학회논문지
    • /
    • 제6권4호
    • /
    • pp.595-603
    • /
    • 2002
  • 본 연구에서는 VoiceXML을 이용하여 전화를 통한 대화형 음성인식 항공정보시스템을 개발하였으며 ASP(Active Server Page)모듈을 작성하여 VXML 코딩을 최적화하여 효율성을 증대시켰다. 그리고 GSL(Grammar Specific Language)을 사용하여 사람이 말하는 자연어를 어떻게 하면 컴퓨터가 잘 이해할 수 있게 만들 수 있는지에 연구의 중점을 두었으며 이렇게 설계된 시스템을 실험을 통해 그 효과를 검증해 보았다.