• 제목/요약/키워드: voice interface

검색결과 296건 처리시간 0.025초

고속 음성 문서 검색을 위한 Expected Matching Score 기반의 문서 확장 기법 (Expected Matching Score Based Document Expansion for Fast Spoken Document Retrieval)

  • 서민구;정규준;오영환
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.71-74
    • /
    • 2006
  • Many works have been done in the field of retrieving audio segments that contain human speeches without captions. To retrieve newly coined words and proper nouns, subwords were commonly used as indexing units in conjunction with query or document expansion. Among them, document expansion with subwords has serious drawback of large computation overhead. Therefore, in this paper, we propose Expected Matching Score based document expansion that effectively reduces computational overhead without much loss in retrieval precisions. Experiments have shown 13.9 times of speed up at the loss of 0.2% in the retrieval precision.

  • PDF

효과적 정보전달을 위한 영상정보의 3D 뷰 및 음성정보와의 융합 연구 (A Study on 3D View Design of Images and Voices Integration for Effective Information Transfer)

  • 신준철;이종수
    • 한국통신학회논문지
    • /
    • 제35권1B호
    • /
    • pp.35-41
    • /
    • 2010
  • 본 논문에서는 컴퓨터를 사용한 효과적 정보전달을 위해 2D 영상정보를 3D 가상공간에 배치하고 음성 정보와의 유기적 연결기능을 갖는 3D 뷰 설계를 제안한다. 3D 공간에 배치된 영상정보의 사용자 접속을 어느 시점 또는 어떤 각도에서도 가능하도록 하여, 시각정보 전달효과를 제고하고 있으며, 음성정보의 첨부가 용이하도록 설계하였다. 3D공간에서의 영상 및 음성정보 배치는 단순하지만 효과적인 접속기능을 포함하고 있으며, 이들의 탐색 및 시청을 사용자접속 관점에서 설계하여 정보전달 효과를 제고하였다.

VoiceXML을 이용한 IVR 서버 설계 및 구현 (Design and Implementation of IVR Server Using VoiceXML)

  • 이창호;장원조;강선미
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.47-59
    • /
    • 2002
  • A new brilliant service using human-voice and DTMF (Dual Tone Multi Frequency) technique is expected nowadays in order to obtain valuable information on the internet more easily. VoiceXML (Voice eXtensible Markup Language) is the right choice that makes the new service possible. In this paper, the design and implementation of IVR (Interactive Voice Response) server using VoiceXML is described, where it connects with internet and IVR server efficiently. IVR server using VoiceXML is composed of two groups: VoiceXML document handling and VoiceXML execution. Scenario part of IVR server corresponds to VoiceXML document, the execution is performed by VoiceXML execution.

  • PDF

웹 환경에서 VoiceXML을 이용한 음성 인터페이스 활용방안 (A Method For Utilizing Voice Interface in Web Environment Using VoiceXML)

  • 장민석;방초균
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.451-453
    • /
    • 2002
  • 현재의 웹 환경은 HTML로 구성이 되어있고 이로인해 하이퍼링크를 따라가기 위해 마우스 클릭을 통해 작업하는 GUI환경이 주를 이룬다. 하지만 이러한 방법은 인간이 가장 손쉽게 사용하는 음성과 비교해 볼때 상당히 불편한 축에 속한다. 이를 해결하기 위해 현재 무르익은 음성인식 기술과 전화기를 통해 정보를 제공하고자 하는 XML의 파생인 VoiceXML을 이용하여 현재 HTML이 주류를 이루는 웹 환경을 VoiceXML을 이용한 음성인터페이스 환경을 마련하고자 한다.

  • PDF

웹 환경에서 VoiceXML을 이용한 음성인터페이스 활용방안 (A Method For Utilizing Voice Interface in Web Environment Using VoiceXML)

  • 장민석;방초균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1447-1450
    • /
    • 2002
  • 현재의 웹 환경은 HTML로 구성이 되어있고 이로인해 하이퍼링크를 따라가기 위해 마우스 클릭을 통해 작업하는 GUI환경이 주를 이룬다. 하지만 이러한 방법은 인간이 가장 손쉽게 사용하는 음성과 비교해 볼 때 상당히 불편한 축에 속한다. 이를 해결하기 위해 현재 무르익은 음성인식 기술과 전화기를 통해 정보를 제공하고자 하는 XML의 파생인 VoiceXML을 이용하여 현재 HTML이 주류를 이루는 웹 환경을 VoiceXML을 이용한 음성인터페이스 환경을 마련하고자 한다.

  • PDF

보이스 코일형 모터를 이용한 햅틱 장치의 설계 및 제어 (Design and Control of Haptic Device using Voice Coil Type Motor)

  • 성하경;범진환
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권10호
    • /
    • pp.439-445
    • /
    • 2002
  • In this paper force feedback control system is investigated for improving the quality of the haptic feedback in virtual reality applications. We suggested the method of controlling the haptic device and modelling the virtual environment. Haptic device is composed of five bar link structure, voice coil motor, control board, and virtual environment modeling program. We applied voice coil motor in the actuating system for simple structure and easy control. Virtual environment modelling is constructed in PC, and the control signals of the actuators and the encoder data are transferred to the control system through USB. Experiment is performed to evaluate the characteristics of the haptic device.

항공기 음성인식 소프트웨어 품질 평가 모델 연구 (The Study on the Quality Assessment Model of Aircraft Voice Recognition Software)

  • 이승목
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권2호
    • /
    • pp.73-83
    • /
    • 2019
  • 음성인식은 최근 인공지능 기술과 접목되면서 오인식률이 크게 개선되었고 사용자 관점에서 효과적이고 효율적인 HMI(Human Machine Interface)를 제공하고 있다. 이러한 추세는 방위산업 분야에서도 반영되고 있고 특히 항공분야에서 F-35에 적용이 되었다. 하지만 이러한 기술에 대해서 품질평가를 위해 방위산업 특히 항공분야에는 객관적이고 평가 가능한 정량적인 모델이 필요하다. 본 연구에서는 이러한 음성인식의 소프트웨어 측면에서 항공기에 적용하기 위한 정량적인 평가 모델을 제시한다. 평가 모델 제시를 위해 음성인식 적용 기술과 ISO/IEC 25000(SQuaRE) 제품 품질 속성을 이용해 평가 항목을 추출한다. 이러한 두 가지 항목의 연계를 통해 정량적인 평가 모델을 제시하고 사례 연구를 활용해 평가 결과를 확인한다.

AI 음성 에이전트의 음성 특성에 대한 사용자 반응 연구 (AI Voice Agent and Users' Response)

  • 백승주;정윤혁
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권2호
    • /
    • pp.137-158
    • /
    • 2022
  • Purpose As artificial intelligence voice agents (AIVA) have been widely adopted in services, diverse forms of their voices, which are the main interface with users, have been experimented. The purpose of this study is to examine how users evaluate vocal characteristics (gender, voice pitch, and voice pace) of AIVA, depending on prior research on human voice attractiveness. Design/methodology/approach This study employed an experimental survey which 516 participated in. Each participant was randomly assigned into one of eight situations (e.g., male - higher pitch - faster pace) and listened a AIVA voice sample, which introduce weather information. Next, a participant answered three consequence factors (attractiveness, trust, and anthropomorphism). Findings The results reveal that female voices of AIVA were perceived as more attractive and trustworthy than male voices. As far as voice pitch goes, while lower-pitch voices were preferred in female voices, higher-pitch voices were preferred in male voices. Finally, faster voices of AIVA were more attractive than slower voices.

음성 게이트웨이 응용을 위한 AAL2 프로세서 구현 (Implementation of an AAL2 processor for voice gateway application)

  • 이상길;최명렬
    • 한국통신학회논문지
    • /
    • 제27권11C호
    • /
    • pp.1152-1157
    • /
    • 2002
  • 본 논문에서는 voice gateway응용에서 널리 사용되어지는 AAL2 프로세서의 구현과정에 대해 기술하였다. 본 프로세서는 음성과 프레임 모드 데이터를 서비스하기 위한 CPS와 SSCS를 지원한다. 또한 4개의 ATM 가상연결을 지원하며, 그 연결은 총 1020개의 AAL2채널을 포함한다. ATM 셀 인터페이스로 UTOPIA Level 1을 사용하고, 음성 채널 인터페이스로 4개의 TDM포트를 갖고 있다. TDM포트에는 PCM과 ADPCM데이터가 존재한다. 대부분의 AAL2프로세서들은 소프트웨어로 구현되어 있거나 또는 소프트웨어와 하드웨어의 혼합으로 되어 있다. 그러므로 데이터를 처리하는데 어느 정도의 지연이 있게 된다. 그러나 본 논문의 프로세서는 하드웨어로 구현되어 있기 때문에 CPS와 SSCS에 대해 매우 적은 처리지연을 보이고 있다. 또한, CPS 패킷들의 루프백과 스위칭이 가능하게 구현되었고, TDM채널에 대해서도 역시 스위칭과 루프백이 가능하도록 구현되었다. 구현된 프로세서의 특징은 CPS와 SSCS의 so부 구조가 소프트웨어의 함수를 보는 듯하다는 것이다. 또한 그 블록을 포함하는 다른 블록들을 설계 시 재사용되어 질 수 있으며, 대용량의 채널을 수용할 때에도 응용 가치가 높다고 사료된다.

TDX-ACD를 이용한 자동음성 안내 기능에 관한 연구 (A Study on Automatic Voice Response Service Using TDX-ACD)

  • 김영곤;신동헌;신석현
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1988년도 추계학술발표회 논문집
    • /
    • pp.12-16
    • /
    • 1988
  • 본 논문에서는 안내원의 작업처리시간을 줄이기 위한 방법으로 DDX-1A를 이용한 자동호 분배 장치에 자도음성안내 기능을 구현하기 위한 T-level Prncessor 인 PCP (Protocol Convert Processor) VCP(Voice Contro Processor)와 B-level Processor Avru(voice Response)와 B-level Processor AVRU(Automatic Voice Response Unit)의 H/W 기능 및 상호 interface 에 관하여 고찰한다.

  • PDF