• 제목/요약/키워드: voice search

검색결과 90건 처리시간 0.022초

독서장애인을 위한 음성 도서 어노테이션 검색 기법 (A Voice Annotation Browsing Technique in Digital Talking Book for Reading-disabled People)

  • 박주현;임순범;이종우
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.510-519
    • /
    • 2013
  • 본 연구에서는 독서장애인을 위한 모바일 전자책에 저장된 어노테이션을 탐색하고 그 결과를 재생하는 기법을 제안하고, 이를 음성 어노테이션 브라우징 시스템이라 칭하였다. 제안된 음성 어노테이션 브라우징 시스템은 명령 입력, 중요도 분석 및 추천, 검색, 출력 단계로 구성된다. 특히 본 논문에서는 대상 사용자가 청각 의존도가 높은 독서장애인들이기 때문에 완전히 청각에 의존해서 사용할 수 있도록 모든 단계에서 음성인식 인터페이스를 제공한다. 제안된 음성 어노테이션 브라우징 시스템의 효율성을 검증하기 위해 모바일 안드로이드 환경에서 실행되는 전자책 소프트웨어와 음성 어노테이션 브라우징 시스템을 설계하고 구현하였다. 구현된 시스템은 전맹인으로 구성된 다수의 사용자들로 하여금 검증하도록 하였으며, 그 결과 이들이 원하는 어노테이션을 찾는 과정이 성공적으로 이루어 질 수 있음을 확인 하였다.

VoiceXML을 이용한 VUI 지원 웹브라우저 개발 (Development of a Voice User Interface for Web Browser using VoiceXML)

  • 예상후;장민석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권2호
    • /
    • pp.101-111
    • /
    • 2005
  • 현재의 웹정보들은 주로 HTML로 기술되어 있으며, 이러한 정보를 얻기 위해 사용자들은 마우스와 키보드와 같은 입력장치를 사용한다. 이와 같이 기존의 GUI 환경은 인간의 가장 자연스러운 정보획득 수단의 하나인 음성을 지원하지 못하고 있다. 이러한 문제를 해결하기 위해 음성 인터페이스를 가진 여러 제품들이 개발되고 있다. 하지만 이들은 상호대화성이나 기존 웹환경을 수용한다는 측면에서 부족한 면을 가지고 있다. 본 논문에서는 현재 무르익어 가는 음성인식 기술과 XML의 파생언어인 VoiceXML을 이용하여, 기존의 인터페이스 환경을 XML 기반의 대화형 음성인터페이스 환경으로 대체하고자 한다. 이를 통해 기존의 인터페이스 환경을 수용한 VUI(Voice User Interface) 환경을 사용자에게 제공할 수 있다. 기존의 환경을 수용하기 위해 "XML Island" 기술을 이용하여 VoiceXML 문서를 HTML 문서에 포함시키며, 대표적인 정보획득화면인 메뉴, 게시판, 검색 엔진에 대한 대화형 음성 시나리오를 제안하고 있다.

SAMDF를 이용한 IMBE VOCODER의 피치 검색 시간 단축에 관한 연구 (On a Reduction of Pitch Search Time for IMBE Vocoder by Using the Spectral AMDF)

  • 홍성훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.155-158
    • /
    • 1998
  • IMBE(Improved Multi-Band Excitation) vocoders exhibit good performance at low data rates. The major drawback to IMBE coders is their large computational requirements. In this paper, thus, we propose a new pitch search method that preserves the quality of the IMBE vocoder with reduced complexity. The basic idea is to reduce computation complexity of the pitch searching by using the SAMDF. Applying the proposed method to the IMBE vocoder, we can get approximately 52.02% searching time reduction in the pitch search. There is no difference in voice quality between conventional IMBE and proposed IMBE.

  • PDF

CONTINUOUS DIGIT RECOGNITION FOR A REAL-TIME VOICE DIALING SYSTEM USING DISCRETE HIDDEN MARKOV MODELS

  • Choi, S.H.;Hong, H.J.;Lee, S.W.;Kim, H.K.;Oh, K.C.;Kim, K.C.;Lee, H.S.
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1027-1032
    • /
    • 1994
  • This paper introduces a interword modeling and a Viterbi search method for continuous speech recognition. We also describe a development of a real-time voice dialing system which can recognize around one hundred words and continuous digits in speaker independent mode. For continuous digit recognition, between-word units have been proposed to provide a more precise representation of word junctures. The best path in HMM is found by the Viterbi search algorithm, from which digit sequences are recognized. The simulation results show that a interword modeling using the context-dependent between-word units provide better recognition rates than a pause modeling using the context-independent pause unit. The voice dialing system is implemented on a DSP board with a telephone interface plugged in an IBM PC AT/486.

  • PDF

음성을 기반으로 하는 DNS 서비스의 설계 (Design of DNS Services be Based on Voice)

  • 이학구;김평수;김선우;김영근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(1)
    • /
    • pp.307-310
    • /
    • 2002
  • This paper is proposed due to the fact that resolving domain name with conventional input method to PDA is not so convenient. The substance of this paper is that a user Pronounces tile character which represents tile domain name and that vocalized character is transferred through the GATEWAY, where DNS service can be received in return. PDA receives, compress and send the voice to the GATEWAY, Then, the GATEWAY uncompress, recognizes the voice, converts to characters, search for the mapping entry After mapping to the mapping entry, the GATEWAY sends the DNS request. Combining two entities makes DNS service based on the human voice possible.

  • PDF

시각장애인 유도로봇에서의 위치 설정 및 탐색에 대한 음성시스템의 설계 및 구현 (Design and Implementation of voice system about location set and search in the blind guidable robot)

  • 박승우;신동범;이응혁;홍승홍
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(5)
    • /
    • pp.125-128
    • /
    • 2002
  • One of ultimate purpose that performance to information society been going recently festinately intends is in human's welfare improvement. Also, research about assist for disabled person that belong on category that is disabled persons' cloth elevation estranged in the past according to disabled person population's increase and change of advanced human rights consciousness to ruins of industrial society and traffic civilization is afoot abuzz. Guidance robot of sight obstacle can speak as its part. This research is thing about voice system about location set and search in guidance robot that is embodying to make sight disabled person can visit schedule place smoothly.

  • PDF

임베디드 리눅스 기반의 개인 오디오 레코더 서비스 구현 (The Implementation of Personal Audio Recorder Service based on Embedded Linux)

  • 김도형;이경희;이철훈
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.257-262
    • /
    • 2008
  • 본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 임베디드 리눅스 기반의 듀얼모드 응용 서비스인 개인 오디오 레코더의 구현에 대해서 기술한다. 개인 오디오 레코더는 듀얼모드 지원 단말에 탑재된 클라이언트에서 음성 녹음을 시작하면, 송신자와 수신자의 CDMA 음성 데이터가 와이브로 네트워크를 통해 인터넷 상의 저장 서버로 전달된다. 개인 오디오 레코더 서버는 통화 번호 및 통화 시간을 기준으로 음성 데이터를 서버에 저장하게 된다. 구현된 개인 오디오 레코더는 단말의 저장공간이 부족한 환경에서도 음성 통화 내용을 저장할 수 있도록 한다. 그리고, 개인 오디오 레코더는 서버에 저장된 통화 목록을 검색하여, 특정 통화 내용을 재생할 수 있다.

보이스피싱 발생 및 대응방안 (Voice Phishing Occurrence and Counterplan)

  • 조호대
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.176-182
    • /
    • 2012
  • 보이스피싱(Voice Phishing)은 전화를 이용하여 개인정보를 불법적으로 알아내어 이를 토대로 예금을 인출해가는 사기수법으로 피해사례들이 속출하면서 새로운 사회문제로 등장하였다. 그 피해의 대상은 선량한 일반 시민으로 무차별적으로 공략하고 있으며 주로 중국인 대만인 등 외국인들에 의해 저질러지는 범죄이다. 범죄의 착수가 우리나라 국경 밖에서 이루어지고 있다는 점에서 새로운 형태의 범죄유형이라 할 수 있다. 이에 본 연구는 보이스피싱과 관련하여 현재의 발생실태와 사례를 분석하고 효과적인 대응현황을 모색하고자 한다. 보이스피싱 관련 범죄는 지속적인 홍보와 단속에도 불구하고 범죄가 근절되지 않고 오히려 수법이 다양화 전문화 되면서 발전해 가는 양상을 보이고 있다. 향후 보이스피싱을 근절하기 위해서는 금융 통신 수사분야에서 문제점에 대한 대응방안이 마련되어야 할 것으로 본다. 또한 신속한 수사의 착수와 수사관련 기법의 개발을 통해 경찰 단속활동이 강화되어야 할 것이고, 국제 범죄적 성격을 보이고 있으므로 인터폴등 관련기관 및 국제공조협력이 강화되어야 한다.

콘텐츠 배급을 위한 RSS 기반의 VoiceXML 다이얼로그 시스템 (VoiceXML Dialog System Based on RSS for Contents Syndication)

  • 권형준;김정현;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.51-58
    • /
    • 2007
  • 본 논문은 갱신이 잦은 콘텐츠의 배급 및 구독을 위해 등장한 시맨틱 웹의 대표적인 기술인 RSS(RDF Site Summary or Really Simple Syndication)와 인터넷에 존재하는 정보를 음성으로 제공하기 위해 제안된 XML 규격의 W3C 표준 마크업 언어인 VoiceXML을 결합한 시스템의 프로토타입을 제시한다. 제안하는 시스템은 인터넷 기반으로 제공되는 콘텐츠를 유무선 전화망을 통해 음성인식 및 합성기술로 제공하기 위한 것으로서, RSS 서비스를 제공하기 위한 기존의 구성을 수정하지 않고 갱신된 콘텐츠의 구독이 손쉬운 RSS의 장점을 VoiceXML에 적용할 수 있는 특징이 있다. 정보 요청자 측면에서는 RSS로 제공되는 콘텐츠 탐색에 인터넷 환경이 아닌 유무선 전화망을 이용하므로 시공간의 제약을 줄일 수 있으며, 정보 제공자 측면에서는 음성인식 및 합성기술을 이용한 콘텐츠의 배급에 최신 정보의 제공을 위한 별도의 구성요소를 필요로 하지 않는 장점이 있다. 제안하는 시스템의 예로 뉴스 서비스를 구현한 결과, 실제 콘텐츠를 구독하고 탐색할 때에 응답 시간과 음성 인식 측면에서 장애 없이 RSS Feed를 이용해 비주얼 환경으로 제공되는 내용과 동일한 내용을 음성으로 제공받을 수 있었다.

전맹인의 접근성 향상을 위한 모바일 음성 메모 파일 관리 서비스 (Mobile Voice Note File Management Service For Improving Accessibility of the Blind)

  • 임순범;이미지;최유진;육주혜;박주현;이종우
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1215-1222
    • /
    • 2019
  • Recently, people with disabilities also search for and collect information from the web through smart devices, and save collected information on smart devices or take notes. For non-disabled people, various memo applications are provided on the market, so it is more convenient to choose according to their preference. However, existing memo services are limited for use by blind people due to the importance of visual information. The problem with blind people when using smart devices is that the screen is not recognized, so it is not possible to check in which location the menu of the application exists. In addition, it is difficult to input and manipulate text, and systematic file management and control are not possible. Therefore, in this paper, we propose the development of voice memo service that blind people can use only voice and hearing information and can operate menu with Bluetooth remote controller. We will develop a system that includes a comprehensive voice file management function for storing, searching, playing, and deleting files, rather than simply storing voice files.