• Title/Summary/Keyword: 음성 검색

Search Result 355, Processing Time 0.024 seconds

Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System (음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

Spoken Dialogue Service Trends Using Natural Speech Recognition Technology (자연어 음성인식 기술을 이용한 음성 대화 서비스 개발동향)

  • Jung, H.Y.;Song, H.J.;Kang, B.O.;Chung, E.S.;Chung, H.;Oh, Y.R.;Kwon, O.W.;Lee, K.Y.;Lee, Y.K.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.5
    • /
    • pp.14-28
    • /
    • 2011
  • 모바일 혁명과 빅데이터(big data) 시대에 접어들면서 사용자 중심의 자연스러운 인터페이스와 정보검색에 대한 요구가 늘어가고 있다. 모바일 환경에서의 쉽고 자연스러운 검색을 위해 음성인식 기술을 이용한 음성검색 서비스가 대세를 이루고 있으며 대화형 검색 서비스로 발전하게 될 것이다. 음성 대화 서비스의 주요 응용 분야인 음성검색 및 외국어 교육 서비스에서의 자연어 음성인식 기술 역할 및 사용자 경험을 바탕으로 하는 선순환 구조의 인식 성능 개선에 대해 소개한다. 또한 두 응용분야에서의 국내외 개발동향을 소개하고 실제 개발 사례를 통해 무제한급 자연어 음성인식 기술에 기반한 음성 대화 서비스의 가능성을 살펴본다.

  • PDF

A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION (보조 자료와 음성 전사를 사용한 강의 검색 시스템)

  • Lee, Donghyeon;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF

Retrieval of Player Event in Golf Videos Using Spoken Content Analysis (음성정보 내용분석을 통한 골프 동영상에서의 선수별 이벤트 구간 검색)

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.7
    • /
    • pp.674-679
    • /
    • 2009
  • This paper proposes a method of player event retrieval using combination of two functions: detection of player name in speech information and detection of sound event from audio information in golf videos. The system consists of indexing module and retrieval module. At the indexing time audio segmentation and noise reduction are applied to audio stream demultiplexed from the golf videos. The noise-reduced speech is then fed into speech recognizer, which outputs spoken descriptors. The player name and sound event are indexed by the spoken descriptors. At search time, text query is converted into phoneme sequences. The lists of each query term are retrieved through a description matcher to identify full and partial phrase hits. For the retrieval of the player name, this paper compares the results of word-based, phoneme-based, and hybrid approach.

The storage structure and retrieval mechanism for korean speech database (한국어 음성 데이타베이스의 저장 구조와 검색 기법)

  • Song, Gun-Seop;Park, Yeong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.321-330
    • /
    • 1991
  • 기존의 데이타베이스에 음성 데이타를 저장하여 음성 데이타 베이스를 구축하고자 할 경우, 음성 데이타의 특성이 가변장(variable length)이며, 튜플(음소 단위)의 길이가 매우 긴 패턴 데이타이므로 기존의 데이타베이스 시스템에서는 지원할 수 없다. 또, 현재의 음성 인식 시스템에서는 패턴 데이타를 순차적인 검색 방법으로 검색하고 있어 빠른 검색 방법이 요구된다. 본 논문에서는 음성 데이타를 음소 단위로 인식하기 위해 음소 패턴 데이타를 저장하고, 유사한 특성을 갖는 부류와 음소 길이에 의한 분류를 혼합한 방법을 이용하여 빠른 시간에 검색을 할 수 있게 하기 위한 저장 구조와 검색 알고리즘을 제시한다.

  • PDF

Efficient Codebook Search Method for AMR Speech Codec (AMR 음성 압축기를 위한 효율적인 코드북 검색 방법)

  • Lee Doyoon;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.93-96
    • /
    • 2001
  • ACELP 구조의 음성 압축기는 우수한 음질을 제공하지만 최적의 코드 벡터를 구하기 위한 계산량이 상당히 많은 단점이 있다. 이를 해결하기 위해서 본 논문에서는 AMR 음성 압축기의 코드북을 매우 효율적으로 검색하는 새로운 방법을 제안한다. 제안하는 코드북 검색 방법은 완전 순차적인 검색 방법을 사용하여 대략적인 코드 벡터를 구하고, 코드 벡터의 각 펄스들의 중요도를 계산하여 중요도가 낮은 펄스를 새로운 펄스로 교환하는 펄스 교환 과정을 수행하여 코드 벡터의 성능을 향상시키는 방법을 사용한다. 또한, AMR 음성 압축기의 구조에 맞도록 트랙별로 이동하면서 순차적으로 코드북을 검색하여 다수의 대략적인 코드벡터를 찾은 후, 각 코드 벡터에 대하여 펄스 교환 과정을 수행하여 최적의 코드 벡터를 구한다. 제안한 코드북 검색 방법을 AMR 음성 압축기의 모든 모드에 적용하여 코드북 검색을 위한 계산량과 성능을 측정하였으며, 모든 모드에 대하여 매우 적은 계산량으로 동등한 성능을 가지는 것을 확인하였다

  • PDF

A Study on Searching for Vocoder Codebook using Cache Memory (검색(Cache) 메모리를 이용한 음성 부호화기 코드북 검색에 관한 연구)

  • 김석찬;전경일
    • Journal of the Korean Institute of Telematics and Electronics T
    • /
    • v.35T no.1
    • /
    • pp.120-124
    • /
    • 1998
  • Tn the analysis of the audio signal characteristices and the codebook indices of LD-CELP, there are many cases of detecting codebook indices that are used previous. LD-CELP algorithm achives good quality of audio because it has analyzed a short term of audio signal. In spite of these advantage, the method has a drawback in which searching time of best codebook index inclose due to a complicated calculation for codebook index. This paper is proposed to decreasing the searching time of codebook index using a searching memory. As a simulation of the proposed method, searching time for codebook index is reduced 3.2%-11.7% as compared with LD-CELP.

  • PDF

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

Speech-to-MIDI Conversion with Autocorrelation (자기상관을 이용한 음성 신호의 MIDI 변환)

  • 박상보;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.439-441
    • /
    • 2004
  • 효율적인 멀티미디어 검색의 필요성이 증대됨에 따라 내용기반 멀티미디어의 검색에 대한 다양한 기법들이 소개되고 있다. 그 중에서 친숙한 멜로디를 가지고 사용자가 직접 마이크를 통해 생성한 음성 질의에 대한 분석에 대해 다루고자 한다. 음성 질의에 사용되는 음성 데이터를 분석함으로써 검색에 이용하는 것이다. 음성데이터를 분석하기 위한 방법으로 시간영역에서 가장 많이 쓰이는 기법 중의 하나인 자기상관함수를 사용한다. 자기상관 함수를 이용하여 특정구간에서 발생하는 일정한 주기 즉 기본주기를 검출할 수 있다. 자기상관함수에 의해 분석된 결과를 가지고, 음의 높낮이를 구하기 위한 기본주파수 검출 알고리즘과 음의 길이, 음의 세기를 결정하기 위한 방법을 제안한다.

  • PDF

Design and Implementation of Store Locator Voice Recognition System Using VoiceXML (VoiceXML을 사용한 상가 검색 음성인식 시스템의 설계 및 구현)

  • 김우일;송성균;고경만;윤재석;김국보
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.138-143
    • /
    • 2002
  • 음성은 컴퓨터와 인간 사이의 인터페이스로서 지속적인 연구가 되어 왔다. VoiceXML로 구현된 음성 포털 서비스는 사용자의 음성 질의에 따라 정보를 검색하고 청취할 수 있는 기술로서 현재 다양한 컨텐츠로 서비스가 진행되고 있다. 본 연구에서는 전화나 인터넷 전화 프로그램으로 상가의 위치, 전화 번호, 상가 소개 등의 정보를 음성으로 검색할 수 있는 시스템을 VoiceXML을 이용하여 구현하여 보았다. 웹과 연동할 수 있도록 시스템을 구성하고 다양한 다이얼로그를 표현하기 위해 특히, JSP를 이용하고 각 로직을 자바빈즈 컴포넌트로 구현하였다.

  • PDF