• Title/Summary/Keyword: 음성 검색

Search Result 355, Processing Time 0.032 seconds

Semantic Ontology Speech Information Extraction using Non-parametric Correlation Coefficient (비모수적 상관계수를 이용한 시맨틱 온톨로지 음성 정보 추출)

  • Lee, Byungwook
    • Journal of Digital Convergence
    • /
    • v.11 no.9
    • /
    • pp.147-151
    • /
    • 2013
  • On retrieving high frequency keywords in information retrieval system, mismatchings to user's request are problems because of the various meanings of keywords in the existing ontology configuration. In this paper, it is to construct personnel selection ontology and rules in personnel management which are composed of various concepts and knowledges based on semantic web technology and suggest selection procedures to support these rules and knowledge retrieval system to verify suitability of selection results. This system utilizes a method of extraction of speech features by using non-parametric correlation coefficient. This proposed method has been validated by showing that the result average SNR of the experiment evaluation of the proposed techniques was shown to be decreased by .752dB.

An Experimental Field Trial of Stock Information Retrieval System Based on Speech Recognition (음성인식기술을 이용한 증권정보 안내 시스템의 실험적 실용시험)

  • 도삼주
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.241-244
    • /
    • 1994
  • 이 논문은 대어휘, 화자독립 음성인식 시스템인 KT-STOCK과 이 시스템에 대한 전화망을 통한 실험적 실용시험에 대해 기술하였다. KT-STOCK은 현재 주식시장에 상장된 712개 회사의 현재주가를 음성을 이용하여 검색할 수 있는 시스템이다. 이 시스템은 hidden markov model 기술에 기반을 둔 고립단어 인식 시스템이며 유사음소를 기본 인식단위로 사용한다. KT-STOCK은 1994년 6월 24일부터 실험적 실용시험 중에 있다. 중간 결과에 따르면 모의 실험 결과는 실제 환경에서의 시험과 차이가 있는 거승로 나타났다. 실제 환경에서 이 시스템의 인식률은 현재 61.9%이다.

  • PDF

The Low Cost Implementation of Speech Recognition System for the Web (웹에서의 저가 음성인식 시스템의 구현)

  • Park, Yong-Beom;Park, Jong-Il
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.4
    • /
    • pp.1129-1135
    • /
    • 1999
  • isolated word recognition using the Dynamic Time warping algorithm has shown good recognition rate on speaker dependent environment. But, practically, since the searching time of the dynamic Time Warping algorithm is rapidly increased as searching data is increased. it is hard to implement. In the context-dependent-short-query system such as educational children's workbook on the Web, the number of responses to the specific questions is limited. Therefore, the searching space for the answers can be reduced depending on the questions. In this paper, low cost implementation method using DTW for the Web has been proposed. To cover the weakness of DTW, the searching space is reduced by the context. the searching space, depends on the specific questions, is chosen from interest searchable candidates. In the real implementation, the proposed method show better performance of both time and recognition rate.

  • PDF

On the Improving the pitch Searching Error of CELP Type Vocoder (CELP형 보코더에서 피치 검색오류의 개선)

  • 배명진;장호성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.3
    • /
    • pp.62-67
    • /
    • 1993
  • 부호 여기된 선형예측 음성보코더들은 4800bps의 낮은 전송율에서도 좋은 음질을 제공한다. CELP 형 보코더의 피치검색법의 문제점중에 하나는 피치 검출시의 조오류에 의해 예측이득이 저하된다는 점이다. 본 논문에서 우리는 CELP 보코더의 피치 예측이득을 개선하는 한 새로운 피치검색법을 제안하였다. 제안한 방법은 예비피치들을 검출하여 이들중 피치 예측이득이 최대인 값을 선정하는 방법을 적용하였다. 이 방법을 여러 화자의 발성에 대해 적용한 결과 피치 예측이득율 6.1% 정도 개선할 수 있었다.

  • PDF

A New Pitch Detection Method Using The WRLS-VFF-VT Algorithm (WRLS-VFF-VT 알고리듬을 이용한 새로운 피치 검출 방법)

  • Lee, Kyo-Sik;Park, Kyu-Sik
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.10
    • /
    • pp.2725-2736
    • /
    • 1998
  • In this paper. we present a new pitch determination method for speech analysis. namely VFF(Variable Forgetting Factor) based. by using the WRLS-VFF-VT(Weighted Recursive Least Square-Variable Forgetting Factor-Variable Threshold) algorithm. A proposed method uses VFF to identify the glottal closure points which correspond to the instants of the main excitation pulses for voiced speech. The modified EGG

  • PDF

Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore ($TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현)

  • 양용호;이인성;권오주
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.7C
    • /
    • pp.962-970
    • /
    • 2004
  • This paper presents an efficient implementation of the 2.4 kbps EHSX(Enhanced Harmonic Stochastic Excitation) speech coder on a TMS320C6701$^{TM}$ floating-point digital signal processor. The EHSX speech codec is based on a harmonic and CELP(Code Excited Linear Prediction) modeling of the excitation signal respectively according to the frame characteristic such as a voiced speech and an unvoiced speech. In this paper, we represent the optimization methods to reduce the complexity for real-time implementation. The complexity in the filtering of a CELP algorithm that is the main part for the EHSX algorithm complexity can be reduced by converting program using floating-point variable to program using fixed-point variable. We also present the efficient optimization methods including the code allocation considering a DSP architecture and the low complexity algorithm of harmonic/pitch search in encoder part. Finally, we obtained the subjective quality of MOS 3.28 from speech quality test using the PESQ(perceptual evaluation of speech quality), ITU-T Recommendation P.862 and could get a goal of realtime operation of the EHSX codec.c.

An Annotation Browsing Technique in e-book for Reading-disabled People Using Voice Recognition (독서장애인 전자책을 위한 음성인식을 이용한 어노테이션 브라우징 기법)

  • Park, Joo-Hyun;Lee, Jong-Woo;Lim, Soon-Bum
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.403-405
    • /
    • 2012
  • 본 연구에서는 독서장애인을 위한 전자책용 어노테이션의 탐색 및 재생 기법을 제안하고 이를 음성 어노테이션 브라우징 시스템이라 칭하였다. 제안된 음성어노테이션 브라우징 시스템은 명령 입력, 중요도 분석 및 추천, 검색, 출력단계로 구성된다. 특히 본 연구에서는 대상 사용자가 청각 의존도가 높은 독서장애인들이기 때문에 완전히 청각에 의존해서 사용할 수 있도록 모든 단계에서 음성인식 기능을 제공한다. 제안된 음성 어노테이션 브라우징 시스템의 효율성을 검증하기 위해 안드로이드 환경에서 실행되는 전자책 소프트웨어와 음성 어노테이션 브라우징 시스템을 설계하고 구현하였다.