• Title/Summary/Keyword: 음성검출기

Search Result 137, Processing Time 0.023 seconds

Speech Recognition System for Home Automation Using DSP (DSP를 이용한 홈 오토메이션용 음성인식 시스템의 실시간 구현)

  • Kim I-Jae;Kim Jun-sung;Yang Sung-il;Kwon Y.
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.171-174
    • /
    • 2000
  • 본 논문에서는 홈 오토메이션 시스템을 음성인식을 도입하여 설계하였다. 많은 계산량과 방대한 양의 데이터의 처리를 요구하는 음성인식을 DSP(Digital Signal Processor)를 통하여 구현해 보고자 본 연구를 수행하였다. 이를 위해 실시간 끝점검출기를 이용하여 추가의 입력장치가 필요하지 않도록 시스템을 구성하였다. 특징벡터로는 LPC로부터 유도한 10차의 cepstrum과 log 스케일 에너지를 이용하였고, 음소수에 따라 상태의 수를 다르게 구성한 DHMM(Discrete Hidden Marcov Model)을 인식기로 사용하였다. 인식단어는 가정 자동화를 위하여 많이 쓰일 수 있는 10개의 단어를 선택하여 화자 독립으로 인식을 수행하였다. 또한 단어가 인식이 되면 인식된 단어에 대해서 현재의 상태를 음성으로 알려주고 이에 대해 자동으로 실행하도록 시스템을 구성하였다.

  • PDF

Speech Input/Output Processing Technology for Human-Computer Interface (HCI를 위한 음성 입출력 처리 기술 개발)

  • 이영직
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.367-370
    • /
    • 1998
  • 정보통신부 출연의 "HCI를 위한 음성 입출력 처리 기술 개발" 과제에 대하여 기술한다. 이 과제의 주 목적은 PC 윈도우 환경에서 사람과 기계 간의 음성 입출력 기술을 개발하는 것이다. 이를 위해 음성 인식 분야에서는 화자 적응, 잡음 적응, 및 인식 대상 어휘 적응 기술을 개발하며, 합성 분야에서는 시스템 메시지 합성 기술을 개발한다. 또, 음성이 기존의 입출력 수단인 키보드나 마우스를 모두 대치할 수 없으므로, 본 과제에서는 음성이 추가됨으로써 입출력이 편리해지는 다중 모드 입출력 기술의 갭라에 초점을 맞추어 기술을 개발하고 있다. 인식 분야의 주요 연구내용은 음성검출 및 비음성 제거, 인식 속도 향상, 인식 성능 향상이며, 합성 분야 주요 연구 항목은 학습형 합성기 알고리즘 및 이의 문제점 해결이다. 본 논문은 이러한 점을 정리하여 발표한다.정리하여 발표한다.

  • PDF

An Embedded Timing Loss Detector for Robust Data Transmission (데이터 전송을 위한 타이밍 손실 검출기)

  • 이용환
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.9
    • /
    • pp.1404-1411
    • /
    • 1993
  • Unlike voice communication, data transmission, can be seriously affected by transient channel impairments. In some cases, timing synchronization between the transmitter and the receiver may not be recovered in the presence of these kinds of impairments without a forced reinitialization process. Therefore, it is highly desirable for data communication equipment to have an efficient timing loss detector for robust recovery. In this paper, one such detector is proposed for data transceivers haying a secondary channel embedded in the main channel. A known sequence multiplexed with the secondary channel data is repeatedly sent through the embedded secondary channel. For continuous watch-dog like operation, the detection is sequentially performed based on a modified up/down counter scheme. The performance of the proposed detector is analytically evaluated In closed form.

  • PDF

Sound Transimitting System using Power Line and Lamp (전력선과 조명등을 이용한 음향신호 전달)

  • Joo, Kyung-Don;Kang, Min-Woo;Koo, Kyung-Wan;Lee, Seung-Kwon;Lee, Hyung-Sup
    • Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
    • /
    • 2002.05c
    • /
    • pp.237-241
    • /
    • 2002
  • 전력선과 조명등을 이용한 음향전달 시스템을 구성하여 어학실습 교육용으로의 활용 가능성을 평가하였다. 음성신호를 변조하여 전력선에 실어 보내는 송신기와 조명등의 빛으로부터 음성신호를 검출하여 이어폰 또는 헤드폰 둥으로 들을 수 있는 수신기로 구성하였다. 제작한 송신기와 수신기의 주파수 특성과 스펙트럼분석을 하였다. 스피커로 출력되는 음질상태는 최적상태는 아니지만 음성이나 노래 등을 이용한 어학실습 교육용으로는 충분한 수준이 었다.

  • PDF

Hue-based Noise-tolerant Corner Detector Robust to Shadows (그림자에 강건한 색상 기반 내잡음성 코너 검출자)

  • 박기현;박은진;최흥문
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.6
    • /
    • pp.239-245
    • /
    • 2004
  • A hue-based noise-tolerant corner detector is proposed for the exact detection of the real corners in spite of the shadows and random noise. Based on the fact that the hue gradient at the border of the opaque objects' shadow is smaller than the intensity gradient in HSI (hue-saturation-intensity) color space, the effects of shadow are eliminated by introducing the hue-weighted combination of vector gradient to the proposed corner detector. Furthermore, the proposed corner detector is robust to random noise by offsetting the contribution to the corner candidate when the polarities of the color gradients of the pixel pairs are out of phase each other. Results of the experiment show that the proposed corner detector can effectively detect the real corners.

An Integrated Acoustic Echo and Noise Cancellation System for Hands-Free Telephony (핸즈프리 전화통신을 위하여 통합된 음향 반향 및 잡음 제거 시스템)

  • 박선준;조점군;이충용;윤대희
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.6B
    • /
    • pp.760-766
    • /
    • 2001
  • 본 논문에서는 차량내 핸즈프리 전화통신을 위한 음향 반향 및 배경 잡음 제거기를 제안한다. 제안한 시스템은 새로운 잔여 반향 제거 기법과 실시간 구현에 적합한 동시통화 검출기를 포함한다. 잔여 반향 제거에서는 근단화자가 없는 구간에 대하여 선형 예측기를 이용하여 잔여 반향 신호의 인접 샘플간의 상관도를 제거하여 잡음 제거기의 입력으로 사용한다. 잔여 반향 신호의 음성특성을 제거함으로써 잡음 제거기를 이용하여 배경 잡음과 더불어 잔여 반향의 전력을 효과적으로 줄일 수 있다. 제안된 시스템에서는 상용 저전송률 음성부호화기와의 결합을 고려하여 IS-127(EVRC)에 포함되어 있는 잡음 제거기를 사용하였다. 90 km/h로 정속 주행하는 차내의 핸즈프리 환경에서 제안된 시스템은 30 dB이상의 간섭신호 제거 성능을 보였다. 제안된 시스템은 16비트 고정 소수점 연산을 하는 저가의 DSP를 이용하여 실시간 구현되었다.

  • PDF

Design for Crowd Noise Reduction System Using DSI and Spectral Subtraction (DSI와 스펙트럼 차감법을 이용한 군중잡음 감쇄기의 설계)

  • Ahn, Yong-Woon;Kim, Sang-Chul;Kim, Joong-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.703-706
    • /
    • 2002
  • 군중잡음(crowd noise)이 발생하는 환경에서 음성 통화 및 화자 인식을 할 때에는 음성에 파열음이나 마찰음과 같은 유색잡음(colored noise)이 부가되어 원래 음성이 왜곡된다. 이와 같이 왜곡된 음성 신호를 처리할 때에는 군중잡음을 제거하는 과정이 반드시 필요하다. 본 논문에서는 전형적인 군중잡음의 모델인 쇼핑 센터 잡음을 분석하고, 그 결과를 이용하여 음성 신호처리시에 효과적으로 군중잡음만을 제거할 수 있는 모델을 제안한다. 제안된 모델은 시간 영역에서 마찰음과 파열음을 제거하고. DSI(Digital Speech Interpolation)를 이용하여 침묵 구간을 검출한다. 이때 주파수 영역에서는 이 침묵구간을 잡음으로 간주하여 이를 이용한 스펙트럼 차감법(spectral subtraction)으로 음성 신호에 부가된 군중 잡음을 제거하는 과정을 거친다.

  • PDF

Development of a Stock Information Retrieval System using Speech Recognition (음성 인식을 이용한 증권 정보 검색 시스템의 개발)

  • Park, Sung-Joon;Koo, Myoung-Wan;Jhon, Chu-Shik
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.6 no.4
    • /
    • pp.403-410
    • /
    • 2000
  • In this paper, the development of a stock information retrieval system using speech recognition and its features are described. The system is based on DHMM (discrete hidden Markov model) and PLUs (phonelike units) are used as the basic unit for recognition. End-point detection and echo cancellation are included to facilitate speech input. Continuous speech recognizer is implemented to allow multi-word speech. Data collected over several months are analyzed.

  • PDF

A Discrete Feature Vector for Endpoint Detection of Speech with Hidden Markov Model (숨은마코프모형을 이용하는 음성 끝점 검출을 위한 이산 특징벡터)

  • Lee, Jei-Ky;Oh, Chang-Hyuck
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.6
    • /
    • pp.959-967
    • /
    • 2008
  • The purpose of this paper is to suggest a discrete feature vector, robust in various levels of noisy environment and inexpensive in computation, for detection of speech segments and is to show such properties of the feature with real speech data. The suggested feature is one dimensional vector which represents slope of short term energies and is discretized into three values to reduce computational burden of computations in HMM. In experiments with speech data, the method with the suggested feature vector showed good performance even in noisy environments.

An Automatic Post-processing Method for Speech Recognition using CRFs and TBL (CRFs와 TBL을 이용한 자동화된 음성인식 후처리 방법)

  • Seon, Choong-Nyoung;Jeong, Hyoung-Il;Seo, Jung-Yun
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.9
    • /
    • pp.706-711
    • /
    • 2010
  • In the applications of a human speech interface, reducing the error rate in recognition is the one of the main research issues. Many previous studies attempted to correct errors using post-processing, which is dependent on a manually constructed corpus and correction patterns. We propose an automatically learnable post-processing method that is independent of the characteristics of both the domain and the speech recognizer. We divide the entire post-processing task into two steps: error detection and error correction. We consider the error detection step as a classification problem for which we apply the conditional random fields (CRFs) classifier. Furthermore, we apply transformation-based learning (TBL) to the error correction step. Our experimental results indicate that the proposed method corrects a speech recognizer's insertion, deletion, and substitution errors by 25.85%, 3.57%, and 7.42%, respectively.