• Title/Summary/Keyword: 신호 인식

Search Result 1,796, Processing Time 0.029 seconds

Effects of Extraction Method and Choice of Lip Parameters on the Bi-modal Speech Recognition (입술정보추출 및 파라미터 선정 방법에 따른 바이모달 음성인식 성능 비교)

  • 박병구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.347-350
    • /
    • 1998
  • 음성신호와 영상신호를 함께 이용하는 바이모달(Bi-modal)음성인식에서 어떤 입술 파라미터를 사용하는가에 따라 인식시스템의 성능이 달라진다. 그래서 본 논문에서는 이미지에 근거한 입술파라미터를 견인하게 추출하기 위한 방법으로 x 프로파일(profile)을 이용한 방법을 사용하였다. 파라미터를 선정을 달리하여 실험한 결과 15dB이상에서는 안쪽입술의 2개의 파라미터를 이용한 경우가, 10dB이하에서는 4개의 입술파라미터를 이용한 경우가 더 좋은 인식률을 보였다. 안쪽 입술 파라미터를 이용한 경우가 바깥쪽 입술 파라미터를 이용한 경우보다 더 좋은 인식률을 보였다.

  • PDF

On a Performance Improvement of Speaker Recogniton using the Transition Region of Speech Signal (음성신호의 전이구간을 이용한 화자 인식의 성능향상에 관한 연구)

  • 오세영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.392-395
    • /
    • 1998
  • 기존의 DP 알고리즘을 이용하여 화자를 인식할 경우 시스템에 등록되어 있는 화자의 수가 증가할수록 처리해야할 데이터의 양이 많아진다. 그러므로 인식률이 저하되고 처리시간이 증가한다는 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위해 화자가 발성한 음성신호에서 안정구간내의 일정 파형을 삭제한 후 전이구간을 위주로 DP 알고리즘을 적용하여 화자를 인식한다. 제안한 방법으로 시험한 결과 시스템의 전체 인식률은 기존의 DP 알고리즘을 이용한 결과에 비해 1%의 향상을 보였고 처리시간은 21.6% 감소함을 볼 수 있다.

  • PDF

A Speech Recognition Using Instantaneous SNR Estimation and RASTA Processing (순시적인 신호대 잡음비 예측과 RASTA 기법을 이용한 음성인식)

  • 배현권;오문식;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.55-59
    • /
    • 1998
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 음성의 특징 추출에 관해서 살펴 보았다. 지금까지의 음성 인식기는 조용한 실험실 환경하에서 학습이 이루어지나 실제 테스 트는 여러 가지 환경에서 이루어지므로, 이러한 환경 변화에 따라 음성인식 시스템의 성능 이 감소함을 보여왔다. 이를 보완하기 위해 여러 가지 연구가 진행되고 있으나 본 연구에서 는 음성의 특징 추출 부분에서 순시적인 신호대 잡음비 예측과 잡음에 강한(RASTA)처리를 하므로써 인식율을 향상시켰다.

  • PDF

A Character Recognition on Complex Color Documents (복잡한 컬러 문서에 대한 문자인식)

  • 양철용;김갑기;김진욱;김항준
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.08a
    • /
    • pp.233-236
    • /
    • 2000
  • 최근 수많은 인쇄된 문서들이 HTML과 같은 디지털 문서로 바뀌고 있으며 이를 자동으로 변환해 주는 문자인식 기술에 대한 관심이 증가하고 있다. 본 논문에서는 그림과 글자가 공존하는 문서에서 자동으로 문자영역을 추출해서 문자를 인식하는 방법을 제안한다. 우선 입력문서는 유사한 칼라로 이루어진 영역들로 나누어진 뒤 휴리스틱 룰에 의해 문자후보 영역과 비 문자 영역으로 나누어진다. 그 다음 이들 문자후보영역들은 문자인식기를 이용하여 문자 혹은 문자의 일부분으로 인식된다. 제안된 방법으로 여러 문서들에 대하여 실험한 결과를 보이며 그 성능을 평가한다.

  • PDF

Machine Learning based Traffic Light Detection and Recognition Algorithm using Shape Information (기계학습 기반의 신호등 검출과 형태적 정보를 이용한 인식 알고리즘)

  • Kim, Jung-Hwan;Kim, Sun-Kyu;Lee, Tae-Min;Lim, Yong-Jin;Lim, Joonhong
    • Journal of IKEEE
    • /
    • v.22 no.1
    • /
    • pp.46-52
    • /
    • 2018
  • The problem of traffic light detection and recognition has recently become one of the most important topics in various researches on autonomous driving. Most algorithms are based on colors to detect and recognize traffic light signals. These methods have disadvantage in that the recognition rate is lowered due to the change of the color of the traffic light, the influence of the angle, distance, and surrounding illumination environment of the image. In this paper, we propose machine learning based detection and recognition algorithm using shape information to solve these problems. Unlike the existing algorithms, the proposed algorithm detects and recognizes the traffic signals based on the morphological characteristics of the traffic lights, which is advantageous in that it is robust against the influence from the surrounding environments. Experimental results show that the recognition rate of the signal is higher than those of other color-based algorithms.

Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution (음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상)

  • Hwang, Jae-Cheon
    • Journal of the Korea Convergence Society
    • /
    • v.8 no.5
    • /
    • pp.13-17
    • /
    • 2017
  • Existing Speech feature extracting method in speech Signal, there are incorrect recognition rates due to incorrect speech which is not clear threshold value. In this article, the modeling method for improving speech recognition performance that combines the feature extraction for speech and silence characteristics normalized to the non-speech. The proposed method is minimized the noise affect, and speech recognition model are convergence of speech signal feature extraction to each speech frame and the silence feature normalization. Also, this method create the original speech signal with energy spectrum similar to entropy, therefore speech noise effects are to receive less of the noise. the performance values are improved in signal to noise ration by the silence feature normalization. We fixed speech and non speech classification standard value in cepstrum For th Performance analysis of the method presented in this paper is showed by comparing the results with CHMM HMM, the recognition rate was improved 2.7%p in the speech dependent and advanced 0.7%p in the speech independent.

A study on the chaotic analysis of snoring signal (코골이 신호의 카오틱 신호 분석에 관한 연구)

  • Choo, Yeon-Gyu;Kang, Sung-Soo;Kim, Bong-Gi
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.05a
    • /
    • pp.655-657
    • /
    • 2010
  • 현재 코골이를 방지하는 위한 기구로는 양압 산소호흡기, 스프레이, 전기자극기, 수술, 구강내 보조기구가 있으나 개인용으로 사용하기에는 가격이 너무 고가이어서 일반적인 코골이 환자에게 적용하기에는 무리가 있으며 사용자에 따라 부작용의 위험이 있다. 본 논문에서는 정확하고 안정적인 코골이 신호인식을 위해 시계열 분석방법을 통해서 선형적인 성질보다 비선형적인 성질이 강한 코골이 신호의 카오틱 신호 유무를 해석하였다. 본 논문에서 사용한 시계열 데이터는 30대 성인남자로부터 수면시간 6시간중중 발생하는 코골이 음성신호를 마이크를 통해 샘플링 주파수 22kHz, 모노 형태로 수집한 것이다. 위상공간의 궤적 분석, 매입차원에 의한 상관적분 분석, 파워 스펙트럼과 자기상관함수 분석 등의 정량 및 정성적 분석방법을 통해서 수집한 코골이 신호의 분석결과 신호가 부분적으로 주기적 성질을 가지는 카오스 신호임을 확인하였다.

  • PDF

Signal Processing Techniques for Recognition of CW Morse Signals (CW Morse 신호 인식을 위한 신호처리 기법)

  • Son, Young-Chae;Lim, Dong-Min;Tae, Ki-Cheol;Kim, Chung-Sub;Hahm, Young-Kwon;Kim, Chang-Joo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.27 no.8A
    • /
    • pp.763-770
    • /
    • 2002
  • Recognition of CW Morse signals can be divided into several phases such as detection of tones and spaces, signal processing for removing noise from detected signals, decision of tones/spaces, mapping a sequence of tones and spaces into characters, error correction of a character message with textual repetition. In this paper, in order to cope with signal fading effectively we propose a signal detection method of identifying peaks in the frequency domain and present techniques for combining multiple frequency peaks and for removing residual signal components and noise. LMS adaptive method is applied for decision of tones/spaces, and initial value setting and malfunctioning conditions are analyzed. In recognition experiments, we used CW Morse signals collected by radio receivers and found that the proposed method achieves good recognition performance even in severe fading conditions.

Korean isolated word recognizer using new time alignment method of speech signal (새로운 시간축 정규화 방법을 이용한 한국어 고립단어 인식기)

  • Nam, Myeong-U;Park, Gyu-Hong;No, Seung-Yong
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.38 no.5
    • /
    • pp.567-575
    • /
    • 2001
  • This paper suggests new method to get fixed size parameter from different length of voice signals. The efficiency of speech recognizer is determined by how to compare the similarity(distance of each pattern) of the parameter from voice signal. But the variation of voice signal and the difference of speech speed make it difficult to extract the fixed size parameter from the voice signal. The method suggested in this paper is to normalize the parameter at fixed size by using the 2 dimension DCT(Discrete Cosine Transform) after representing the parameter by spectrogram. To prove validity of the suggested method, parameter extracted from 32 auditory filter-bank(it estimates auditory nerve firing probabilities) is used for the input of neural network after being processed by 2 dimension DCT. And to compare with conventional methods, we used one of conventional methods which solve time alignment problem. The result shows more efficient performance and faster recognition speed in the speaker dependent and independent isolated word recognition than conventional method.

  • PDF

A Study on Numeral Speech Recognition Using Integration of Speech and Visual Parameters under Noisy Environments (잡음환경에서 음성-영상 정보의 통합 처리를 사용한 숫자음 인식에 관한 연구)

  • Lee, Sang-Won;Park, In-Jung
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.38 no.3
    • /
    • pp.61-67
    • /
    • 2001
  • In this paper, a method that apply LP algorithm to image for speech recognition is suggested, using both speech and image information for recogniton of korean numeral speech. The input speech signal is pre-emphasized with parameter value 0.95, analyzed for B th LP coefficients using Hamming window, autocorrelation and Levinson-Durbin algorithm. Also, a gray image signal is analyzed for 2-dimensional LP coefficients using autocorrelation and Levinson-Durbin algorithm like speech. These parameters are used for input parameters of neural network using back-propagation algorithm. The recognition experiment was carried out at each noise level, three numeral speechs, '3','5', and '9' were enhanced. Thus, in case of recognizing speech with 2-dimensional LP parameters, it results in a high recognition rate, a low parameter size, and a simple algorithm with no additional feature extraction algorithm.

  • PDF