• 제목/요약/키워드: recognition error

검색결과 1,013건 처리시간 0.037초

음소 유사율 오류 보정을 이용한 어휘 인식 후처리 시스템 (Vocabulary Recognition Post-Processing System using Phoneme Similarity Error Correction)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.83-90
    • /
    • 2010
  • 어휘 인식 시스템에서 인식률 저하의 요인으로는 유사한 음소 인식과 부정확한 어휘 제공으로 인해 오인식 오류가 존재한다. 부정확한 어휘의 입력으로 특징을 추출하여 인식할 경우 오인식의 결과가 나타나거나 유사한 음소로 인식되며 특징 추출이 제대로 이루어지지 않으면 음소 인식 시 유사한 음소로 인식하게 된다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 음소 유사율을 이용한 어휘 인식 후처리에서의 오류 보정 후처리 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터를 각각의 음소에 MFCC와 LPC 특징 추출 방법을 이용하여 구하였다. 유사한 음소는 정확한 음소로 인식할 수 있도록 유도하여 부정확한 어휘 제공으로 인하여 오인식되는 오류를 최소화하였다. 음소 유사율과 신뢰도를 이용하여 오류 보정율을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러패턴 학습을 이용한 시스템과 의미기반을 이용한 시스템에 비해 시스템 성능 평가 결과 MFCC와 LPC는 각각 7.5%와 5.3%의 인식 향상률을 보였다.

MFCC와 LPC 특징 추출 방법을 이용한 음성 인식 오류 보정 (Speech Recognition Error Compensation using MFCC and LPC Feature Extraction Method)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.137-142
    • /
    • 2013
  • 음성 인식 시스템은 부정확한 음성 신호의 입력으로 특징을 추출하여 인식할 경우 오인식의 결과가 나타나거나 유사한 음소로 인식된다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 음소 유사율과 신뢰도 측정을 이용한 음성 인식 오류 보정 방법을 제안하였다. 음소 유사율은 학습 모델의 음소에 MFCC와 LPC 특징 추출 방법을 이용하여 구하였으며 신뢰도로 측정하였다. 음소 유사율과 신뢰도를 측정하여 오인식되는 오류를 최소화하였으며 음성 인식 과정에서 오류로 판명된 음성에 대하여 오류 보정을 수행하였다. 본 논문에서 제안한 시스템을 적용한 결과 98.3%의 인식률과 95.5%의 오류 보정율을 나타내었다.

단어 경계 검출 오류 보정을 위한 수정된 비터비 알고리즘 (A Modified Viterbi Algorithm for Word Boundary Detection Error Compensation)

  • 정훈;정익주
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권1E호
    • /
    • pp.21-26
    • /
    • 2007
  • In this paper, we propose a modified Viterbi algorithm to compensate for endpoint detection error during the decoding phase of an isolated word recognition task. Since the conventional Viterbi algorithm explores only the search space whose boundaries are fixed to the endpoints of the segmented utterance by the endpoint detector, the recognition performance is highly dependent on the accuracy level of endpoint detection. Inaccurately segmented word boundaries lead directly to recognition error. In order to relax the degradation of recognition accuracy due to endpoint detection error, we describe an unconstrained search of word boundaries and present an algorithm to explore the search space with efficiency. The proposed algorithm was evaluated by performing a variety of simulated endpoint detection error cases on an isolated word recognition task. The proposed algorithm reduced the Word Error Rate (WER) considerably, from 84.4% to 10.6%, while consuming only a little more computation power.

3차원 안면자동인식기(3D-AFRA)의 Hardware 정밀도 검사 : 형상복원 오차분석 (An Hardware Error Analysis of 3D Automatic Face Recognition Apparatus(3D-AFRA) : Surface Reconstruction)

  • 석재화;송정훈;김현진;유정희;곽창규;이준희;고병희;김종원;이의주
    • 사상체질의학회지
    • /
    • 제19권2호
    • /
    • pp.30-39
    • /
    • 2007
  • 1. Objectives The Face is an important standard for the classification of Sasang Constitution. We are developing 3D Automatic Face Recognition Apparatus(3D-AFRA) to analyse the facial characteristics. This apparatus show us 3D image and data of man's face and measure facial figure data. So we should examine the figure restoration error of 3D Automatic Fare Recognition Apparatus(3D-AFRA) in hardware Error Analysis. 2. Methods We scanned Face status by using 3D Automatic Face Recognition Apparatus(3D-AFRA). And also we scanned Face status by using laser scanner(vivid 9i). We compared facial shape data be restored by 3D Automatic Face Recognition Apparatus(3D-AFRA) with facial shape data that be restorated by 3D laser scanner. And we analysed the average error and the maximum error of two data. 3. Results and Conclusions In frontal face, the average error was 0.48mm. and the maximum error was 4.60mm. In whole face, the average error of was 0.99mm. And the maximum error was 6.64mm. In conclusion, We assessed that accuracy of 3D Automatic Face Recognition Apparatus(3D-AFRA) is considerably good.

  • PDF

의미 분석과 형태소 분석을 이용한 핵심어 인식 시스템 (Key-word Recognition System using Signification Analysis and Morphological Analysis)

  • 안찬식;오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제13권11호
    • /
    • pp.1586-1593
    • /
    • 2010
  • 확률적 패턴 매칭과 동적 패턴 매칭의 어휘 인식 오류 보정 방법에서는 핵심어를 기반으로 문장을 의미론적으로 분석하므로 형태론적 변형에 따른 핵심어 분석이 어려운 문제점을 가지고 있다. 이를 해결하기 위해 본 연구에서는 음절 복원 알고리즘에서 형태소 분석을 이용하여 인식된 음소 열을 의미 분석 과정을 통해 음소의 의미를 파악하고 형태론적 분석으로 문장을 복원하여 어휘 오인식률을 감소하였다. 시스템 분석을 위해 음소 유사률과 신뢰도를 이용하여 오류 보정률을 구하였으며, 어휘 인식 과정에서 오류로 판명된 어휘에 대하여 오류 보정을 수행하였다. 에러 패턴 학습을 이용한 방법과 오류 패턴 매칭 기반 방법, 어휘 의미 패턴 기반 방법의 성능 평가 결과 2.0%의 인식 향상률을 보였다.

A Tow-stage Recognition Approach Based on Error Pattern Hypotheses for Connected Digit Recognition

  • Oh, Wook-Kwon;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권3E호
    • /
    • pp.31-36
    • /
    • 1996
  • In this paper, a two-stage recognition approach based on error pattern hypotheses is proposed to reduce errors of a connected digit recognizer. In the approach, a conventional recognizer is first used to produce N-best candidate strings, and then error patterns are hypothesized by examining the candidate strings. For substitution error pattern hypotheses, error-pattern-dependent classifiers having more discriminative power than the first-stage classifier are used ; and for insertion and deletion errors, word duration and energy contour information are exploited are exploited to discriminated confusing pairs. Simulation results showed that the proposed approach achieves 15% decrease in word error rate for speaker-independent Korean connected digit recognition when a hidden Markov model-based recognizer is used for the first-stage classifier.

  • PDF

VQ/HMM에 의한 화자독립 음성인식에서 다수 후보자를 인식 대상으로 제출하는 방법에 관한 연구 (A Study on the Submission of Multiple Candidates for Decision in Speaker-Independent Speech Recognition by VQ/HMM)

  • 이창영;남호수
    • 음성과학
    • /
    • 제12권3호
    • /
    • pp.115-124
    • /
    • 2005
  • We investigated on the submission of multiple candidates in speaker-independent speech recognition by VQ/HMM. Submission of fixed number of multiple candidates has first been examined. As the number of candidates increases by two, three, and four, the recognition error rates were found to decrease by 41%, 58%, and 65%, respectively compared to that of a single candidate. We tried another approach that the candidates within a range of Viterbi scores are submitted. The number of candidates showed geometric increase as the admitted range becomes large. For a practical application, a combination of the above two methods was also studied. We chose the candidates within some range of Viterbi scores and limited the maximum number of candidates submitted to five. Experimental results showed that recognition error rates of less than 10% could be achieved with average number of candidates of 3.2 by this method.

  • PDF

화자인식을 위한 퍼지-상관차원과 퍼지-리아프노프차원의 평가 (The Evaluation of the Fuzzy-Chaos Dimension and the Fuzzy-Lyapunov Ddimension)

  • 유병욱;박현숙;김창석
    • 음성과학
    • /
    • 제7권3호
    • /
    • pp.167-183
    • /
    • 2000
  • In this paper, we propose two kinds of chaos dimensions, the fuzzy correlation and fuzzy Lyapunov dimensions, for speaker recognition. The proposal is based on the point that chaos enables us to analyze the non-linear information contained in individual's speech signal and to obtain superior discrimination capability. We confirm that the proposed fuzzy chaos dimensions play an important role in enhancing speaker recognition ratio, by absorbing the variations of the reference and test pattern attractors. In order to evaluate the proposed fuzzy chaos dimensions, we suggest speaker recognition using the proposed dimensions. In other words, we investigate the validity of the speaker recognition parameters, by estimating the recognition error according to the discrimination error of an individual speaker from the reference pattern.

  • PDF

3차원 안면자동인식기의 Positioning 오차분석 (An Positioning Error Analysis of 3D Face Recognition Apparatus)

  • 곽창규;조용범;손은혜;유정희;고병희;김종원;김규곤;이의주
    • 사상체질의학회지
    • /
    • 제18권2호
    • /
    • pp.34-40
    • /
    • 2006
  • 1. Objectives We are going to develope 3D Face Recognition Apparatus to analyse the facial characteristics of the Sasangin. In the process, we should identify the recognition rate of the three dimensional position using this Apparatus. 2. Methods We took a photograph of calibrator($280{\times}400mm$) with interval of 20mm longitudinal direction of 10 times using 3D Face Recognition Apparatus. In the practice, we obtained 967 point to the exclusion of points deviating from the visual field of dual camera. And we made a comparison between measurement values and three dimensional standard values to calculate the errors. 3. Results and Conclusions In this test, the average error rate of X axis values was 0.019% and the maximum error rate of X axis values was 0.033%, the average error rate of Y axis values was 0.025% and the maximum error rate of Y axis values was 0.044%, the average error rate of Z axis values was 0.158% and the maximum error rate of Z axis values was 0.269%. This results exhibit much improvement upon the average error rate 1% and the maximum error rate 2.242% of the existing 3D Recognition Apparatus. In conclusion, we assessed that this apparatus was adaptable to abstract the facial characteristic point from three dimensional face shape in the mechanical aspects.

  • PDF

가변 감쇠 파라미터를 이용한 Levenberg-Marquardt 알고리즘의 학습 속도 향상 (Accelerating Levenberg-Marquardt Algorithm using Variable Damping Parameter)

  • 곽영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.57-63
    • /
    • 2010
  • Levenberg-Marquardt 알고리즘에서 감쇠 파라미터는 오류역전파 학습과 Gauss-Newton 학습의 스위치 역할을 하며 학습 속도에 영향을 준다. 이런 감쇠 파라미터를 고정시키는 것은 오차 함수의 진동을 유발하고 학습 속도를 감소시킨다. 따라서 본 논문은 오차 함수의 변화 과정을 참조하여 감쇠 파라미터를 가변적으로 적용하는 방법을 제안한다. 제안된 방법은 오차의 변화량이 크면 감쇠 파라미터를 크게, 오차의 변화량이 작으면 감쇠 파라미터를 작게 조정한다. 이것은 모멘텀과 유사한 역할을 하여 학습 속도를 향상시킨다. 제안된 방법의 검증을 위한 실험으로는 iris 분류 문제와 wine 분류 문제를 사용하였다. 제안된 방법은 iris 분류 문제에서는 67% 학습에서, wine 분류 문제에서는 78% 학습에서 학습 속도가 향상되었으며 기존 방법과 비교하여 오차의 진동도 적은 것을 확인할 수 있었다.