• 제목/요약/키워드: Digit recognition

검색결과 202건 처리시간 0.026초

한국어 연결숫자 인식에서의 발화 검증과 대체오류 수정 (Utterance Verification and Substitution Error Correction In Korean Connected Digit Recognition)

  • 정두경;송화전;정호영;김형순
    • 대한음성학회지:말소리
    • /
    • 제45호
    • /
    • pp.79-91
    • /
    • 2003
  • Utterance verification aims at rejecting both out-of-vocabulary (OOV) utterances and low-confidence-scored in-vocabulary (IV) utterances. For utterance verification on Korean connected digit recognition task, we investigate several methods to construct filler and anti-digit models. In particular, we propose a substitution error correction method based on 2-best decoding results. In this method, when 1st candidate is rejected, 2nd candidate is selected if it is accepted by a specific hypothesis test, instead of simply rejecting the 1st one. Experimental results show that the proposed method outperforms the conventional log likelihood ratio (LLR) test method.

  • PDF

간소화된 DTW방식을 이용한 한국어 숫자음 인식기 구현에 관한 연구 (A Study on the Realization of Korean Digits Recognition System Using the Simplified DTW Method)

  • 안병수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.66-70
    • /
    • 1992
  • This paper describes the simplified DTW algorithm for real time korean digit recognition and construct the digit recognition system using that algorithm. The DTW algorithm which is used nowadays have problems on real time recognition because of its massive computation. But, simplified DTW algorithm, which is proposed in this paper, solved these problems. In the case of single syllable, we use the characteristic of uniform distribution of epansion and contraction on time ais, compare distance of input pattern and reference pattern using constrainedly restricted path. As a result, we can reduce a great deal of computation and achieved that the real time korean digit recognition system.

  • PDF

음성인식을 위한 새로운 포만트트랙킹 알고리즘의 제안과 평가 (An Proposal and Evaluation of the New formant Tracking Algorithm for Speech Recognition)

  • 송정영
    • 인터넷정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.51-59
    • /
    • 2002
  • 본 논문에서는, 음성인식을 위한 한가지 방법으로 새로운 포만트 트랙킹 알고리즘을 제안한다. 본 연구에서는 실험을 위한 인식 데이터로 한국어 숫자음성을 사용하였다. 새롭게 제안한 알고리즘을 사용하여 인식실험을 한 결과, 숫자음성 300개에 대한 인식률은 91%의 결과를 얻었다. 본 연구의 새로운 알고리즘은, 인식실험을 통하여 그 유효성이 확인되었다.

  • PDF

한국어 연결 숫자음 인식을 위한 시공간 신경회로망의 개발 (Development of Spatio-Temporal Neural Network for Connected Korean Digits Recognition)

  • 이종식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.69-72
    • /
    • 1995
  • In this paper, a new approach for Korean connected digits recognition using the spatio-temporal neural network is reported. The data of seven digits phone numbers are used in the recognition of connected words, and in the initial experiment, digit recognition rate of 28% was achieved. In this paper, to increase recognition rate, two different approaches are analyzed. In the first system, to compensate the STNN's own defect and to emphasize the Korean word's phonic characters, the starting point of phone is pointed by comparing the average magnitude and zero-crossing rate and the ending point is pointed by comparing only zero-crossing rate. The digit recoginiton rate increased to 61%. Also, in the second system, to consider fact that same word's phone is varied severally, the number of STNN's of each word is increased from one to five, and then the varied same word's phones can be included to the increased STNN's. The digit recogniton rate of connected words increased to 89%.

  • PDF

결정값 발생기를 이용한 무제약 필기체 숫자 열의 인식 (Unconstrained Handwritten Numeral Sti-ing Recognition by Using Decision Value Generator)

  • 김계경;김진호;박희주
    • 한국산업정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.82-89
    • /
    • 2001
  • 본 논문에서는 독립문자 식별기 및 인식기를 바탕으로 한 결정값 발생기를 도입하여 무제 약 필기체 숫자 열을 효과적으로 인식하는 방안을 제안하였다. 필기체 숫자 열의 인식을 위해 사전 분할 모듈, 최종 분할 모듈 그리고 인식 모듈 등의 세 개의 모듈을 설계 구현하였다. 사전 분할 모듈에서는 결정값 발생기를 이용하여 독립 숫자, 접촉 숫자 그리고 끊어진 숫자 등을 구분하였다. 최종 분할 모듈에서도 결정값 발생기의 결과를 이용하여 접촉 숫자들을 분할하는 과정을 수행하고 인식 모듈에서 각각 분할된 숫자들을 인식하였다. 분할 기반 방식과 무 분할 방식을 혼용하여 필기체 숫자열을 인식함으로서 기존의 오 인식률을 최소화시키도록 하였다. 제안된 방식을 이용하여 NIST SD19 필기체 숫자 열 데이터베이스의 인식을 한 결과 기존의 연구결과에 비해 높은 96.7%의 인식률을 얻을 수 있었다.

  • PDF

음성과 영상정보를 이용한 우리말 숫자음 인식 (Digit Recognition using Speech and Image Information)

  • 조현욱;이종혁
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.257-260
    • /
    • 2001
  • 본 논문에서는 음성에서 얻어지는 특징 파라메타와 음성을 발성할 시 얻을 수 있는 가시적 데이터에서 추출되는 파라메타를 함께 이용하여 우리말 숫자음 인식을 시도하였다. 실험에서는 음성정보만을 이용한 기존의 방법과 영상정보의 추가할 경우의 인식성능을 비교, 검토하였다. 전체에서 50%를 학습시켰을 경우 학습된 화자의 경우 100%, 학습되지 않은 경우에는 78%의 인식률을 보였다.

  • PDF

A Tow-stage Recognition Approach Based on Error Pattern Hypotheses for Connected Digit Recognition

  • Oh, Wook-Kwon;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권3E호
    • /
    • pp.31-36
    • /
    • 1996
  • In this paper, a two-stage recognition approach based on error pattern hypotheses is proposed to reduce errors of a connected digit recognizer. In the approach, a conventional recognizer is first used to produce N-best candidate strings, and then error patterns are hypothesized by examining the candidate strings. For substitution error pattern hypotheses, error-pattern-dependent classifiers having more discriminative power than the first-stage classifier are used ; and for insertion and deletion errors, word duration and energy contour information are exploited are exploited to discriminated confusing pairs. Simulation results showed that the proposed approach achieves 15% decrease in word error rate for speaker-independent Korean connected digit recognition when a hidden Markov model-based recognizer is used for the first-stage classifier.

  • PDF

템플릿 매칭을 이용한 7-세그먼트 광학 문자 인식 (7-Segment Optical Character Recognition Using Template Matching)

  • 정민철
    • 반도체디스플레이기술학회지
    • /
    • 제19권4호
    • /
    • pp.130-134
    • /
    • 2020
  • This paper proposes a new method for the digit recognition on a 7-segment display. The proposed method uses morphological processing that dilates segments of digits and connects them into strokes. The digits are extracted by connected component analysis and finally, template matching method recognizes the extracted digits. The proposed method is implemented using C language in Raspberry Pi 4 system with a camera module for a real-time image processing. Experiments were conducted by using various 7-segment LED displays and 7-segment mono LCD displays. The results show that the proposed method is successful for the digit recognition on the 7-segment displays.

채널보상기법을 사용한 전화 음성 연속숫자음의 인식 성능향상 (Performance Improvement of Connected Digit Recognition with Channel Compensation Method for Telephone speech)

  • 김민성;정성윤;손종목;배건성
    • 대한음성학회지:말소리
    • /
    • 제44호
    • /
    • pp.73-82
    • /
    • 2002
  • Channel distortion degrades the performance of speech recognizer in telephone environment. It mainly results from the bandwidth limitation and variation of transmission channel. Variation of channel characteristics is usually represented as baseline shift in the cepstrum domain. Thus undesirable effect of the channel variation can be removed by subtracting the mean from the cepstrum. In this paper, to improve the recognition performance of Korea connected digit telephone speech, channel compensation methods such as CMN (Cepstral Mean Normalization), RTCN (Real Time Cepatral Normalization), MCMN (Modified CMN) and MRTCN (Modified RTCN) are applied to the static MFCC. Both MCMN and MRTCN are obtained from the CMN and RTCN, respectively, using variance normalization in the cepstrum domain. Using HTK v3.1 system, recognition experiments are performed for Korean connected digit telephone speech database released by SITEC (Speech Information Technology & Industry Promotion Center). Experiments have shown that MRTCN gives the best result with recognition rate of 90.11% for connected digit. This corresponds to the performance improvement over MFCC alone by 1.72%, i.e, error reduction rate of 14.82%.

  • PDF

다양한 컨볼루션 신경망을 이용한 태국어 숫자 인식 (Handwriting Thai Digit Recognition Using Convolution Neural Networks)

  • ;정한민;김태홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.15-17
    • /
    • 2021
  • 필기체 인식 연구는 주로 딥러닝 기술에 초점이 맞추어져 있으며, 최근 몇 년 동안 많은 발전을 이루었다. 특히, 필기체 태국어 숫자 인식은 태국 공식 문서와 영수증과 같은 숫자 정보를 포함한 많은 분야에서 중요한 연구 분야지만, 동시에 도전적인 분야이기도 하다. 대규모 태국어 숫자 데이터 집합의 부재를 해결하기 위해, 본 연구는 자체적인 데이터 집합을 구축하고 이를 다양한 컨볼루션 신경망으로 학습시켰다. 정확도 메트릭을 이용하여 평가한 결과, 배치 정규화 기반 VGG 13이 98.29%의 가장 높은 성능을 보였다.

  • PDF