• Title/Summary/Keyword: Digit recognition

Search Result 202, Processing Time 0.023 seconds

Speaker-Independent Korean Digit Recognition Using HCNN with Weighted Distance Measure (가중 거리 개념이 도입된 HCNN을 이용한 화자 독립 숫자음 인식에 관한 연구)

  • 김도석;이수영
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.10
    • /
    • pp.1422-1432
    • /
    • 1993
  • Nonlinear mapping function of the HCNN( Hidden Control Neural Network ) can change over time to model the temporal variability of a speech signal by combining the nonlinear prediction of conventional neural networks with the segmentation capability of HMM. We have two things in this paper. first, we showed that the performance of the HCNN is better than that of HMM. Second, the HCNN with its prediction error measure given by weighted distance is proposed to use suitable distance measure for the HCNN, and then we showed that the superiority of the proposed system for speaker-independent speech recognition tasks. Weighted distance considers the differences between the variances of each component of the feature vector extraced from the speech data. Speaker-independent Korean digit recognition experiment showed that the recognition rate of 95%was obtained for the HCNN with Euclidean distance. This result is 1.28% higher than HMM, and shows that the HCNN which models the dynamical system is superior to HMM which is based on the statistical restrictions. And we obtained 97.35% for the HCNN with weighted distance, which is 2.35% better than the HCNN with Euclidean distance. The reason why the HCNN with weighted distance shows better performance is as follows : it reduces the variations of the recognition error rate over different speakers by increasing the recognition rate for the speakers who have many misclassified utterances. So we can conclude that the HCNN with weighted distance is more suit-able for speaker-independent speech recognition tasks.

  • PDF

Automatic Recognition of Bank Security Card Using Smart Phone (스마트폰을 이용한 은행 보안카드 자동 인식)

  • Kim, Jin-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.12
    • /
    • pp.19-26
    • /
    • 2016
  • Among the various services for mobile banking, user authentication method using bank security card is still very useful. We can use mobile banking easily and safely in case of saving encoded security codes in smart phone and entering codes automatically whenever user authentication is required without bank security card. In this paper automatic recognition algorithm of security codes of bank security card is proposed in oder to enroll the encoded security codes into smart phone using smart phone camera. Advanced adaptive binarization is used for extracting digit segments from various background image pattern and adaptive 2-dimensional layout analysis method is developed for segmentation and recognition of damaged or touched digits. Experimental results of proposed algorithm using Android and iPhone, show excellent security code recognition results.

Early Processings for an Improvement in Handwritten Digit String Recognition (필기 숫자열 인식률 향상을 위한 초기 처리에 관한 연구)

  • 윤성수;변영철;김경환;최영우;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.455-457
    • /
    • 1999
  • 필기 숫자열의 인식성능을 향상시키기 위해서는 물론 인식기 자체의 성능 개선도 필요하지만 인식기에서 필요로 하는 정보를 제공해주는 초기단계의 개선 역시 매우 중요하다. 낱자와는 달리 숫자열 인식에서는 인식기에서 필요한 단위로 입력 데이터를 분할해야만 하는데 잡영, 기울어짐, 접촉 등의 원인에 의해서 쉽게 분할해내기 어렵기 때문이다. 본 논문에서는 이런 문제점들을 극복하기 위한 방법들은 제시하였으며 NIST 숫자열 데이터에 적용해 본 결과 16%의 성능 향상을 보였다.

  • PDF

An Improved Digit Recognition using Normalized mel-cepstrum (정규화된 Mel-cepstrum을 이용한 숫자음 인식성능 향상에 관한 연구)

  • 이기철
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.403-406
    • /
    • 1994
  • 음성은 화자의 상태 및 주변 환경에 따라 그 특징이 다양하게 변화한다. 본 논문에서는 음성신호의 특징 파라미터로 널리 쓰이고 있는 mel-cepstrum에 대해, 단어내에서의 변화를 정규화함으로써 인식성능을 향상시키고자 하였다. mel-cepstrum이란 단어 전체에 대한 mel-cepstrum의 평균 값으로 normalize 시킨 것이다. 한국어 숫자음에 대한 인식 실험결과, 본 논문에서 제안한 정규화된 mel-cepstrum이 정규화되지 않은 mel-cepstrum에 비해 우수한 인식 성능을 나타내었다. 또한 잡음 환경하에서 비교 실험한 결과에서도 상대적으로 우수한 인식률을 보였다.

  • PDF

Handwritten Digit Recognition with Softcomputing Techniques

  • Cho, Sung-Bae
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.06a
    • /
    • pp.707-712
    • /
    • 1998
  • This paper presents several softcomputing techniques such as neural networks, fuzzy logic and genetic algorithms : Neural networks as brain metaphor provide fundamental structure, fuzzy logic gives a possibility to utilize top-down knowledge from designer, and genetic algorithms as evolution metaphor determine several system parameters with the process of bottom up development. With these techniques, we develop a pattern recognizer which consists of multiple neural networks aggregated by fuzzy integral in which genetic algorithms determine the fuzzy density values. The experimental results with the problem of recognizing totally unconstrained handwritten numeral show that the performance of the proposed method is superior to that of conventional methods.

  • PDF

On the Noise Robustness of Multilayer Perceptrons (다층퍼셉트론의 잡음 강건성)

  • 오상훈
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.11a
    • /
    • pp.213-217
    • /
    • 2003
  • In this paper, we analysize the noise robustness of MLPs(Multilayer perceptrons). Also, as a preprocessing stage of MLPs to improve noise robustness, we consider the ICA(independent component analysis) and PCA(principle component analysis). After analyzing the noise redunction effect using PCA or ICA, we verify the noise robustness of MLPs through handwritten-digit recognition simulations.

  • PDF

Performance Improvement of korean Connected Digit Recognition Based on Acoustic Parameters (음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선)

  • Kim Seunghi;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.44-47
    • /
    • 1999
  • 본 논문에서는 한국어 연결숫자인식에 있어서 모델간의 변별력 향상을 통해 인식률을 높이기 위하여 음향학적 파라메터(Acousticparameter)를 사용하는 짓을 제안한다. 제안된 방법은 음성학적 지식에 근거하여 적절한 주파수 대역별 에너지의 비의 로그값을 추가적인 특징파라메터로 사용한다. 실험결과, 제안된 방법을 사용함으로써 기본 인식시스템에 비해 오류율이 최고 $46\%$ 정도 감소됨을 확인할 수 있었다. 그리고 채널보상 기술을 함께 적용함으로써 $69\%$ 정도의 오류율 감소를 얻었다.

  • PDF

Machine-printed Digit Recognition using Weighted Template Matching (가중 템플릿 정합을 이용한 인쇄체 아라비아 숫자 인식)

  • Jung Minchul
    • Proceedings of the KAIS Fall Conference
    • /
    • 2005.05a
    • /
    • pp.180-183
    • /
    • 2005
  • 본 논문에서는 인쇄체 아라비아 숫자를 인식하기 위해 가중 템플릿 정합 방법을 제안한다. 가중 템플릿 정합은 패턴의 특징이 나타나는 영역에 해밍거리(Hamming Distance) 의 가중치를 두어 패턴 특징을 강조하여 숫자 패턴의 인식률을 높이는 것이다. 또한 패턴의 표면을 울퉁불퉁한 영상으로 만드는 한 두 픽셀의 랜덤 노이즈를 제거하기 위하여 본 연구에서는 트리밍(trimming) 기법을 적용하였다. 실험에서는 트리밍을 하지 않고 단순 템플릿 정합을 사용했을 때의 혼돈 행렬(confusion matrix)과 트리밍을 한 후 가중 템플릿 정합을 사용했을 때 혼돈 행렬을 서로 비교해 인식률이 크게 향상된 것을 보인다.

  • PDF

A Study on the Feature Extraction for the Segmentation of Korean Speech (한국어 음성 분할을 위한 특징 검출에 관한 연구)

  • Lee, Geuk;Hwang, Hee-Yeung
    • Proceedings of the KIEE Conference
    • /
    • 1987.11a
    • /
    • pp.338-340
    • /
    • 1987
  • The speech recognition system usually consists of two modules, segmentation module and identification module. So, the performance of the system heavily depends on the segmentation accuracy and the segmentation unit. This paper is concerned with the agreeable features for segmentation in syllables. Total energy and two band width energy. (LE:4000-5000Hz and HE:900-3100Hz) are suitable cues for segmentation. And we testify it through the experiment using connected digit.

  • PDF

Off-line Handwritten Digit Recognition Using Combination of stroke direction codes (획의 방향 코드 조합에 의한 오프라인 필기체 숫자 인식)

  • 이찬희;이상훈;장수미;정순호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.610-612
    • /
    • 2002
  • 본 논문은 오프라인 필기체 숫자 인식을 위하여 SOG* 세선화와 방향 코드 생성만으로 전처리를 단순화하여 효율을 높이는 새로운 방법을 제안한다. 본 실험의 객관적 검증을 위해 Concordia 대학교 등의 여러기관의 필기체 숫자 데이터베이스에 대하여 실험한 결과 98.85% 이상의 인식률을 나타내어 단순한 전처리로 높은 인식률을 얻음으로써 효율성이 높음을 알 수 있다.

  • PDF