• Title/Summary/Keyword: 숫자 인식

Search Result 580, Processing Time 0.034 seconds

De-Noising and Contour Preserving Digit Enhancement for Meter Digit Recognition (계량기 숫자 인식을 위한 잡영 제거 및 윤곽보존 숫자강화)

  • Yi, Eun-Gyoo;Ko, Jae-Pil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.515-520
    • /
    • 2006
  • 계량기 숫자 인식은 일반적으로 사용되고 있는 아날로그 계량기에 카메라를 부착하여, 검침 시 숫자 계기판 영상을 전송받고, 그 영상으로부터 숫자를 추출 및 인식하는 기술이다. 계량기 숫자 인식에서는 카메라의 설치 상태 및 기타 환경적인 요인들로 인해 숫자 계기판 영상의 일관성 있는 취득이 어렵게 된다. 본 논문에서는 숫자 인식에 악영향을 미치는, 취득 영상의 상태 변화를 보정해주기 위해 잡영 제거 및 윤곽보존 숫자강화를 제안하였다. 잡영 제거를 위해 잡영을 분포 위치에 따라서 세 가지 타입으로 나누었으며, 각 타입별로 잡영 제거를 하였다. 윤곽보존 숫자강화 과정에서는 일반적인 이진화 기법이 가지는 테두리 정보손실을 최소화할 수 있도록, 숫자 테두리의 명도를 보존하면서 숫자 중심부분의 밝기를 강화시켰다. 전처리 전/후의 인식률 비교 실험을 위해 SVM(Support Vector Machines)을 사용하였으며, 학습 데이터 1,409장과 조명 상태를 달리하여 취득한 1,782의 테스트 데이터를 실험 데이터로 사용하였다. 실험 결과, 81.09%라는 성능 향상을 확인하였으며 이는 제안한 전처리 기법이 조명으로 인한 데이터의 상태 변화 문제를 해결해줌으로써 인식 성능 향상에 크게 기여한다는 것을 입증해준다.

  • PDF

A Study on the Implementation Methods of MLP Neural Networks for the Recognition of Handwritten Numerals and the Rejection of Non-Numerals (필기체 숫자의 인식과 비숫자의 기각을 위한 MLP 신경망의 구현 방법에 관한 연구)

  • Lim Kil-Taek
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.9 no.7
    • /
    • pp.1607-1615
    • /
    • 2005
  • This Paper describes the implementation methods of MLP (mulilayer perceptrons) neural networks to recognize or reject handwritten numerals and non-nummerals. The MLP has known to be a very efficient classifier to recognize handwritten numerals in terms of recognition accuracy, speed, and memory requirements. In the previous researches, however, researchers have focused on the only numeral inputs and have not payed attention to the non-numeral inputs with respect to recognition accuracy, rejection rates, and other characteristics. In this paper, we present some implementation methods of the MLP in the environments that numeral and non-numerals are mixed. The MLPs have been developed by three methods, and investigated with three error types introduced. The experiments have been conducted on a total of 66,701 images of numerals and non-numerals. The promising method to recognize numerals and reject non-numerals has been described in terms of the three error types.

Segmentation and Recognition Methods for Touching Handwritten Digit String (접촉된 숫자열의 분할 및 인식 기법)

  • 송성일;김황수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문은 숫자간 접촉이 포함된 무제약 오프라인 필기 숫자열 인식을 위한 분할 및 인식기법을 소개하고자 한다. 시스템은 숫자열에서 접촉된 성분을 추출하는 모듈, 접촉된 숫자를 분할하는 모듈과 최종적으로 분할된 결과를 조합하는 모듈로 이루어진다. 그리고, 위의 기법을 NIST 데이터에 적용하여 제안한 분할 및 인식기법의 효율성을 보여준다.

  • PDF

Extension of K-L Dynamic Parameter for Connected Digit Recognition (숫자음 인식을 위한 K-L 동적 특징파라미터의 확장)

  • 김주곤
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.257-261
    • /
    • 1998
  • 일반적으로 인식률이 저조한 연속 숫자음의 인식 정도 향상을 위해서 K-L 동적특징의 확장에 대해서 검토한다. 이 검토결과를 4연속 숫자음을 대상으로 하는 인식 실험을 수행하여 숫자음 인식에 있어서 확장된 K-L 동적특징의 유효성을 확인하고자 한다. 이를 위하여 음성자료는 국어공학센터에서 채록한 4연속 숫자음을 사용하며, 확장한 K-L 동적특징의 유효성을 확인하기 위해서는 단일 특징 파라미터로서 멜-켑스트럼과 회귀계수, K-L 동적계수 등과 이들 특징 파라미터를 결합한 경우에 대해서 특징파라미터를 확장하여 K-L 동적 특징을 추출하고, 4연속 숫자음인식 실험을 수행하였다. 이때 인식의 기본 단위로는 48개의 유사음소단위를 음소모델로 사용하였으며, 인식실험에 있어서는 유한 상태 오토마타에 의한 구문제어를 통한 OPDP 법을 이용하였다. 인식 실험 결과, 단일 특징파라미터로서 멜-켑스트럼을 사용한 경우 67.5%, 이를 확장한 K-L 동적계수를 사용한 경우 78.2%를 보였다. 또한 결합한 특징파라미터에 있어서는 멜-켑스트럼과 희귀계수를 사용한 경우 78.4%의 인식률을 보였으며, 이를 K-L 동적계수로 확장한 경우 82.3%의 인식률을 얻어 확장한 K-L 동적특징파라미터의 유효성을 확인하였다.

  • PDF

A Study on Continuous Digits Speech Recognition using Probabilistic Models (확률적 모델을 이용한 연속 숫자음 인식에 관한 연구)

  • Lee Ju-Sung;Lee Seong-Kwon;Kim Soon-Hyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.109-112
    • /
    • 1999
  • 본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 한국어 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 연속 숫자음의 인식을 위하여 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고, 음절 단위로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 숫자음의 알 뒤 연음현상을 고려하여 작성한 21 종류의 7자리 숫자음과 이를 음절 단위로 세그먼트한 숫자음을 DB로 사용하여 적응화를 수행하였다. 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다.

  • PDF

Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles (한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상)

  • 송명규;김형순
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.4
    • /
    • pp.401-406
    • /
    • 2002
  • Each Korean digit is composed of only a syllable, so recognizers as well as Korean often have difficulty in recognizing it. When digit strings are pronounced, the original pronunciation of each digit is largely changed due to the co-articulation effect. In addition to these problems, the distortion caused by various channels and noises degrades the recognition performance of Korean connected digit string. This paper dealt with some techniques to improve recognition performance of it, which include defining a set of PLUs by considering phonemic variations in Korean digit and constructing a recognizer to handle speakers various speaking styles. In the speaker-independent connected digit recognition experiments using telephone speech, the proposed techniques with 1-Gaussian/state gave string accuracy of 83.2%, i. e., 7.2% error rate reduction relative to baseline system. With 11-Gaussians/state, we achieved the highest string accuracy of 91.8%, i. e., 4.7% error rate reduction.

A Study of Telephone Digit Recognition Using CHMM (CHMM을 이용한 전화번호 인식에 관한 연구)

  • 이성권
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.31-34
    • /
    • 1998
  • 본 연구는 음소 단위의 CHMM을 이용한 연속어 숫자음 인식에 관한 내용이다. ETRI 445 데이터를 사용하여 초기의 모델은 ML 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 또한 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고 음절 다누이로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 적응화 학습에 있어서 숫자음의 앞 뒤 모든 경우를 고려하여 작성한 21 종류의 7자리 전화번호 숫자음 DB로 사용하였고 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다. 그 결과 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 또한 후처리를 두어 연음 현상으로 인한 오인식의 경우에 대해서도 약 2%의 인식률의 증가를 보여주었다.

  • PDF

Development of Continuous Spoken Digit Recognition System using Statistical Model (통계적 모델에 의한 연속 숫자음의 인식 기술개발)

  • Lee, G.S.;Ann, T.O.;Kim, S.H.
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.154-158
    • /
    • 1989
  • 본 연구는 통제적 모델에 의한 연속 숫자음의 인식에 관한 것으로 4 연속 숫자음을 인식 대상으로하여 실험한다. 시스템은 크게 음향 음성 처리부 및 어휘 해석부 두 부분으로 나뉜다. 음향 음성 처리부에서는 입력 음성으로부터 특정 벡터인 12차의 LPC cepstrum 계수를 구하여, 프레임 레이블링과 소음소 레이블링 (phone labelling)을 한다. 프레임 레이블링인 베이스 분류법을 이용하였으며, 소음소 레이블링은 프레임 레이블과 사후확률 (posteriori probability)로 부터 이루어 졌다. 어휘 해석부분에서는 소음소 단위를 입력으로 받아 음운규칙을 통해 작성된 소음소 망을 거쳐 연속 숫자음 출력을 얻도록 했다. 본실험은 화자 3 명이 발음한 35 개의 4 연속 숫자음을 인식 대상으로 하였으며, 4 연속 숫자음을 평가단위로 80%의 인식율을 얻었고, 각 숫자음의 음절을 단위로 95%의 인식율을 얻어 제시한 알고리즘의 유효성을 입증하였다.

  • PDF

On-line Handwritten Numeral Recognition based on Table Top Display (테이블 탑 디스플레이 기반의 온라인 필기 숫자 인식)

  • Kim, Eui-Chul;Kim, Ji-Woong;Kim, Soo-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.9-12
    • /
    • 2007
  • 테이블 탑 디스플레이는 사람에게 친숙한 상호작용의 매개체인 손을 입력장치로 이용하는 일종의 탁자형 멀티 터치스크린이라고 할 수 있다. 본 논문에서는 이러한 환경에서 손가락 제스쳐를 활용하여 필기 숫자를 인식하는 연구를 수행함으로써 테이블 탑 디스플레이에 적합한 필기 숫자 인식 기술을 개발하였고, 이로 인해 추후 진행될 연속 숫자 혹은 특수기호의 성공적인 인식 가능성을 확인하였다. 실험 과정은 테이블 탑 디스플레이의 표면을 통해 입력된 손가락 궤적을 잡음제거, 대표점 추출등의 전처리 과정을 거쳐 16-방향 체인코드로 변환하고, 변환된 체인코드의 학습 및 필기 숫자 인식에 확률 통계적 모델인 은닉 마르코프 모델을 이용하였다. 학습에는 총 300개 필기 숫자 데이터를 이용하였고, 인식 실험에 사용한 별도의 100개의 필기 숫자 데이터에 대해 97%의 정인식율을 보였다.

Recognition of numeral stings with broken digits (획의 일부분이 손상된 숫자가 포함된 필기체 숫자 열의 인식)

  • Kim, Kye-Kyung;Kim, Jin-Ho;Cho, Soo-Hyun;Chi, Soo-Young;Chung, Yun-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.503-506
    • /
    • 2001
  • 본 논문에서는 획의 일부분이 손상된 숫자(broken digit)나 붙은 숫자(touching digits)와 같은 비정형 숫자들이 포함된 필기체 숫자 열을 인식할 수 있는 방법에 대하여 제안하였다. 비정형 숫자들은 분류(pre-segmentation) 단계에서 숫자들의 구조적인 특징 정보를 이용하여 정형인 개별 숫자(isolated digit)로부터 획의 일부분이 손상된 숫자 또는 붙은 숫자들로 분류된다. 획의 일부분이 분리된 숫자의 결합 및 붙은 숫자들의 분할 단계를 거쳐 인식을 시도하였다. 제안된 방법의 타당성을 증명하기 위하여 NIST SDl9 데이터베이스를 이용하여 시뮬레이션 해 보았다.

  • PDF