• 제목/요약/키워드: Handwritten Character Recognition

검색결과 81건 처리시간 0.035초

전처리의 고속화에 기반한 문자 인식 시스템 (Character Recognition System using Fast Preprocessing Method)

  • 공용해
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.297-307
    • /
    • 1999
  • 다량의 문자가 온라인으로 실시간 입력되는 문자인식시스템에서는 영상의 전처리가 매우 신속하게 이루어 져야 한다. 또한 크기가 작거나 잡음을 포함하는 문자 영상에 대한 기하학적 정규화나 세선화 등의 영상 변환은 원영상의 정보 유실이나 왜곡을 유발하므로 최소화되어야 한다. 이에 따라 본 연구는 원영상을 변환하지 않은 상태에서 신속하게 인식에 효과적인 특정을 구하고자 하였다. 이를 위해 인식의 관점에서 의미를 가지는 윤곽화소를 정의하고 다양한 영상의 변화를 수용하는 효과적인 특징을 윤곽화소로부터 구하였다. 필기체 자모음과 자동차 번호판 숫자 인식 실험 결과, 제안된 방법이 기존의 방법보다 인식에 보다 효과적이었으며 한번의 영상 주사로 전처리를 완료하므로 소요 시간을 크게 줄일 수 있었다.

  • PDF

온라인 연속 필기 문자의 인식을 위한 문자간 구분 및 종류의 결정에 관한 연구 (A study on character segmentation and determination of linguistic type for recognition of on-line cursive characters)

  • 박강령;전병환;김창수;김우성;김재희
    • 전자공학회논문지C
    • /
    • 제34C권7호
    • /
    • pp.61-69
    • /
    • 1997
  • With the vigorous researches in the character recognition, the need to recognize run-on multilingual handwritten characters is increasing to provide uses with more comfortable PUI(pen user interface) environments. In general, many intermediate word candidates word candidates are generated in run-on multilingual recognition because there is no information of ending position and linguistic kind of character. To remove unnecessary word candidates which are generated in run-on multilingual recognition, we classify them into two groups and select the best candidate among the word candidates in the group where the final characater is completed using 5 attributes. In this research, we propose a method in order to select the best one candidate. It is called WRM (Weighted ranking method). The weights are adaptively trained by LMS(Least mean square) learning rule. Results show that the abilities of decision makin gusing weights are much better than those not using weights.

  • PDF

A Dataset of Online Handwritten Assamese Characters

  • Baruah, Udayan;Hazarika, Shyamanta M.
    • Journal of Information Processing Systems
    • /
    • 제11권3호
    • /
    • pp.325-341
    • /
    • 2015
  • This paper describes the Tezpur University dataset of online handwritten Assamese characters. The online data acquisition process involves the capturing of data as the text is written on a digitizer with an electronic pen. A sensor picks up the pen-tip movements, as well as pen-up/pen-down switching. The dataset contains 8,235 isolated online handwritten Assamese characters. Preliminary results on the classification of online handwritten Assamese characters using the above dataset are presented in this paper. The use of the support vector machine classifier and the classification accuracy for three different feature vectors are explored in our research.

병렬성을 갖는 WLD 알고리즘을 이용한 온라인 필기체 한글, 영문자 및 숫자 패턴인식 (A Study on the On-Line Handwritten Hangeul Pattern Recognition Using WLD with Parallelish)

  • 김은원;조원경
    • 전자공학회논문지B
    • /
    • 제28B권10호
    • /
    • pp.747-754
    • /
    • 1991
  • In this paper, we studies the on-line recognition of handwritten character using WLD(weighted levenshtein distance) algorithm with parallelism. The Hangeul can be separated for unit of phonemes and the alphanumeric can be separated for unit of characters. And, we studies the parallelism and the concurrency of the WLD algorithm for realization of special-purpose processor. By the simulation result for 10, 000 characters in practical sentences, the recognition rate of strokes in obtained 96.57$\%$ and the separation rate for phonemes and characteristics is obtained 95.4$\%$.

  • PDF

웨이브릿 변환과 모멘트를 이용한 문자인식에 관한 연구 (A Study on Character Recognition using Wavelet Transformation and Moment)

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.49-57
    • /
    • 2010
  • 본 논문에서는 웨이브릿 변환을 이용한문자인식 방법 중 문자의 최소 단위인자음과 모음을 분리시켜 문자의 모멘트를 분석하여 산출되는 정보를 사전에 컴퓨터에 입력시켜 문서화된 수기 문자를 컴퓨터에 저장하고 인식시키는 방법에 접근 하였다. 연구는 획득한 문장 이미지에서 잡음을 없애고 줄 단위로 분리, 분리된 줄 단위 문장은 한 문자 단위로 다시 분리된 후 자음과 모음으로 분리 하였다. 분리된 자소는 CVIPtools를 사용하여 히스토그램 평활화와 침식 및 평균값 필터를 처리한 후 C++를 이용하여 세선화 처리하고 세선화된 자소는 팽창 및 크기 변환하여 모든 자소가 동일 굵기, 크기 이미지로 만들었다. 표준화 이미지는 이진화 이미지로 변환하여 3단계 웨이브릿 변환을 이용하여 데이터의 양을 1/64로 줄인 후 해밍거리를 조사하였다. 연구 결과 다양한 'ㄱ'상호간 및 'ㅅ'상호간의 일치도는 매우 높게 나타났고, 서로 상이한 'ㄱ'과 'ㅅ'을 비교 했을 때 상호간 일치도가 매우 낮게 나옴을 알 수 있었다. 이 연구 결과로 더 많은 수기 자소들에 대한 해밍거리조사가 이루어지면 각각의 자음과 모음의 모멘트 구분하여 수기 문자 인식에 중요한 정보를 알 수 있을 것으로 판단된다.

A Methodology for Urdu Word Segmentation using Ligature and Word Probabilities

  • Khan, Yunus;Nagar, Chetan;Kaushal, Devendra S.
    • International Journal of Ocean System Engineering
    • /
    • 제2권1호
    • /
    • pp.24-31
    • /
    • 2012
  • This paper introduce a technique for Word segmentation for the handwritten recognition of Urdu script. Word segmentation or word tokenization is a primary technique for understanding the sentences written in Urdu language. Several techniques are available for word segmentation in other languages but not much work has been done for word segmentation of Urdu Optical Character Recognition (OCR) System. A method is proposed for word segmentation in this paper. It finds the boundaries of words in a sequence of ligatures using probabilistic formulas, by utilizing the knowledge of collocation of ligatures and words in the corpus. The word identification rate using this technique is 97.10% with 66.63% unknown words identification rate.

이진 웨이브렛 변환을 이용한 신경회로망의 필기체 문자 인식 (A Neural Network Based Handwritten-Charater Recognition using Binary Wavelet Transform)

  • 이정문;유경산
    • 산업기술연구
    • /
    • 제17권
    • /
    • pp.331-338
    • /
    • 1997
  • In this paper, we propose a new neural pattern recognition from wavelet transform. We first analysis in BFT(Binary Field Transform) in character image. The proposed neural network and wavelet transform is able to improve learning time and scaling. The ability and effectiveness of identifying image using the proposed wavelet transform will be demonstrated by computer simulation.

  • PDF

Zerinke 모멘트와 신경망을 이용한 온라인 필기체 숫자 인식 (Recognition of Online Handwritten Digit using Zernike Moment and Neural Network)

  • 문원호;최연석;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.205-208
    • /
    • 2010
  • 본 논문에서는 Zernike 모멘트와 backpropagation신경망을 이용한 온라인 필기체 숫자 인식 방법을 소개한다. 마우스로 통해 입력된 숫자 정보는 전처리를 통해 시간에 순서적이고, 연속적인 좌표 정보로 변환된다. 전처리된 입력 좌표는 Zernike 모멘트(moment)와 각도 특징(angulation feature)을 이용하여 각 숫자가 가지는 고유의 특징을 만들어 낸다. 이러한 특징은 크기, 모양, 틀어진 정도에 상관없이 항상 일정한 성질을 가진다. 제안된 방법으로 추출된 특징은 패턴 구분을 위해 back propagation 신경망의 입력으로 사용된다. 본 논문은 200개의 필기체 숫자 데이터베이스를 이용하여 실험을 한 결과, 제시된 방법은 적은 학습데이터만으로 학습이 가능할 뿐만 아니라 좋은 인식률을 보여준다.

  • PDF

Smith-Waterman 정렬 알고리즘을 이용한 온라인 필기체 숫자인식 (Online Handwritten Digit Recognition by Smith-Waterman Alignment)

  • 문원호;최연석;이상걸;차의영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권9호
    • /
    • pp.27-33
    • /
    • 2011
  • 본 논문에서는 필기체 문자의 Convex-Concave한 곡선 특징을 문자로 변환하고 추출된 문자를 Smith-Waterman 정렬 알고리즘을 이용하여 온라인 필기체 숫자 인식 방법을 제안한다. 필기체 숫자 인식을 위한 입력 데이터는 시간에 순서적인 좌표로 순서화하고 전처리의 입력데이터로 적용된다. 필기자의 개성이 표현된 필기체 문자는 크기, 회전, 곡선 비율이 다양한 형태로 나타난다. 따라서 본 논문에서는 곡선의 Convex-Concave 특징을 이용하여 크기, 회전에 강인한 특징을 추출한다. 추출된 특징은 문자로 변환하고 Smith-Waterman 정렬 알고리즘의 입력데이터로 적용한다. 본 논문에서는 실시간 필기체 숫자를 대상으로 실험한 결과, 오류역전파 신경 회로망을 적용한 것과 비교하여 제안된 방법이 좋은 성능을 보였다.

신경회로망을 이용한 필기체 한글 자모음 및 숫자인식에 관한 연구 (A study on the Recognition of Hand-written Characters and Arabic numbers by Neural Networks)

  • 오동수;이은철;유재근;남문현
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 하계학술대회 논문집
    • /
    • pp.900-904
    • /
    • 1991
  • In this paper, our study for the recognition of Hand-written Korean characters, Arabic numbers and alphabets by neural netwoks. This System extracts feature of character by using the MESH feature point of handwritten character, Arabic numbers and alphabets. To reduce the input image data, features are extracted from each input images. A MLP(multi-layer perceptron) with one hidden layer was trained with a modified BEP(back error propagation) algorithm. This method extracts feature sets of the characters directly from the scanner and can enhance computation speed without using the special preprocesses such as size normalization, smoothing, and thinning.

  • PDF