• 제목/요약/키워드: Character Feature Extraction

검색결과 120건 처리시간 0.023초

초등학생과 외국인을 위한 한글 문자 익히기 시스템의 개발 (A Development of Hanguel Learning System for Elementary School Students and Foreigners)

  • 조동욱
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권3호
    • /
    • pp.285-296
    • /
    • 2001
  • 본 논문에서는 초등학교 학생이나 외국인을 위해 한글을 익히는 교육용 시스템을 개발하고자 한다. 모델이 될 수 있는 표준 문자 패턴을 선정하고 이의 특징을 추출하여 데이터베이스화한다. 이를 위해 환경에 불변인 전처리과정의 수행과 특징 추출 그리고 유사도 함수를 정의한다. 최종적으로 초등학생이나 외국인이 쓴 문자에 대해 표준 문자 패턴과의 유사도를 계산하여 필기체 문자의 미적 평가를 행한다. 본 시스템은 특정 서체에 대해서도 표준 문자 패턴을 선정하여 서체 익히기까지 행할 수 있도록 확정이 가능한 시스템이며 실험에 의해 본 논문의 유용성을 입증하고자 한다.

  • PDF

The Centering of the Invariant Feature for the Unfocused Input Character using a Spherical Domain System

  • Seo, Choon-Weon
    • 조명전기설비학회논문지
    • /
    • 제29권9호
    • /
    • pp.14-22
    • /
    • 2015
  • TIn this paper, a centering method for an unfocused input character using the spherical domain system and the centering character to use the shift invariant feature for the recognition system is proposed. A system for recognition is implemented using the centroid method with coordinate average values, and the results of an above 78.14% average differential ratio for the character features were obtained. It is possible to extract the shift invariant feature using spherical transformation similar to the human eyeball. The proposed method, which is feature extraction using spherical coordinate transform and transformed extracted data, makes it possible to move the character to the center position of the input plane. Both digital and optical technologies are mixed using a spherical coordinate similar to the 3 dimensional human eyeball for the 2 dimensional plane format. In this paper, a centering character feature using the spherical domain is proposed for character recognition, and possibilities for the recognized possible character shape as well as calculating the differential ratio of the centered character using a centroid method are suggested.

형태학적 크기 분포 함수를 이용한 자동차 번호판 인식 (License Plate Recognition Using The Morphological Size Distribution Functions)

  • 차상혁;김주영;고광식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.455-458
    • /
    • 2001
  • In this paper, a new license plate recognition method using the morphological size distribution functions and color images is proposed. The proposed method consists of two steps. The first step is license plate extraction process using the plate color and step edge information in the license plate. The second step is the extraction of character feature vectors using the morphological size distribution functions and character recognition process using the MLP(multilayer perceptron). By the use of morphological size distributions functions, the error that may occur during the character region extraction process is lessened and the recognition performances are improved by the decrease of feature vector dimension.

  • PDF

A Study on the Fractal Attractor Creation and Analysis of the Printed Korean Characters

  • Shon, Young-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제1권1호
    • /
    • pp.53-57
    • /
    • 2003
  • Chaos theory is a study researching the irregular, unpredictable behavior of deterministic and non-linear dynamical system. The interpretation using Chaos makes us evaluate characteristic existing in status space of system by tine series, so that the extraction of Chaos characteristic understanding and those characteristics enables us to do high precision interpretation. Therefore, This paper propose the new method which is adopted in extracting character features and recognizing characters using the Chaos Theory. Firstly, it gets features of mesh feature, projection feature and cross distance feature from input character images. And their feature is converted into time series data. Then using the modified Henon system suggested in this paper, it gets last features of character image after calculating Box-counting dimension, Natural Measure, information bit and information dimension which are meant fractal dimension. Finally, character recognition is performed by statistically finding out the each information bit showing the minimum difference against the normalized pattern database. An experimental result shows 99% character classification rates for 2,350 Korean characters (Hangul) using proposed method in this paper.

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.

Recognition of hand written hangeul based on the stroke order of the elementary segment

  • Song, Jeong-Young;Akizuki, Kageo;Lee, Hee-Hyol;Choi, Won-Kyu
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1994년도 Proceedings of the Korea Automatic Control Conference, 9th (KACC) ; Taejeon, Korea; 17-20 Oct. 1994
    • /
    • pp.302-306
    • /
    • 1994
  • This paper describes how to recognize hand written Hangeul character using the stroke order of the elementary segment. The recognition system is constructed of parts : character input part, segment disassembling part, character element extraction part and character recognition part. The character input part reads the character and performs thinning algorithm. In the segment disassembling part, the input character is disassembled into elementary segments using the direction codes and the feature parameters. In the character element extraction part, we extract the character element using the stroke order and the knowledge rule. Finally, we able to recognize the hand written Hangeul characters by assembling the character elements, in the character recognition part.

  • PDF

뉴스 비디오 자막 추출 및 인식 기법에 관한 연구 (Study on News Video Character Extraction and Recognition)

  • 김종열;김성섭;문영식
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.10-19
    • /
    • 2003
  • 비디오 영상에 포함되어 있는 자막은 비디오의 내용을 함축적으로 표현하고 있기 때문에 비디오 색인 및 검색에 중요하게 사용될 수 시다. 본 논문에서는 뉴스 비디오로부터 폰트, 색상, 자막의 크기 등과 같은 사전 지식 없이도 자막을 효율적으로 추출하여 인식하는 방법을 제안한다. 문자 영역의 추출과정에서 문자영역은 뉴스 비디오의 여러 프레임에 걸쳐나 나오기 때문에 인길 프레임의 차영상을 통해서 동일한 자막 영역이 존재하는 프레임을 자동적으로 추출한 후, 이들의 시간적 평균영상을 만들어 인식에 사용함으로써 인식률을 향상한다. 또한, 평균 영상의 외각선 영상을 수평, 수직방향으로 투영한 값을 통해 문자 영역을 찾아 Region filling, K-means clustering을 적용하여 배경들을 완벽하게 제거함으로써 최종적인 자막 영상을 추출한다. 자막 인식과정에서는 문사 영역 추출과정에서 추출된 글자영상을 사용하여 white run, zero-one transition과 같은 비교적 간단한 특징 값을 추출하여 이를 비교함으로써 인식과정을 수행한다. 제한된 방법을 다양한 뉴스 비디오에 적용하여 문자영역 추출 능력과 인식률을 측정한 결과 우수함을 확인하였다.

특징 영역 기반의 자동차 번호판 인식 시스템 (Feature Area-based Vehicle Plate Recognition System(VPRS))

  • 조보호;정성환
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1686-1692
    • /
    • 1999
  • 본 논문은 특징 영역 기반의 자동차 번호판 인식 시스템(VPRS : Vehicle Plate Recognition System)에 대한 연구이다. 자동차영상에서 번호판을 추출하기 위해 명암도 변화를 이용하였고, 추출된 번호판에서 문자를 포함하는 특징 영역을 추출하기 위해 히스토그램 기법과 번호판 문자의 상대적인 위치 정보를 이용하였다. 이렇게 추출된 특징 영역을 ART2 신경회로망의 입력 벡터로 사용하여 인식하였다. 제안한 방법은 기존의 문자 인식을 위한 전처리 과정을 간소화 할 수 있었고, 이치화 과정에서의 원 화상의 왜곡과 노이즈 발생 문제를 해결할 수 있었으며, 또한 기존의 이치화 방법으로 문자 추출이 어려운 번호판에 대해서도 효과적으로 문자영역을 추출하여 인식할 수 있었다.

  • PDF

자소 접촉특성 분석에 의한 한글패턴의 부분분리 및 인식 (Separation of Subpatern and Recognition of Hanguel Patterns by Analysis of Feature of Contacting Phonemes)

  • 고찬;진용옥
    • 한국통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.618-627
    • /
    • 1990
  • 본 논문은 한글문자 인식을 위하여 새로운 접촉소자의 분리 및 자획연결 특징추출 알고리즘을 제안하였다. 자소 접촉특징을 분석하여 자소접촉 형태별로 분류하고 자획연결특징 추출, 접촉자소의 분리, 문자형식 분류를 시행한다. 분리된 자소로부터 설정된 표준패턴으로 정규화하고 자소별 굴곡특징의 상대위치값으로 부터의 특징을 입력패턴으로 신경망을 이용하여 인식 실험을 하였다. 여기에서의 학습은 BEP 알고리즘을 이용하였다. 접촉자소의 분리, 형식분리, 자획연결특징 추출 및 인식 실험에서 제안된 알고리즘이 좋은 결과를 나타내었다.

  • PDF