• 제목/요약/키워드: Character Feature Extraction

검색결과 119건 처리시간 0.028초

Recognition of English Calling Cards by Using Projection Method and Enhanced RBE Network

  • Kim, Kwang-Baek
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.474-479
    • /
    • 2003
  • In this paper, we proposed the novel method for the recognition of English calling cards by using the projection method and the enhanced RBF (Radial Basis Function) network. The recognition of calling cards consists of the extraction phase of character areas and the recognition phase of extracted characters. In the extraction phase, first of all, noises are removed from the images of calling cards, and the feature areas including character strings are separated from the calling card images by using the horizontal smearing method and the 8-directional contour tracking method. And using the image projection method, the feature areas are split into the areas of individual characters. We also proposed the enhanced RBF network that organizes the middle layer effectively by using the enhanced ART1 neural network adjusting the vigilance threshold dynamically according to the homogeneity between patterns. In the recognition phase, the proposed neural network is applied to recognize individual characters. Our experiment result showed that the proposed recognition algorithm has higher success rate of recognition and faster learning time than the existing neural network based recognition.

Mellin 변환 방식과 BPEJTC를 이용한 영상 문자 인식 (Image Character Recognition using the Mellin Transform and BPEJTC)

  • 서춘원;고성원;이병선
    • 조명전기설비학회논문지
    • /
    • 제17권4호
    • /
    • pp.26-35
    • /
    • 2003
  • 자연계에서 다양한 형태로 입력되는 물체 영상을 효과적으로 인식하려면, 물체의 위치, 회전, 크기 변화에 관계없이 인식할 수 있는 왜곡 불변 특성의 추출이 반드시 요구된다. 이러한 왜곡 불변 특성은 동일한 영상의 변화에 대하여 인식 특성이 같고, 서로 다른 영상의 변화에 대해서는 분리 식별이 용이해야 한다. 이러한 인식 특성을 얻기위해 다각도로 많은 연구가 진행되고 있으며, 특히 회전 및 크기에 불변 특성을 동시에 얻을 수 있는 Mellin변환을 이용한 방법 등이 영상 인식에 많이 이용되고 있다[1][2][3]. 따라서, 본 논문에서는 Mellin 변환 방법에 의한 크기 및 회전에 대한 불변 특성을 얻을 수 있는 문자 인식 시스템을 위한 문자 특징 추출 방법을 제시하고자 하였으며, 영문자 26 문자의 입력 영상에 대하여 무게 중심법에 의한 문자 이동과 Mellin 변환 방법에 의한 특징 추출 방법에 보간법을 이용하여 특징을 추출하였으며, 추출된 특징에 대하여 특징의 이질도를 검사하여, 각 특징의 이질도가 약 50% 이상의 결과를 얻었다. 또한, Mellin 변환 방법에 의해 추출된 특징을 기준 영상으로 하는 BPEJTC(Binary Phase Extraction Joint Transform Correlator)를 이용하여 크기, 회전 및 이동에 따른 입력 문자의 인식이 가능한 BPEJTC 시스템을 구현하였으며, 이에 따라 본 논문에서는 약 90%의 인식률을 얻을 수 있었다. 따라서 본 논문에서 제시하는 Mellin 변환 방법에 따라 추출된 문자의 특징과 BPEJTC를 이용하여 영상 문자를 인식할 수 있는 영상 문자 인식 시스템의 가능성을 제시하였다.

Text Extraction in HIS Color Space by Weighting Scheme

  • Le, Thi Khue Van;Lee, Gueesang
    • 스마트미디어저널
    • /
    • 제2권1호
    • /
    • pp.31-36
    • /
    • 2013
  • A robust and efficient text extraction is very important for an accuracy of Optical Character Recognition (OCR) systems. Natural scene images with degradations such as uneven illumination, perspective distortion, complex background and multi color text give many challenges to computer vision task, especially in text extraction. In this paper, we propose a method for extraction of the text in signboard images based on a combination of mean shift algorithm and weighting scheme of hue and saturation in HSI color space for clustering algorithm. The number of clusters is determined automatically by mean shift-based density estimation, in which local clusters are estimated by repeatedly searching for higher density points in feature vector space. Weighting scheme of hue and saturation is used for formulation a new distance measure in cylindrical coordinate for text extraction. The obtained experimental results through various natural scene images are presented to demonstrate the effectiveness of our approach.

  • PDF

문자열 검출을 위한 슬라브 영역 추정 (Slab Region Localization for Text Extraction using SIFT Features)

  • 최종현;최성후;윤종필;구근휘;김상우
    • 전기학회논문지
    • /
    • 제58권5호
    • /
    • pp.1025-1034
    • /
    • 2009
  • In steel making production line, steel slabs are given a unique identification number. This identification number, Slab management number(SMN), gives information about the use of the slab. Identification of SMN has been done by humans for several years, but this is expensive and not accurate and it has been a heavy burden on the workers. Consequently, to improve efficiency, automatic recognition system is desirable. Generally, a recognition system consists of text localization, text extraction, character segmentation, and character recognition. For exact SMN identification, all the stage of the recognition system must be successful. In particular, the text localization is great important stage and difficult to process. However, because of many text-like patterns in a complex background and high fuzziness between the slab and background, directly extracting text region is difficult to process. If the slab region including SMN can be detected precisely, text localization algorithm will be able to be developed on the more simple method and the processing time of the overall recognition system will be reduced. This paper describes about the slab region localization using SIFT(Scale Invariant Feature Transform) features in the image. First, SIFT algorithm is applied the captured background and slab image, then features of two images are matched by Nearest Neighbor(NN) algorithm. However, correct matching rate can be low when two images are matched. Thus, to remove incorrect match between the features of two images, geometric locations of the matched two feature points are used. Finally, search rectangle method is performed in correct matching features, and then the top boundary and side boundaries of the slab region are determined. For this processes, we can reduce search region for extraction of SMN from the slab image. Most cases, to extract text region, search region is heuristically fixed [1][2]. However, the proposed algorithm is more analytic than other algorithms, because the search region is not fixed and the slab region is searched in the whole image. Experimental results show that the proposed algorithm has a good performance.

Character Classification with Triangular Distribution

  • Yoo, Suk Won
    • International Journal of Advanced Culture Technology
    • /
    • 제7권2호
    • /
    • pp.209-217
    • /
    • 2019
  • Due to the development of artificial intelligence and image recognition technology that play important roles in the field of 4th industry, office automation systems and unmanned automation systems are rapidly spreading in human society. The proposed algorithm first finds the variances of the differences between the tile values constituting the learning characters and the experimental character and then recognizes the experimental character according to the distribution of the three learning characters with the smallest variances. In more detail, for 100 learning data characters and 10 experimental data characters, each character is defined as the number of black pixels belonging to 15 tile areas. For each character constituting the experimental data, the variance of the differences of the tile values of 100 learning data characters is obtained and then arranged in the ascending order. After that, three learning data characters with the minimum variance values are selected, and the final recognition result for the given experimental character is selected according to the distribution of these character types. Moreover, we compare the recognition result with the result made by a neural network of basic structure. It is confirmed that satisfactory recognition results are obtained through the processes that subdivide the learning characters and experiment characters into tile sizes and then select the recognition result using variances.

하이브리드 통계적 특징 모델과 신경망을 이용한 자동차 번호판 인식 (Recognition of License Plates Using a Hybrid Statistical Feature Model and Neural Networks)

  • 유신;정병준;강현철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1016-1023
    • /
    • 2009
  • 자동차 번호판 인식 시스템은 문자 추출, 특징 추출 등의 영상처리와 추출된 문자를 인식하는 인식기로 구성된다. 특징 추출은 문자 영역의 데이터 감소뿐만 아니라 인식 성능을 결정한다. 따라서 본 논문에서는 번호판 인식의 결과에 영향이 큰 숫자 인식, 특히 숫자의 특징 추출에 초점을 두었으며, 데이터의 군집성을 재배치하여 데이터 간의 최적의 산란도를 확보할 수 있는 통계적 특징의 혼합 모델을 제안하고, 이를 다층 퍼셉트론과 LVQ 신경망을 이용하여 유효성을 검증하였다. 제안된 통계적 특징 추출 방법은 번호판 영상이 갖는 정보를 가장 잘 유지하고, 잡음과 외부 환경에 강건하며 효과적인 방법임을 보여준다.

필기체 한글 문자 인식을 위한 획 추출에 관한 연구 (A Study on Stroke Extraction for Handwritten Korean Character Recognition)

  • 최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.375-382
    • /
    • 2002
  • 필기체 문자 인식은 온라인 필기체 문자 인식과 오프라인 필기체 문자 인식으로 나누어진다. 온라인 필기체 문자 인식은 타블렛과 같은 펜 기반의 전자식 입력 장치를 이용하여 필기의 순서와 획의 위치와 같은 동적인 필기 정보를 문자의 입력 시 획득할 수 있어 오프라인 필기체 문자 인식에 비해 큰 연구 성과를 이루었다. 그러나 오프라인 필기체 문자 인식은 온라인 필기체 문자 인식에서와 같이 동적인 정보를 입력받을 수 없고, 다양한 필기와 자소의 겹침이 심하며 획 사이의 잡영을 많이 가지고 있어 인식의 전처리 결과에 따라 인식 성능이 크게 달라진다. 본 논문에서는 오프라인 필기체 한글 문자 인식을 위해 문자의 동적인 정보를 포함하는 획을 효과적으로 추출하는 방법을 제안한다. 제안된 방법은 전처리 과정으로 먼저 Watershed 알고리즘을 이용하여 입력된 필기체 문자 영상의 향상 및 이진화를 수행한다. 이진화된 문자부를 변형된 Lu와 Wang의 세선화 알고리즘을 사용하여 세선화를 수행한 후 문자에서의 특징점을 추출하여 세그먼트 화소열을 추출하고, 최대 허용 오차법을 이용하여 벡터화한다. 벡터화의 수행으로 몇 개의 획이 하나의 세그먼트로 묶인 경우, 하나의 세그먼트 화소열은 2 또는 그 이상의 세그먼트 벡터로 분리된다. 추출된 세그먼트 벡터들을 완전한 획으로 재구성하기 위해서 오른손 필기 좌표계 시스템을 이용하여 벡터의 방향적인 성분을 인간의 필기 획의 방향에 알맞게 수정하고, 수정된 세그먼트 벡터의 방향성과 분기 정보를 이용하여 인접한 결합 가능한 세그먼트 벡터를 결합함으로써 문자 인식에 적합한 완전한 획으로 재구성한다. 실험 결과 제안된 방법이 필기체 한글 문자 인식에 적합함을 알 수 있었다.

인간의 정보처리 방법에 기반한 특징추출 및 필기체 문자인식에의 응용 (Feature extraction motivated by human information processing method and application to handwritter character recognition)

  • 윤성수;변혜란;이일병
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.1-11
    • /
    • 1998
  • 본 논문에서는 인간의 정보처리 과정에 관한 심리학적 실험에 바탕을 두고 인간이 사용하고 있는 것으로 생각되는 특징을 이용하여 이를 문자 인식에 적용하였다. 인간의 경우 화소단위의 정보뿐만 아니라 일정지역의 정보를 함께 처리하는 경향이 있다. 그러므로 일정지역에 대한 정보를 표시하는 영역 특징을 정의하고 정의된 이 영역 특징과 기존의 화소단위 특징들을 결합하였다. 사용한 특징으로는 영역 특징에 기반 한 초등 적 분석결과, 영역특징을 포함한 망 특징, 교차거리와 특징 그리고 기울기 특징들이다. 성능 평가 실험은 필기 한글자모, 숫자 그리고 대소영문자를 대상으로 하였으며, 인식기는 역전과 학습 방법을 이용한 신경망 인식기를 사용하였다. 각각의 인식 결과는 90.27∼93.25%, 98.00% 그리고 79.73∼85.75였다. 영역 특징과 유사한 UDLRH 특징을 대상으로 비교한 결과 전체적으로 1∼2% 정도 인식률 향상이 있었으며 인간이 판단하기에 보다 납득하기 쉬운 오 인식 성향을 보였다.

  • PDF

이웃 각도 히스토그램 및 변형된 하우스도르프 거리를 이용한 'ㅁ', 'ㅇ' 자소 인식 (The Recognition of Grapheme 'ㅁ', 'ㅇ' Using Neighbor Angle Histogram and Modified Hausdorff Distance)

  • 장원두;김하영;차의영;김도현
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.181-191
    • /
    • 2005
  • 한글 문자 인식에 있어서 ' ㅁ '과 ' ㅇ '의 오인식은 전반적인 인석성능의 저하를 가져오는 요소가 되고 있으나 이에 대한 연구가 미흡한 실정이다. 따라서, 본 논문에서는 'ㅁ'과 'ㅇ'을 효과적으로 인식하기 위한 새로운 특징 추출 방법을 제안하였다. 제안하는 방법은 변형된 하우스도르프 거리를 이용한 최적의 이웃 반경을 설정하고, 이 반경에 의해 이웃 픽셀과의 각도를 추출하여 두 자소를 구분하는 특징으로 사용하였다 실험을 통하여 분석한 결과 제안하는 특징 추출 방법은 기존의 방법들보다 적은 특징 개수를 사용하여 효율적으로 패턴을 인식할 수 있었으며 우수한 일반성 및 안정성을 나타내었다.

  • PDF

방향성분 특징과 Fisher Measure를 이용한 간판영상 한글인식 (Recognition of Korean Text in Outdoor Signboard Images Using Directional Feature and Fisher Measure)

  • 임준식;김수형;이귀상;양형정;이명은
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.239-246
    • /
    • 2009
  • 본 논문은 모바일 폰 기반의 간판 영상내 한글 문자인식에 관한 연구로써 인식 대상은 간판영상에서 추출된 상호명으로 하였고 인식대상 문자 수는 상호명 빈도수 기반 808자로 한정하였다. 인식과정은 특징 추출, 대분류, 상세 분류로 구성되고 특징 추출과정에서는 문자영상의 크기, 잡음 및 왜곡에 강건한 비선형 방향성분 특징을 이용하였고 대분류 과정에서는 추출된 특징과 인식 대상문자에 대하여 최소거리 분류를 수행하고 10순위까지의 후보 문자를 추출하였다. 상세 분류 과정에서는 Fisher discriminant measure 이용하여 대분류에서 발생 할 수 있는 오인 식 결과를 보완하였다. 실험결과 1순위 인식률은 80.45%이고 5순위까지의 누적 인식률은 93.51%를 보였다.