• Title/Summary/Keyword: 문자인식

Search Result 1,167, Processing Time 0.024 seconds

A Study on Stroke Extraction for Handwritten Korean Character Recognition (필기체 한글 문자 인식을 위한 획 추출에 관한 연구)

  • Choi, Young-Kyoo;Rhee, Sang-Burm
    • The KIPS Transactions:PartB
    • /
    • v.9B no.3
    • /
    • pp.375-382
    • /
    • 2002
  • Handwritten character recognition is classified into on-line handwritten character recognition and off-line handwritten character recognition. On-line handwritten character recognition has made a remarkable outcome compared to off-line hacdwritten character recognition. This method can acquire the dynamic written information such as the writing order and the position of a stroke by means of pen-based electronic input device such as a tablet board. On the contrary, Any dynamic information can not be acquired in off-line handwritten character recognition since there are extreme overlapping between consonants and vowels, and heavily noisy images between strokes, which change the recognition performance with the result of the preprocessing. This paper proposes a method that effectively extracts the stroke including dynamic information of characters for off-line Korean handwritten character recognition. First of all, this method makes improvement and binarization of input handwritten character image as preprocessing procedure using watershed algorithm. The next procedure is extraction of skeleton by using the transformed Lu and Wang's thinning: algorithm, and segment pixel array is extracted by abstracting the feature point of the characters. Then, the vectorization is executed with a maximum permission error method. In the case that a few strokes are bound in a segment, a segment pixel array is divided with two or more segment vectors. In order to reconstruct the extracted segment vector with a complete stroke, the directional component of the vector is mortified by using right-hand writing coordinate system. With combination of segment vectors which are adjacent and can be combined, the reconstruction of complete stroke is made out which is suitable for character recognition. As experimentation, it is verified that the proposed method is suitable for handwritten Korean character recognition.

Post-processing of Hangul Recognition for Discriminating Pairs of Characters (유사 문자쌍을 구분하기 위한 한글 인식의 후처리)

  • Jang, Seung-Ick;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.388-393
    • /
    • 2001
  • 유사한 형태의 필기 한글 문자쌍은 한글 인식 시 발생하는 오류의 많은 부분을 차지한다. 이는 유사한 문자들의 작은 차이를 인식기가 충분히 반영하기 어렵기 때문이다. 본 논문에서는 최근 주목 받고 있는 Support Vector Machine을 이용해 유사한 문자쌍을 검증하는 한글 인식 후처리 방법을 제안한다. 제안하는 방법은, 대부분의 문자 유사쌍이 한 두개의 자모만이 상이한 점에 착안하여 자모 단위로 문자 유사쌍을 구분한다. 기존 랜덤그래프를 이용한 한글 인식기를 이용하여 자모 분할을 수행하고, Support Vector Machine을 이용하여 분할된 결과를 검증한다. 제안한 방법은 유사쌍 구분에 중요한 자모만을 선택적으로 고려하여, 기존 한글 인식기의 부족한 점을 보완한다. 실험 결과, 자주 혼동되는 문자쌍들의 인식 오류가 정정되는 것을 볼 수 있었으며 그에 따라 한글 인식의 전체 성능이 향상되었다.

  • PDF

Vehicle License Plate Extraction using Multi-level Image Processing Methods (다단계 영상처리 기법을 이용한 차량번호판 추출방법)

  • Ahn, Woon-Ki;Chang, Jae-Khun
    • Annual Conference of KIPS
    • /
    • 2003.11a
    • /
    • pp.275-278
    • /
    • 2003
  • 자동차 번호판 인식 시스템은 영상획득, 번호판추출, 전처리(이진화), 문자영역 분할, 문자인식 등의 5가지 핵심 부분으로 구성된다. 따라서 자동차 번호판 인식 시스템의 최종 인식율은 각 단계의 성능에 따라 직접적인 영향을 받는다. 본 논문은 영상처리 기법을 이용하여 영상에서 번호판 영역을 추출을 위한 연구로 문자인식 단계에서 높은 인식율을 확보할 수 있도록 빠른 연산속도와 추출 정확성을 높일 수 있는 알고리즘을 제안한다.

  • PDF

Building Database using Character Recognition Technology (문자 인식 기술을 이용한 데이터베이스 구축)

  • Han, Seon-Hwa;Lee, Chung-Sik;Lee, Jun-Ho;Kim, Jin-Hyeong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.7
    • /
    • pp.1713-1723
    • /
    • 1999
  • Optical character recognition(OCR) might be the most plausible method in building database out of printed matters. This paper describes the points to be considered when one selects an OCR system in order to build database. Based on the considerations, we evaluated four commercial OCR systems, and chose one which shows the best recognition rate to build OCT-text database. The subject text, the KT-test collection, is a set of abstracts from proceedings of different printing quality, fonts, and formats. KT-test collection is also provided with typed text database. Recognition rate was calculated by comparing the recognition result with the typed text. No preprocessing such as learning and slant correction was applied to the recognition process in order to simulate a practical environment. The result shows 90.5% of character recognition rate over 970 abstracts. This recognition rate is still insufficient for practical use. The errors in OCR texts are different from those of manually typed texts. In this paper, we classify the errors in OCR texts for the further research.

  • PDF

Character Segmentation of Binary Vehicle Plate using Modified Run Length Coding (변형된 Run Length Coding 기법을 이용한 이치화된 자동차 번호판 영상에서의 문자 분리)

  • 이도엽;김형재;배익성;이철희;차의영
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.138-142
    • /
    • 1998
  • 자동차 번호판 인식시스템은 영상획득, 번호판 추출, 전처리(이치화), 문자영역분할, 문자인식 등의 5가지 핵심부분으로 구성되어 있다. 따라서 자동차 번호판 인식시스템의 최종 인식률은 각 단계의 성능에 따라 직접적인 영향을 받는다. 본 논문은 컴퓨터 비젼의 한 분야인 영상처리 기법을 이용한 이치화된 자동차 번호판의 문자영역 추출에 관한 연구로서 문자 인식단계에서 높은 인식률을 확보하기 위해서 가장 중요한 입력 데이터의 상태를 보다 깨끗하게 정확하게 분리하는데 변형된 Run Length Coding 기법을 이용하여 효과적이고 빠른 문자 영역 분리 방법을 제안함으로서 처리속도의 향상은 물론 잡영에도 강한 문자 영역 분리 시스템을 구현하였다.

  • PDF

The structure of the system for recognizing some calendars in an image. (임의 영상내 다수 객체에서 달력을 인식하기 위한 시스템의 구성)

  • 이광호;이승수;최운종;박장춘
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.559-561
    • /
    • 2000
  • 본 논문은 문자 인식의 기법을 이용하여 임의 영상에서 우리의 일상 생활에서 접하는 일반적인 달력을 포함하는 영상만을 검출하기 위한 영상 인식에 관한 연구이다. 달력이라는 영상내의 객체를 인식하기 위한 과정은 다음과 같이 요약된다. 우선 1~31까지의 숫자, 월요일(MON)과 같이 한글과 영문으로 된 요일, 월, 년과 같이 달력에 존재하는 아주 기본적인 문자에 대한 참조 패턴을 형성한다. 입력된 영상에서는 문자 영역 검출 단계, 문자의 특징 추출 단계를 거쳐 영상의 문자 추출이 이루어지고, 달력을 검출하기 위한 참조패턴과 입력 패턴의 비교를 수행하는 인식 단계를 거쳐, 영상 내의 달력 유무를 판단한다. 특히 불규칙적인 배열을 이루는 문자영역을 추출하기 위하여, 본 논문에서는 Hough Transform을 이용하여 기존의 규칙적 문자 인식의 문자 검출 방법의 한계점을 해결하였다.

  • PDF

A Gerber-Character Recognition System with Multiple Recognizers and a Verifier (다중 인식기 및 검증기를 갖는 거버문자 인식 시스템)

  • Oh, Hye-Won;Park, Tae-Hyoung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.1
    • /
    • pp.20-27
    • /
    • 2004
  • We propose the character recognition system for Gerber files. The Gerber file is the vector-formatted drawing file for PCB manufacturing, which includes various symbols, figures and characters. Also, the characters are written in horizontal, vertical, and reverse-vortical directions. In this paper, we newly propose the Gerber-character recognition system to recognize all of component names located in PCB. To improve the performance, we develop the multiple recognizers by neural networks and the verifier considering the structural features. The developed system has been installed to the auto-programming software for PCB assembly and inspection machines.

Improved Text Recognition using Analysis of Illumination Component in Color Images (컬러 영상의 조명성분 분석을 통한 문자인식 성능 향상)

  • Choi, Mi-Young;Kim, Gye-Young;Choi, Hyung-Il
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.3
    • /
    • pp.131-136
    • /
    • 2007
  • This paper proposes a new approach to eliminate the reflectance component for the detection of text in color images. Color images, printed by color printing technology, normally have an illumination component as well as a reflectance component. It is well known that a reflectance component usually obstructs the task of detecting and recognizing objects like texts in the scene, since it blurs out an overall image. We have developed an approach that efficiently removes reflectance components while preserving illumination components. We decided whether an input image hits Normal or Polarized for determining the light environment, using the histogram which consisted of a red component. We were able to go ahead through the ability to extract by reducing the blur phenomenon of text by light because reflection component by an illumination change and removed it and extracted text. The experimental results have shown a superior performance even when an image has a complex background. Text detection and recognition performance is influenced by changing the illumination condition. Our method is robust to the images with different illumination conditions.

  • PDF

A Study on Character Extraction in Vehicle Number Plate and Character Recognition (자동차 번호판 영역의 문자추출과 인식에 관한 연구)

  • 김도형;이선화;김미숙;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.338-340
    • /
    • 2000
  • 자동차 번호판 인식 시스템은 영상획득, 번호판 영역 추출, 추출된 번호판 영역의 전처리, 문자부분 영역화, 문자인식 등의 5가지 핵심부분으로 구성된다. 그 중에서도 번호판 영역 추출, 추출된 영역의 전처리, 문자부분 영역화의 정확성은 전체 시스템 인식률에 지대한 영향을 줄 수 있는 부분으로써 그 정확성이 요구된다. 이에 본 논문에서는 컴퓨터 비젼 분야 중의 하나인 영상처리 기법을 사용하여 명암의 변화에도 문자를 잘 추출할 수 있는 Dynamic Adaptive Threshold 방법을 사용하여 추출된 번호판 영역을 이진화하고, 정확하게 문자 부분을 영역화하기 위한 방법으로 누적분포와 번호판 문자배열 특성을 이용한 방법을 제안한다. 그리고 추출되어진 문자는 ART2 신경망을 이용하여 인식한다.

  • PDF

A Study on Trend of Character Recognition Technological (문자 인식 기술의 동향 연구)

  • 김영은;조범준
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2004.05b
    • /
    • pp.612-615
    • /
    • 2004
  • This paper presents the trend of character recognition technology through uniting recently announced researches and also this paper can help researches to set their research direction. Range of the investigation is limited to general tendency of character recognition technology of research institution and business, and this paper presents forward research direction.

  • PDF