• Title/Summary/Keyword: 한글 문자 인식

Search Result 325, Processing Time 0.024 seconds

A Study on the Classify of Character for Newspaper Automatic Recognition System (신문자동인식 시스템을 위한 문자의 분류에 관한 연구)

  • Lee, S.H.;Cheon, J.I.;Cho, Y.J.;NamKung, J.C.
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.209-215
    • /
    • 1989
  • 본 논문에서는 신문자동인식을 위한 신문문자의 분류에 관한 연구를 하였다. 먼저, 문서의 문자를 추출하기 위하여 블럭화를 행한다. 블럭화는 문자열을 찾아 절과절, 단어와 단어 사이를 찾아 분리구간을 정한다음 블럭을 합성 및 분리를 하였다. 다음으로 블럭화된 문자의 종류를 알기 위한 각 문자에 대하여 6 형식 분류를 하여 특성을 조사함으로써 문자분류를 행하였다. 본 연구에서는 실험을 용하여 블럭화는 충실하게 추출이 되어졌고 한글의 모아쓰기 특성과 한문과의 유사한 형식특성 때문에 분류에 어려움이 있었으나 비교적 충실하게 추출하였다.

  • PDF

Hangul Recognition Using The Path Following Algorithm (Path Following 에 의한 자모추출 한글인식 Algorithm)

  • Hwang, To-Chan;Kim, Sung-Shick
    • IE interfaces
    • /
    • v.3 no.2
    • /
    • pp.53-62
    • /
    • 1990
  • 본 연구는 컴퓨터에 의한 인쇄체 한글의 인식방법을 제안하고 있다. 일반적인 인식방법에서는 세선화과정 후의 이미지를 처리하고 있으나, 본 연구는 이 과정을 거치지 않고 원 이미지로부터 직업 패턴점들을 찾아내고, 이들을 이용하여 획을 결정하고 자모를 분리하였다. 문자 판별시에는 한글 의사 결정 나무(Decision-Tree)를 이용하여 자소를 분리하고 판별하였다. 본 연구는 자형에 관계없는 인식 방법을 제안 하였으므로 필기체 한글 인식에 기초를 제공하게 된다.

  • PDF

A Vertex-Detecting of Hanguel Patterns Using Nested Contour Shape (중첩윤곽 형상에 의한 한글패턴의 정점검출)

  • Koh, Chan;Lee, Dai-Young
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.15 no.2
    • /
    • pp.112-123
    • /
    • 1990
  • This paper presents a vertex-detecting of Hanguel patterns using nested contour shape. Inputed binary character patterns are transformed by distance transformation method and make a new file of transferred data by analysis of charactersitcs. A new vertex-detecting algorithm for recognizing Hanguel patterns using the two data files is proposed. This algorithm is able to reduce the projecting parts of Hanguel pattern, separate the connecting parts between different strokes, set the code number by transformed value of coorked features. It makes the output of results in order to apply the Hanguel recognition.

  • PDF

Hangul Character Recognition Using Fuzzy Reasoning:Hangul Character Type Classification by Maximum Run Length Projenction (퍼지추론을 이용한 한글 문자 인식:최대 길이 투영에 의한 한글 문자 유형 분류)

  • 이근수;최형일
    • Korean Journal of Cognitive Science
    • /
    • v.3 no.2
    • /
    • pp.249-270
    • /
    • 1992
  • The purpose of this paper is to classify the types of input characters,printed Hangul characters,using Maximum Run Length Projection(MRLP)that is used to extract features of input character.Because the number of Hangul characters is large and its structure is complex,there exists close similarities among characters.This paper,therefore,tried to increment the type classification rate using fuzzy resoning.The Maximum Run Length Projection is very immune to noise,and also useful to extracting the demanding information efficiently.In a test case with the most frequently use 917 printed Hangul characters,it achieved 98.58%correct classification rate.

The Recognition of Vehicle Plate`s Korean Character Using Grapheme Segmentation (자소 분리 방법을 이용한 차량번호판의 용도구분 문자 인식)

  • 김성우;강동구;박재현;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.646-648
    • /
    • 2002
  • 본 논문에서는 차량번호판의 용도구분 문자를 자소 단위로 분리하는 효율적인 방법을 제안하고, 신경망을 이용하여 자소를 인식하는 방법을 소개한다. 용도구분 문자(가, 거, 나, 너‥‥)는 실제 번호판의 훼손, 카메라의 성능, 기타 여러 가지 조건에 의해서 번호판 영상에 많은 잡영이 포함된다. 따라서 차량번호판 한글문자를 자소분리하는 것은 어려운 작업이다. 제안하는 이진 영상처리 기법(morphological operation, connected component labeling 등) 으로 분리된 자소가 인식시스템으로의 입력벡터로 입력되었을 때 높은 인식률을 보이는 것을 실험을 통하여 확인하였다

  • PDF

Automatic Word-Spacing of Syllable Bi-gram Information for Korean OCR Postprocessing (음절 Bi-gram정보를 이용한 한국어 OCR 후처리용 자동 띄어쓰기)

  • 전남열;박혁로
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.95-100
    • /
    • 2000
  • 문자 인식기를 가지고 스캔된 원문 이미지를 인식한 결과로 형태소 분석과 어절 분석을 통해 대용량의 문서 정보를 데이터베이스에 구축하고 전문 검색(full text retrieval)이 가능하도록 한다. 그러나, 입력문자가 오인식된 경우나 띄어쓰기가 잘못된 데이터는 형태소 분석이나 어절 분석에 그대로 사용할 수가 없다. 한글 문자 인식의 경우 문자 단위의 인식률은 약 90.5% 정도나 문자 인식 오류와 띄어쓰기 오류 등을 고려한 어절 단위의 인식률은 현저하게 떨어진다. 이를 위해 한극어의 음절 특성을 고려해서 사전을 기반하지 않고 학습이 잘된 말뭉치(corpus)와 음절 단위의 bi-gram 정보를 이용한 자동 띄어쓰기를 하여 실험한 결과 학습 코퍼스의 크기와 띄어쓰기 오류 위치 정보에 따라 다르지만 약 86.2%의 띄어쓰기 정확도를 보였다. 이 결과를 가지고 형태소 분서고가 언어 평가 등을 이용한 문자 인식 후처리 과정을 거치면 문자 인식 시스템의 인식률 향상에 크게 영향을 미칠 것이다.

  • PDF

Language Recognition for Effective Character Segmentation in the mixed Korean-English Documents (한영 혼용 문서에서의 효과적인 문자 분할을 위한 언어 인식에 관한 연구)

  • Choi, Won-Hyo;Yang, Byoung-Seok;Sung, Ki-Joon;Kang, Jae-Woo;Ha, Jin-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.439-444
    • /
    • 2008
  • 본 논문은 한영 혼용 문서에서의 문자 분할을 위한 효율적인 언어 인식기를 고안하였다. 한영 혼용 문서를 스캔한 후, OCR(광학 문자 판독, Optical Character Recognition)을 할 때, 문자 분할의 중요성은 상당히 크다. 인식 없이 문자를 분할하는 external segmentation 방법에서는, 인식할 언어가 한글 혹은 영어인가에 따라 문자 분할 방법이 달라진다. 그러므로, 한영 혼용 이미지를 인식하기 위해서 문자 분할을 하기 전에 언어를 미리 결정해야 한다. 본 논문에서는 문자 분할 방법을 효율적으로 하기 위한 언어 인식기를 제안하고 그 방법을 적용하였다. 그 결과 한영 혼용된 책 이미지에서 94.09%의 문자 분할 성공률을 보였다.

  • PDF

character segmentation using histogram (히스토그램을 이용한 문자 영역 추출)

  • Kim, Jieum;Jung, Woo Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

Character spotting using image-based stochastic models (이미지 기반 확률모델을 이용한 문자검출)

  • 김선규;신봉기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.484-486
    • /
    • 2001
  • 본 논문에서는 의사 2차원 은닉 마르코프 모델의 구조로 생성한 마르코프 체인형 확률모형에 의한 인쇄체문자 이미지의 모델링에 대해 논한다. 이미지 데이터에서 바로 모델을 실시간 생성하며 문자 인식 및 검출에 응용할 수 있다. 실험에 의하면, 이 방법을 통해 특정 낱말이 포함된 문장에서 숫자를 인식, 한글을 검출할 수 있음을 확인하였다.

  • PDF

The Font Recognition of Printed Hangul Documents (인쇄된 한글 문서의 폰트 인식)

  • Park, Moon-Ho;Shon, Young-Woo;Kim, Seok-Tae;Namkung, Jae-Chan
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.8
    • /
    • pp.2017-2024
    • /
    • 1997
  • The main focus of this paper is the recognition of printed Hangul documents in terms of typeface, character size and character slope for IICS(Intelligent Image Communication System). The fixed-size blocks extracted from documents are analyzed in frequency domain for the typeface classification. The vertical pixel counts and projection profile of bounding box are used for the character size classification and the character slope classification, respectively. The MLP with variable hidden nodes and error back-propagation algorithm is used as typeface classifier, and Mahalanobis distance is used to classify the character size and slope. The experimental results demonstrated the usefulness of proposed system with the mean rate of 95.19% in typeface classification. 97.34% in character size classification, and 89.09% in character slope classification.

  • PDF