• Title/Summary/Keyword: 필기 분할

Search Result 58, Processing Time 0.022 seconds

A study of Character segmentation of Handwritten Hangul (필기체한글 글자단위 분할에 관한 연구)

  • 박아람;조범준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.831-834
    • /
    • 2004
  • 본 연구에서는 무제약으로 쓰여진 필기체 한글단어를 글자단위로 분할하는 새로운 방법을 제안한다. 이 방법은 글자와 글자사이 흑은 자소사이에 존재하는 배경(Background)정보를 세선화(Thinning) 처리하여 얻은 패스(Path)를 이용하여 글자와 글자사이를 지나는 패스를 결정하는 방법이다. 특히, 이 방법은 분할에 대한 판단을 인식기로 넘기지 않는 외적분할 방법으로 빠른 처리시간을 얻을 수 있고 외적분할 방법의 단정인 정확도를 다른 외적분할 방법에 비해서 높일 수 있었다. 제안한 방법은 필기체 한글에서 많이 발생할 수 있는 중첩(Over lap)글자와 연결(Touched)글자를 분할하는데 효과적인 성능을 보였다. 중첩글자의 경우, 세선화에 의해 생성된 패스가 자연스럽게 중첩된 부분의 사이를 지나가면서 생성되기 때문에 매우 정확한 패스를 얻을 수 있었고, 연결 글자의 경우는 연결된 부분을 판단하고, 후보영역을 선정하여 연결된 부분을 분리해내는 방법을 사용하였다.

  • PDF

Consonant-Vowel Classification Based Segmentation Technique for Handwritten Off-Line Hangul (자소 클래스 인식에 의한 off-line 필기체 한글 문자 분할)

  • Hwang, Sun-Ja;Kim, Mun-Hyeon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.4
    • /
    • pp.1002-1013
    • /
    • 1996
  • The segmentation of characters is an important step in the automatic recognition of handwritten text. This paper proposes the segmenting method of off-line handwritten Hangul. The suggested approach is based on the structural characteristics of Hangul. The first step extracts the local features. connected component and strokes from the imput word. In the second step we identify the class of strokes. The third segmenting step specifies WRC(White Run Column) before consonant or horizontal vowel. If the segment is longer than threshold, the system estimates segmenting columns using the consonant-vowel information and column features, and then finds a cornered boundary along the strokes within the estimated segmenting columns.

  • PDF

A Segmentation-Based HMM and MLP Hybrid Classifier for English Legal Word Recognition (분할기반 은닉 마르코프 모델과 다층 퍼셉트론 결합 영문수표필기단어 인식시스템)

  • 김계경;김진호;박희주
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.3
    • /
    • pp.200-207
    • /
    • 2001
  • In this paper, we propose an HMM(Hidden Markov modeJ)-MLP(Multi-layer perceptron) hybrid model for recognizing legal words on the English bank check. We adopt an explicit segmentation-based word level architecture to implement an HMM engine with nonscaled and non-normalized symbol vectors. We also introduce an MLP for implicit segmentation-based word recognition. The final recognition model consists of a hybrid combination of the HMM and MLP with a new hybrid probability measure. The main contributions of this model are a novel design of the segmentation-based variable length HMMs and an efficient method of combining two heterogeneous recognition engines. ExperimenLs have been conducted using the legal word database of CENPARMI with encouraging results.

  • PDF

Phoneme Extraction from Freely Hand Written Han Gul (자유 필기체 한글에서의 자모 추출)

  • Oh, Weon-Geun;Shin, Young-Geon;Ahn, Young-Kyung
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.142-147
    • /
    • 1989
  • 필기체 문자는 인쇄체 문자와는 달리, 복잡한 변형이 따르므로, 인식 하는데 많은 문제점이 따른다. 그렇기 때문에 일반적인 필기체 인식에 있어서는 필기 자체에 대한 제한을 두어 변형을 적게한 문자를 인식 대상으로 삼고 있다. 이러한 문자는, 설정된 조건만 확실하게 만족한다면, 비교적 간단하게 인식 할 수 있다. 반면에, 자유 필기체 문자는, 제한 필기체 문자와는 달리 변형이 크기 때문에, 그 인식에는 많은 연구가 필요하다. 본 연구에서는, 자유 필기체 한글의 자모를 추출하는데 있어 두개의 parameter space method를 이용했다. 화상내에서의 혼합은, 기본적으로 5 개의 element ($\mid,\;\setminus,\;/,\;-,\;o$)로 구성되어 있고, 이 element를 정의하는데는 최소한 4 개의 parameter, 즉 element의 위치 [x, y], 크기 [1] 및 type [T] 등이 필요하다. 입력 화상에서 추출된 직선 및 원의 성분은 [x, y, l] 과 [x, y, T]의 2 개의 3-D parameter space 에 누적되고, parameter space 상에서의 병합 분할 과정을 거쳐, element 가 형성된다. 추출된 element 들은, parameter space 상에서의 방향성 및 상호 위치 관계에 의한 조합 형태로서, 미리 기술되어진 자모 모델과 비교되어 인식된다. 본 방법의 특정은, 문자의 크기에 무관하고, 해석방법에 의해서는, 끊어진 element나 불필요한 element 등의 왜곡된 element 들의 처리가 가능한 점, 4 차원 parameter space를 두개의 3 차원 parameter space로 분리, 처리시간과 기억용량의 절약을 기한점 등을 들 수 있다.

  • PDF

Shape Decomposition of Handwritten Hangul Characters (필기 한글 문자의 모양 분해)

  • Park, Jeong-Seon;Hong, Gi-Cheon;O, Il-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.7
    • /
    • pp.511-523
    • /
    • 2001
  • 필기 한글의 문자나 단어 인식에 있어 패턴을 구성하는 획 성분을 추출하는 작업은 매우 중요하다. 세선화와 직선근사에 기반한 고전적인 방법은 원래 패턴을 크게 왜곡한다는 단점을 가지고 있다. 우리는 이러한 문제점을 해결하기 위하여 한글 패턴에 적합한 모양 분해 알고리즘을 제안한다. 한글 패턴은 T-접점과 B-접점이라는 두가지 모양 특징을 중심으로 분할할 수 있다고 관찰에 근거하여 알고리즘을 설계하였다. 또한 세 개 이상의 획이 복잡한 형태로 만나는 결합 지점을 강전하게 처리하는 방법도 제시한다. 제안한 알고리즘을 PE92 데이터베이스에 적용한 결과를 제시한다.

  • PDF

Online korean character recognition using letter spotting method (자소 탐색 방법에 의한 온라인 한글 필기 인식)

  • 조범준
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.21 no.6
    • /
    • pp.1379-1389
    • /
    • 1996
  • Hangul character always consists of consonants-vowel-consonants in order. Using this point, this paper proposes an approach to design a model for spotting each letter in Hangul, and then recognize characters based on the spotting results. The network model consist of a set of HMMs. The letter search is carried out by Viterbi algorithm, while character recognition is performed by searching the lattice of letter hypotheses. Experimental results show that, in spite of simple architecture of recognition, the performance is quite high reaching 87.47% for discrete regular characters. In particular the approach shows highly plausible segmentation of letters in characters.

  • PDF

필기 한글 문자의 골격선 추출

  • 박정선;홍기천;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.565-567
    • /
    • 2000
  • 필기 한글 인식에서 원래 패턴의 모양을 유지하는 골격선 추출은 중요하다. 세선화에 의존하는 기존 방법은 작은 잡음에 민감하다는 단점을 안고 있다. 본 논문은 필기 한글 패턴에 적합한 새로운 골격선 추출 방법을 제안한다. 먼저 한글 패턴은 T-접점과 B-접점이라는 두가지 모양 특징을 중심으로 분할할 수 있다는 관찰에 근거하여 유사블록으로 이루어진 부품 집합으로 분할한다. 또한 세 개 이상의 획이 복잡한 형태로 만나는 지점을 결합 부품으로 분할한다. 그런 다음, 각 부품에서 접점의 형태에 따라 결합 부품을 추가 탐지한다. 결합 부품과 인접한 부품들의 연관 관계에 따라 골격선을 구하고, 골격선의 연결성을 보장하기 위해서 선분 연장을 수행한다. 본 논문에서 기존의 방법과의 비교를 위해 다섯 가지 비교 기준을 설정하고, 이를 기반으로 비교 분석하였다. 본 논문에서 제안한 방법이 여러 기준에서 세선화-기반 방법보다 우수함을 보였다.

  • PDF

Slant Estimation and Correction for the Off-Line Handwritten Hangul String Using Hough transform (Hough 변환을 이용한 오프라인 필기 한글 문자열의 기울기 추정 및 교정)

  • 이성환;이동준
    • Korean Journal of Cognitive Science
    • /
    • v.4 no.1
    • /
    • pp.243-260
    • /
    • 1993
  • This paper presents an efficient method for estimationg and correcting the slant of off-line handwritten Hangul strings.In the proposed method,after extracting contours from input image.Hough tranform is applied to the contours to detect lines and estimate slants of the lines.When Hough trans form is applied to the contours,pixels which are not parts of the same stroke could be detected as a line.In order to exclude these lines from slant estimation process,detected lines which have the length less than threshold are eliminated.Experiments have been performed with address images which were extracted from live envelopes provided by Seoul Mail Center.Experimental results show that the proposed method is superior to the previous methods,which had been done with handwritten English strings.in estimation the slant of off-line handwritten Hangul strings.

Handwritten Hangul Character Segmentation Based on Stroke Extraction (획기반 필기한글 문자분할)

  • Kim, Ho-Yon;Kim, Doo-Sik;Nam, Yun-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.593-596
    • /
    • 2001
  • 본 논문에서는 획기반 필기한글 문자분할 방법을 제안하고 이를 한글단어인식에 적용하였다. 제안된 방법에서는 획 단위의 문자분할을 시도함으로써 불필요한 분할점을 줄일 수 있었을 뿐 아니라 문자간 획의 접촉이나 겹침을 해결할 수 있었다. 실험에서는 이를 단어인식에 적용하여 비교적 높은 인식률을 얻음으로써 제안된 방법의 가능성을 입증하였다. 실험에서 이용한 문자인식기의 성능이 낮음에도 불구하고 비교적 높은 단어인식률을 얻을 수 있었던 것은 의미 있는 획 단위의 문자분할을 통해 불필요한 분할 가능성을 줄였고, 단어사전을 이용함으로써 사전정보를 충분히 활용할 수 있었기 때문이다.

  • PDF

Segmentation and Recognition Methods for Touching Handwritten Digit String (접촉된 숫자열의 분할 및 인식 기법)

  • 송성일;김황수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문은 숫자간 접촉이 포함된 무제약 오프라인 필기 숫자열 인식을 위한 분할 및 인식기법을 소개하고자 한다. 시스템은 숫자열에서 접촉된 성분을 추출하는 모듈, 접촉된 숫자를 분할하는 모듈과 최종적으로 분할된 결과를 조합하는 모듈로 이루어진다. 그리고, 위의 기법을 NIST 데이터에 적용하여 제안한 분할 및 인식기법의 효율성을 보여준다.

  • PDF