• Title/Summary/Keyword: 한글 문자 인식

Search Result 326, Processing Time 0.026 seconds

Feature Classification of Hanguel Patterns by Distance Transformation method (거리변환법에 의한 한글패턴의 특징분류)

  • Koh, Chan;Lee, Dai-Young
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.14 no.6
    • /
    • pp.650-662
    • /
    • 1989
  • In this paper, a new algorithm for feature extraction and classification of recognizing Hanguel patterns is proposed. Inputed patterns classify into six basic formal patterns and divided into subregion of Hanguel phoneme and extract the crook feature from position information of the each subregion. Hanguel patterns are defined and are made of the indexed-sequence file using these crook features points. Hanguel patterns are recognized by retrievignt ehses two files such as feature indexed-sequence file and standard dictionary file. Thi paper show that the algorithm is very simple and easily construct the software system. Experimental result presents the output of feature extraction and grouping of input patterns. Proposed algorithm extract the crooked feature using distance transformation method within the rectangle of enclosure the characters. That uses the informationof relative position feature. It represents the 97% of recognition ratio.

  • PDF

A Postprocessing of Character Recognition Based on Korean Lexicon (한국어 Lexicon에 의존한 문자 인식의 후처리)

  • Lim, Han-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.371-377
    • /
    • 1993
  • 본 논문에서는 문자 인식이 끝난 한국어 원문에 대해 한국어 Lexicon에 기반을 둔 후처리의 구현을 보여주는 것을 목적으로 한다. 빈번하게 오인식되는 음절에 대해 이의 옳은 음절을 대응시킨 테이블을 만들어 놓고, 오인식이라고 정의된 음절이 출현했을 때는 이를 원래의 옳은 음절로 대체시킨 어절과 오인식된 음절이 포함된 어절에 대해 한국어 형태소 분석을 행함으로써, 올바른 형태소가 분석될 경우, 이를 옳은 음절로 간주한다. 실험결과 약 90%에서 95%에 달하는 인식율이 이 후처리 방법에 의해서 95%에서 99%로 높아졌다.

  • PDF

Digitization of Old Korean Texts with Obsolete Korean Characters and Suggestion for Improvement of Information Sharing (옛한글 문서의 전자문서화와 정보공유 방법 제안)

  • Kim, Ha Young;Yoo, Woo Sik
    • Journal of Conservation Science
    • /
    • v.37 no.3
    • /
    • pp.255-269
    • /
    • 2021
  • A vast amount of materials-such as prints, woodblock prints, manuscripts, old novels, and letters-written in old Korean and using old grammar and/or obsolete characters, are collected in many institutions, including the Jangseogak at the Academy of Korean Studies. Digitization of these texts has required a prolonged manual inputting process. Individual researchers, who majored in old Korean, have read and typed the characters into electronic documents, which depends upon individual skill, effort, and approach, and is particularly limiting because none can be significantly increased. To date, only a small proportion of the old Korean document collections, currently kept in storage, have been digitized and made available to the public. Even the electronic formats of the texts prove difficult to displaying correctly, due to the incompatibility between the old Korean characters and the character set on today's electronic devices. To improve the techniques and efficiency of digitizing old Korean texts, it is necessary to develop optical character recognition (OCR), which will analyze images of old Korean documents, as well as input, display, and storage methods.

Car Plate Detection using Morphology & Hough Transform And Separating Consonant & Vowel (수직 강화 모폴로지와 Hough Transform을 이용한 차량 번호판 추출과 문자의 자모 분리)

  • Lee, Byong-Mo;Cha, Eui-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.789-792
    • /
    • 2001
  • 본 논문은 자동차의 번호판 인식 시스템의 한 부분인 번호판 추출과 자모 분리를 통한 문자 인식까지의 과정을 실험한 것이다. 본 논문은 gray-level에서 영상을 실험하였고, 번호판을 추출하기 위해서 morphology를 반복 적용하고 크기 보정을 통해 번호판을 추출하며, hough transform을 이용한 크기 재보정을 통해 최종적으로 번호판을 추출한다. 그리고, 문자 인식 단계에서는 먼저 hough transform을 사용하여 한글의 모음의 시작점을 얻고, 문자 특징을 이용하여 자음과 모음을 분리하여 모음을 인식한다.

  • PDF

On-line Character Recognition from MPEG Stream Data (MPEG Stream Data에서의 온라인 문자인식)

  • 이진숙;장춘서
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.407-409
    • /
    • 2000
  • 본 논문에서는 Web 기반의 원격 교육 환경에서 강사와 학습자 모두에게 도움을 줄 수 있는 판서장면 MPEG Stream Data에서의 온라인 문자 인식 방법에 대하여 연구하였다. 강사가 별도의 프리젠테이션 자료를 만들 필요 없이 직접 판서한 MPEG Stream Data로부터 초당 3 Frame을 Sampling 한 후, 각 Frame에 Laplacian 마스크를 이용한 윤곽선 검출, Frame간 빼기 그리고 세선화 등의 영상처리 기법을 적용하여 문자인식에 필요한 좌표 값과 방향코드 등의 특징을 추출하였다. 좌표 값은 세선화 된 획의 중간 Pixel의 좌표 값이며, 구해진 좌표 값들을 이용하여 8방향 코드와 가상 획 코드를 구한 다음, 이 특징들을 사용해 은닉 마르코프 모델(Hidden Markov Model)을 학습시키고 한글 문자 인식을 행하였다.

  • PDF

Stroke Extraction in Phoneme for Off-Line Handwritten Hangul Recognition (오프라인 필기체 한글 인식을 위한 자소 내 자획의 분리)

  • Jung Min-Chul
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.7 no.3
    • /
    • pp.385-392
    • /
    • 2006
  • This paper proposes a new stroke extraction algorithm for phoneme segmentation, which is one of main techniques for off-line handwritten Hangul recognition. The proposed algorithm extracts vertical, slant, and horizontal strokes from phonemes using run-length. The run-length of vertical or slant strokes becomes the width, and also the number of horizontal run-lengths the width. After extracting horizontal strokes from phonemes, the algorithm links two continuous vertical or slant stokes with run-lengths of the strokes' width to represent the features of a character. The extracted strokes can be utilized to recognize a character, using template matching of strokes, which is being adopted in on-line handwritten Hangul recognition.

  • PDF