• 제목/요약/키워드: Hangul character recognition

검색결과 77건 처리시간 0.027초

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF

다층 퍼셉트론을 이용한 한글 필기체 온라인 인식 (Hangul Handwritten Character On-Line Recognition using Multilayer Perceptron)

  • 조정욱;이수영;박철훈
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.147-153
    • /
    • 1995
  • In this paper, we propose the position- and size-independent handwritten on-line Korean character recognition system using multilayer neural networks which are trained with error back-propagation learning algorithm and the features of Hanguel consonants and vowels. Starting point, end point, and three vectors from starting point to end point of each stroke of characters inputted from mouse or tablet are applied as inputs of neural networks. If double consonants and vowels are separated by single consonants and vowels, all consonants and vowels have at most four strokes. Therefore, four neural networks learn the consonants and the vowels having each number of strokes. Also, we propose the algorithm of separating the consonants and vowels and constructing a character.

  • PDF

낱자 인식기와 자소 조합 인식기를 혼용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Character and Combined-Grapheme Recognizers)

  • 장승익;임길택;김호연;정선화;남윤석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2003
  • 본 논문에서는 낱자 인식기와 자소 조합 인식기를 혼용한 저품질 인쇄체 한글의 고성능 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6형식과 기타 형식의 문자, 총 7종으로 분류한, 입력문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위(HRU: Hangul recognition unit)로 분리하여 인식한다. 각 인식 단위 영상에서 추출한 방향각 특징을 다층신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.80%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 23.61%의 오류가 감소한 것이다.

  • PDF

MWLD 알고리즘을 이용한 문자열정합 1차원 Bit-Serial 어레이 프로세서의 설계 (A Study on 1-D Bit-Serial Array Processor Design for Code-String Matching Using a MWLD Algorithm)

  • 박종진;김은원;조원경
    • 전자공학회논문지B
    • /
    • 제29B권2호
    • /
    • pp.1-8
    • /
    • 1992
  • This paper is proposed a Modified WLD (Weighted Levenshtein Distance) algorithm for processor desihn of code-string matching. A proposed MWLD (Modified Weighted Levenshtein Distance) algorithm is consist of 1-dimension bit-serial array processor to pattern matching using a Hamming Distance. The proposed processor is applied to recognition of character with real time input. The recognition rate of Hangul strokes is resulted to 98.65$\%$

  • PDF

문자 가분할과 Support Vector Machine을 이용한 필기 한글 단어 고속 검증기 (Hangul Segmentation and Word Verification System for Automatic Address Processing)

  • 이충식;김인중;신종탁;김진형
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.37-40
    • /
    • 2000
  • A fast method of Hangul address word verification is presented in this Paper. Pre-segmentation and recognition by DP matching is adopted in this paper. An address line image is over-segmented by analyzing the topology of connected components and the projection profile. A fast individual Hangul character verifier was developed by applying SVM (Support Vector Machine). The segmentation hypothesis was represented by lattice structure, and a best path search by dynamic programming generates the most probable segmentation path and the final verification score. The word verifier was tested on 310 address image DB, and it show the possibility of improvements of this method.

  • PDF

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

오프라인 한글 문자 인식을 위한 효율적인 오인식 단어 교정 방법 (An Efficient Correction Method for Misrecognized Words in Off-line Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1598-1606
    • /
    • 1996
  • 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들을 언어적 지식 을 이용하여 교정하는 문자 인식 후처리 과정이 반드시 필요하다. 본 논문에서는 한 국어의 형식 측면에서 품사를 재분류하고 사전을 구성하며 한글 어절의 상태 전이도 를 구성하고 형태소 분석을 위해 Head-tail구분법을 적용해 단어를 분리하였다. 또한 본 논문에서는 효율적인 단어분리와 교정을 위해 여러 문서와 책들로부터 새롭게 조 사의 결합형으로 900여개를, 규칙 어미의 활용형으로 800여개를 수집하였다. 그리고 불규칙 용언의 활용형을 위해 국어학에 나오는 9개의 불규칙을 조사하여 활용형을 구 축하였고 자동적 교체와 불구동사의 활용형도 사전에 등록하여 어절을 분석하는데 이 용하였다. 어느 인식 시스템을 가지고 문서를 인식한 결과 93.7%의 인식률을 보인 것 을 본 단어교정방법을 적용한 결과 97% 인식률을 향상시킬 수 있었다.

  • PDF

A Recognition System for Multi-Form Korean Characters Based on Hierarchical Temporal Memory

  • Haibao, Nan;Bae, Sun-Gap;Bae, Jong-Min;Kang, Hyun-Syug
    • 한국멀티미디어학회논문지
    • /
    • 제12권12호
    • /
    • pp.1718-1727
    • /
    • 2009
  • Traditional character recognition systems usually aim at characters with simple variation. With the development of multimedia technology, printed characters may appear more diversely. Existing recognition technologies can't deal with Hangul recognition effectively in diverse environments. This paper presents a recognition system for multi-form Korean characters called RSMFK, which is based on the model of Hierarchical Temporal Memory (HTM). Our system can effectively recognize the printed Korean characters of different fonts, scales, rotation, noise and background. HTM is a model which simulates the neocortex of human brain to recognize and memorize intelligently. Experimental results show that RSMFK performs a good recognition rate of 97.8% on average, which is proved to be obviously improved over the conventional methods.

  • PDF

필기체 문자 영상의 이진화에 관한 연구 (A Study on Binarization of Handwritten Character Image)

  • 최영규;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권5호
    • /
    • pp.575-584
    • /
    • 2002
  • 온라인 필기체 문자 인식은 필기의 순서와 획의 위치를 알 수 있어 신경망을 이용한 자소의 효과적인 분할로 큰 성과를 이루었다. 그러나 오프라인 필기체 문자 인식은 동적인 정보와 시간적인 정보를 가지고 있지 않고, 다양한 필기와 자소의 겹침이 심하며 획 사이의 잡영을 많이 가지고 있어 불완전한 전처리를 수행하여야 하는 어려움을 가지고 있다. 따라서 오프라인 필기체 문자 인식은 다양한 방법의 연구가 필요하다. 본 논문에서는 Watershed 알고리즘을 오프라인 필기체 한글 문자 인식 전처리에 적용하였다. 여기서 Watershed 알고리즘의 수행 시간과 결과 영상의 품질을 고려해 Watershed 알고리즘 4단계에서 효과적인 적용방법을 제시하였다. 효과적으로 구성된 Watershed 알고리즘을 전처리에 적용함으로써 영상 향상과 이진화에 좋은 결과를 얻었다. 실험에서는 기존의 방법과 본 논문 방법을 수행 시간과 품질로써 평가했다. 실험 결과 기존의 방법은 평균 2.08초, 본 논문 방법은 평균 0.86초의 수행 시간이 걸렸다. 결과 영상의 품질은 본 논문 방법이 기존의 방법에 비하여 문자의 획 사이의 잡영을 효과적으로 처리하였다.

  • PDF

오프라인 필기체 전표용 한글 인식을 위한 부분 연결 다층 신경망과 결합 (Partially Connected Multi-Layer Perceptrons and their Combination for Off-line Handwritten Hangul Recognition)

  • 백영목;임길택;진성일
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.87-94
    • /
    • 1999
  • 본 논문은 필기체 한글인식에 적합한 모듈화된 부분연결 다층신경회로망 구조를 제안한다. 세가지 특징 벡터들에 대한 세 개의 부분연결 다층신경회로망 인식기를 구성하고 이를 통합하기 위한 또 하나의 부분연결 신경회로망을 결합시킴으로써 인식률을 높일 수 있도록 설계하였다. 각각의 부분연결 다층신경회로망은 한글의 이차원적 특징을 잘 반영할 수 있도록 입력층을 10개의 수용영역으로 분할하고 입력층과 은닉층 사이를 부분 연결하였다. 결합단계에서 새로운 부분연결 신경회로망을 도입하고, 그 입력으로 이미 학습된 세 개 인식기의 은닉층 출력을 이용하여 재학습한다. 제안된 인식기의 성능을 평가하기 위해서 전표처리에 많이 사용되는 한글 문자 18개를 선정하여 평가하였다.

  • PDF