• 제목/요약/키워드: Hangul handwriting recognition

검색결과 13건 처리시간 0.02초

Handwritten Hangul Graphemes Classification Using Three Artificial Neural Networks

  • Aaron Daniel Snowberger;Choong Ho Lee
    • Journal of information and communication convergence engineering
    • /
    • 제21권2호
    • /
    • pp.167-173
    • /
    • 2023
  • Hangul is unique compared to other Asian languages because of its simple letter forms that combine to create syllabic shapes. There are 24 basic letters that can be combined to form 27 additional complex letters. This produces 51 graphemes. Hangul optical character recognition has been a research topic for some time; however, handwritten Hangul recognition continues to be challenging owing to the various writing styles, slants, and cursive-like nature of the handwriting. In this study, a dataset containing thousands of samples of 51 Hangul graphemes was gathered from 110 freshmen university students to create a robust dataset with high variance for training an artificial neural network. The collected dataset included 2200 samples for each consonant grapheme and 1100 samples for each vowel grapheme. The dataset was normalized to the MNIST digits dataset, trained in three neural networks, and the obtained results were compared.

순환신경망을 이용한 한글 필기체 인식 (Hangul Handwriting Recognition using Recurrent Neural Networks)

  • 김병희;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.316-321
    • /
    • 2017
  • 온라인 방식의 한글 필기체 인식 문제를 분석하고 순환신경망 기반의 해법을 모색한다. 한글 낱글자 인식 문제를 순서데이터 레이블링의 관점에서 서열 분류, 구간 분류, 시간별 분류의 세 단계로 구분하여 각각에 대한 해법을 살펴보며, 한글의 구성 원리를 고려한 해결 방안을 정리한다. 한글 2350글자에 대한 온라인 필기체 데이터에 GRU(gated recurrent unit)의 다층 구조를 가지는 서열 분류모델을 적용한 결과, 낱글자 인식 정확도는 86.2%, 초 중 종성 구성에 따른 6가지 유형 분류 정확도는 98.2%로 측정되었다. 유형 분류 모델로 획의 진행에 따른 유형 변화 역시 높은 정확도로 인식하는 결과를 통해, 순환신경망을 이용하여 순서 데이터에서 한글의 구조와 같은 고차원적 지식을 학습할 수 있음을 확인하였다.

자소간의 흘림을 허용하는 연속형 온라인 필기 인식 시스템의 구현 (Implementation of An On-Line Continuous Recognition System for Cursive Handwriting)

  • 권오성;권영빈
    • 전자공학회논문지B
    • /
    • 제31B권9호
    • /
    • pp.166-177
    • /
    • 1994
  • In this paper, an implemenation of on-line continuous recognizer for cursive Hangul handwriting is explained. For the Hangul recognition system, we propose a high speed string matching. The editing process in our proposed string matching is accomplished by single editing path. And the matching results are stored in a heap structure and we decide the user comfortibility of unceasing writing during recognition owing to the high speed matching. In the experimental result, a recongition rate of 86.36% at 1.75 second/character over 21,076 characters collected from 50 persons are abtained. And it is shown that the proposed recognition system is operated properly for the on-line recognition for cursive handwring between graphemes.

  • PDF

필기 입력데이터에 대한 언어식별 시스템의 설계 및 구현 (Design and Implementation of a Language Identification System for Handwriting Input Data)

  • 임채균;김규호;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.63-68
    • /
    • 2010
  • 최근, 유비쿼터스 시대로의 도약을 위하여 모바일 기기의 입력 인터페이스에 대한 연구가 활발하게 진행되고 있으며, 기존의 마우스, 키보드뿐만 아니라 필기, 음성, 시각, 터치와 같이 다분야로 세분화되어 새로운 인터페이스가 연구되고 있다. 특히 소형 모바일 기기에서는 크기로 인하여 추가가능한 장치의 제약이 심하기 때문에, 작은 화면에서도 효율적인 입력 인터페이스로 필기 인식이 대두되고 있다. 필기 인식에 대한 이전 연구는 2차원 영상을 기반으로 하거나 벡터로 입력받은 필기데이터를 인식하는 알고리즘이 대부분이며, 필기 인식 알고리즘의 정확성을 향상시키는 연구에만 초점을 두고 있는 실정이다. 또한 실제 필기 입력하는 경우에는 현재 문자가 영문 대/소문자, 한글, 숫자 등의 어느 분류에 속하는지 선택해야하는 문제가 있다. 따라서 본 논문에서는 입력된 필기 데이터를 기반으로 형상 분석을 통하여, 영문이나 한글의 여부를 판단하고 언어식별이 가능한 시스템을 제안하였다. 제안 기법은 벡터 단위의 집합으로 필기 데이터를 취급하여 각 벡터 간의 상호관계와 방향성을 분석함으로써 효율적인 언어식별을 가능하도록 하였다.

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

  • 이재형;조민영;김진수
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.13-22
    • /
    • 2024
  • 현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.

동적 프로그래밍을 이용한 오프라인 환경의 문서에 대한 필적 분석 방법 (A Verification Method for Handwritten text in Off-line Environment Using Dynamic Programming)

  • 김세훈;김계영;최형일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1009-1015
    • /
    • 2009
  • 필적 감정은 개인의 필적 개성을 이용하여 임의의 두 필기 문장 또는 텍스트가 동일인에 의해 작성되었는지를 판별하는 기술이다. 본 논문은 패턴 인식 기술을 사용하여 효과적으로 필적을 분석하고 판별하는 오프-라인 환경에서의 검증 방법을 제안한다. 본 논문에서 연구된 방법의 핵심 절차는 문자 영역 추출, 문서의 구조적 특징을 반영하는 특징의 추출, DTW(Dynamic Time Warping) 알고리즘과 주성분 분석을 이용한 특징 분석이다. 실험 결과는 제안하는 방법의 우수한 성능을 보여준다.

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

Efficient Mobile Writing System with Korean Input Interface Based on Face Recognition

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.49-56
    • /
    • 2020
  • 가상 키보드방식의 문자 입력 시스템은 고정된 버튼 위치를 터치하여 입력하는 방식으로 손가락의 움직임이 불편한 사람들이나 노인들은 입력하기가 매우 불편하다. 이러한 문제를 완화시키고자, 본 논문에서는 모바일 디바이스의 RGB 카메라를 통해 얻은 영상과 사용자의 움직임을 통해 자판 입력과 필기 기능이 가능한 효율적인 프레임워크를 제안한다. 이 시스템을 개발하기 위해 얼굴인식을 활용하여 입력 영상으로부터 컨트롤 좌표를 계산하고, 이 좌표 값을 이용하여 한글을 입력하고 조합할 수 있는 인터페이스 개발한다. 얼굴인식을 기반으로 계산된 컨트롤 위치는 자판의 글자를 선택하고 전달하는 포인터 역할을 하며, 마지막으로 전달된 글자들을 조합하여 한글 자판 기능을 수행할 수 있도록 통합한다. 본 연구의 결과는 얼굴인식 기술을 활용한 효율적인 필기 시스템이며, 이 시스템을 사용하면 일반인 뿐 만 아니라 신체가 불편한 지체장애인의 의사소통 및 특수교육 환경도 개선시킬 수 있을 거라 기대한다.

흘림체 한글 필기의 온라인 원고 작성기 구현 (Implementation of A Continuous Cursive On-Line Hangul Handwriting Recognition System Based on the Boxed Style Pad)

  • 권오성;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.493-501
    • /
    • 1993
  • 본 논문에서는 한글의 자소간 흘림의 연속 필기를 허용하는 원고 작성기의 구현을 연구하였다. 이러한 온라인 한글 필기의 응용에서는 신속한 인식속도를 갖는 인식방법이 요구되며, 인식중에도 계속적인 필기가 가능하도록 하여 사용자에게 편의를 제공할 수 있어야 한다. 본 논문에서는 이와같은 요구사항을 만족시키기 위하여 스트링 정합방법에 기반한 신속한 인식 방법을 사용한다. 또한, 글자인식과 필기데이타 수집이 병행적으로 처리되도록 구성됨으로써 원고작성시에 자유로운 필기동작이 가능하도록 하였다. 실험결과 50명이 쓴 21,076자에 대하여 88.96%의 인식률을 제공하였으며, 제안하는 구현 방법이 원고작성 응용에 적합하게 동작함을 알 수 있었다.

  • PDF

Augmentation of Hidden Markov Chain for Complex Sequential Data in Context

  • Sin, Bong-Kee
    • Journal of Multimedia Information System
    • /
    • 제8권1호
    • /
    • pp.31-34
    • /
    • 2021
  • The classical HMM is defined by a parameter triple �� = (��, A, B), where each parameter represents a collection of probability distributions: initial state, state transition and output distributions in order. This paper proposes a new stationary parameter e = (e1, e2, …, eN) where N is the number of states and et = P(|xt = i, y) for describing how an input pattern y ends in state xt = i at time t followed by nothing. It is often said that all is well that ends well. We argue here that all should end well. The paper sets the framework for the theory and presents an efficient inference and training algorithms based on dynamic programming and expectation-maximization. The proposed model is applicable to analyzing any sequential data with two or more finite segmental patterns are concatenated, each forming a context to its neighbors. Experiments on online Hangul handwriting characters have proven the effect of the proposed augmentation in terms of highly intuitive segmentation as well as recognition performance and 13.2% error rate reduction.