• 제목/요약/키워드: 한글 문자 인식

검색결과 325건 처리시간 0.023초

신경회로망을 이용한 인쇄체 한글 문자의 인식 (The Recognition of Printed Korean Characters by a Neural Network)

  • 김상우;전윤호;최종호
    • 대한전자공학회논문지
    • /
    • 제27권2호
    • /
    • pp.65-72
    • /
    • 1990
  • 이 논문에서는 인쇄체 한글문자 인식에 있어서 신경회로망의 적용가능성을 알아 보았다. 한글 문자수의 과다와 그들 사이의 유사성, 많은 입력 영상 데이타 등으로 인하여 신경회로망을 한글인식에 적용시키는데는 많은 난점이 따른다. 한글 문자의 이진영상은 신경회로망의 입력으로 사용하기에는 그 데이타 수가 너무 많으므로 입력 영상으로부터 DC 성분을 추출하여 이것을 신경회로망의 입력으로 사용하기 위한 전처리과정을 두었다. 출력층은 한글의 특성에 맞도록 구성하였다. 한글인식에 도입된 신경회로망은 다층인식자이고, 적용된 훈련방법은 BEP 알고리듬을 한글인식에 적절하도록 변형시킨 형태이다. 이 방법을 통하여 정위치에 있는 2,300개 이상의 문자를 인식할 수 있었다. 이 결과로부터 신경회로망을 이용한 인쇄체 한글문자 인식은 적절한 방법임을 알 수 있다.

  • PDF

딥러닝을 이용한 대규모 한글 폰트 인식 (Large-Scale Hangul Font Recognition Using Deep Learning)

  • 양진혁;곽효빈;김인중
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

인텔리젼트 멀티미디어 단말기를 위한 온라인 한글 인식 (Online Korean Character Recognition for Intelligent Multimedia Terminal)

  • 오준택;이우범;김욱현
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.229-232
    • /
    • 2000
  • 문자인식은 멀티 모달 인터페이스의 핵심요소로서 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 단말기의 구현을 위해 필수적으로 개발되어야 할 과제이다. 그러나 대부분의 기존 연구는 인식률의 향상만을 위해서 복잡한 획 해석과 백트래킹을 사용하기 때문에 멀티미디어 단말기에 적합하지 못하다. 따라서 본 논문은 멀티미디어 단말기로의 적용을 목적으로 한 새로운 온라인 한글 문자 인식 방법을 제안한다. 제안된 방법은 한글 문자의 특성정보와 획 정보를 기반으로 구축된 한글 데이터 베이스를 사용한다. 또한 획간의 위치관계를 이용한 순차적 자소 분리와 향상된 백트래킹 기법에 의해서 보다 빠른 처리 시간을 보장한다. 제안된 시스템의 성능 평가는 상용 1,200 단어를 이용하여 다수의 필기자가 필기한 한글 600문자를 대상으로 실험한 결과 95% 이상의 인식률을 얻었다.

  • PDF

한글 자소의 획 정보에 의한 멀티미디어 단말기에서의 온라인 한글 문자 인식 (On-Line Korean Character Recognition by the Stroke Information of Korean Phoneme in Multimedia Terminal)

  • 오준택;정모문;이우범;김욱현
    • 융합신호처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.64-73
    • /
    • 2000
  • 멀티미디어 단말기에서 사용자 인터페이스를 위한 한글 문자 인식기술은 빠른 처리시간과 높은 인식률을 요구한다. 따라서 본 논문에서는 특징점, 특징벡터, 가상벡터, 획간의 위치관계와 한글의 특성정보를 이용한 자소와 문자 인식기술을 제안한다. 그리고 사용자의 다양한 필체 유형에 따른 자소와 문자 인식을 위해서 한글의 특성정보와 다양한 획 정보로 구성된 한글데이터 베이스를 구축한다. 또한, 복잡한 자소 분리와 처리과정의 단순화를 위해서 획간의 위치관계에 의한 순차적 처리와 각 자소들이 가지는 획 수의 변경에 의한 백트래킹 처리를 사용한다. 제안된 온라인 한글 문자 인식기는 상용 1,200단어 중 10명이 필기한 총 600문자를 대상으로 실험한 결과 $95^{\circ}C$이상의 인식률과 13msec의 평균문자처리시간을 얻었다.

  • PDF

한글 Shape 문자 Pattern에서의 구조적 정보를 이용한 형식분류와 인식 관한 연구 (A Study on Type Classification and Recognition Using Structural Information in Character Pattern of HANGEUL Shape)

  • 전종익;조용주;남궁재찬
    • 한국통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.180-195
    • /
    • 1991
  • 본 논문은 한글 문자 패턴을 인식하기 위하여 쉐이프 패턴을 대상으로 한글의 구조적 정보를 이용한 새로운인식 방법에 대해서 연구하였다. 먼저, 입력된 데이타에 대하여 문자의 위치를 알기 위하여 문자 영역의 블럭화를 행하였고, 둘째로 한글의 무게 중심을 이용한 종모음의 유무를 결정하고, 횡모음과 짧은 기둥의 위치와 길이 조사 및 종정의 존재 여부를 조사하여 한글이 가지는 6가지의 기본 구조로 형식 분류를 하였으며, 마지막으로 분류된 형식에 따라 각각의 자소에 대해 유크리드 기리(Uclid distance)에 의한 탬플레이트 매칭(template matching)을 실행하여 인식을 행하였다. 본 연구는 실험을 통하여 총 2350자의 문자에 대하여 98.3%의 형식 분류율과 95.2%의 한글 인식율을 얻었다.

  • PDF

낱자 인식기와 자소 조합 인식기를 혼용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Character and Combined-Grapheme Recognizers)

  • 장승익;임길택;김호연;정선화;남윤석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2003
  • 본 논문에서는 낱자 인식기와 자소 조합 인식기를 혼용한 저품질 인쇄체 한글의 고성능 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6형식과 기타 형식의 문자, 총 7종으로 분류한, 입력문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위(HRU: Hangul recognition unit)로 분리하여 인식한다. 각 인식 단위 영상에서 추출한 방향각 특징을 다층신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.80%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 23.61%의 오류가 감소한 것이다.

  • PDF

MACE 개념을 이용한 병렬 나무 구조로부터의 왜곡에 무관한 한글문자 인식 (Distortion-Invariant Korean Character Recognition With Parallel Tree Structure Using MACE Concept)

  • 유위경;김정우;도양희;김수중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.148-153
    • /
    • 1989
  • 본 논문에서는 광 상관기 (optical correlator) 에 의한 한글문자 분리 인식의 한 방법을 제안하였다. 효율적인 분리 인식을 위해서 병렬 나무 (tree) 구조로부터 입력 신호를 두 방향으로 병렬 처리하여 각 방향으로 자음과 모음을 따로 분리시켜 2단계 만에 인식한 뒤 이들을 위치에 따라 조합하여 문자 분리 인식하도록 하며, 아울러 이러한 병렬 나무구조의 각 단계에서 필터 합성시 MACE (minimum average correlation energy) 개념을 이용하여 광 상 관평면상에서 부엽의 문제를 줄이고, 실제 광 시스템에서 생길 수 있는 왜곡을 학습표본에 포함하여 광 상관기 시스템에 의한 실질적인 한글 문자의 왜곡에 무관한 분리인식을 하도록 하였다.

  • PDF

필기체 인식을 위한 한글 자소분리 (A Hangul Element Separation for the Hand-written Character Recognition)

  • 백남우
    • 한국ITS학회:학술대회논문집
    • /
    • 한국ITS학회 2004년도 제3회 정기총회 및 추계학술대회
    • /
    • pp.208-211
    • /
    • 2004
  • 본 연구는 필기체 한글 문자를 인식하기 위하여 한글 문자구조를 6개 기본구조로 분류한다. 각각의 한글 자음과 모음을 7-세크먼트, '/'(Left-Incline), '$\backslash$'(Right-Incline), '-'(Left-Right), '$\mid$'(UP-Down), 'c'(Circle), 'ㄱ'(Right-down), 'ㄴ'(Down-Right) 분리한다. 분리된 7-세크먼트에 대해 한글이 쓰여지는 위치에 따라 8개의 기본구조로 정의하여 세크먼트를 분리하여 레벨화한다. 따라서 본 연구는 문자를 자소(자음과모음)로 하여 7-세크먼트로 분리하는 필기체 자소분리 구조를 제시한다.

  • PDF

획기반 필기한글 문자분할 (Handwritten Hangul Character Segmentation Based on Stroke Extraction)

  • 김호연;김두식;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.593-596
    • /
    • 2001
  • 본 논문에서는 획기반 필기한글 문자분할 방법을 제안하고 이를 한글단어인식에 적용하였다. 제안된 방법에서는 획 단위의 문자분할을 시도함으로써 불필요한 분할점을 줄일 수 있었을 뿐 아니라 문자간 획의 접촉이나 겹침을 해결할 수 있었다. 실험에서는 이를 단어인식에 적용하여 비교적 높은 인식률을 얻음으로써 제안된 방법의 가능성을 입증하였다. 실험에서 이용한 문자인식기의 성능이 낮음에도 불구하고 비교적 높은 단어인식률을 얻을 수 있었던 것은 의미 있는 획 단위의 문자분할을 통해 불필요한 분할 가능성을 줄였고, 단어사전을 이용함으로써 사전정보를 충분히 활용할 수 있었기 때문이다.

  • PDF

낱자 특징 기반 자소 인식기를 이용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Grapheme Recognizer)

  • 장승익;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.351-354
    • /
    • 2004
  • 본 논문에서는 낱자에서 추출한 특징을 입력으로 사용하는 자소 인식기를 이용한 저해상도 인쇄체 한글 영상의 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6 형식과 기타 형식의 문자, 총 7 종으로 분류한 뒤, 입력 문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위로 구분하여 인식한다. 각 HRU는 낱자에서 추출한 방향각 특징을 입력으로 사용하는 다층 신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층 신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.99%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 15.83%의 오류가 감소한 것이다.

  • PDF