• Title/Summary/Keyword: 한글 문자 인식

Search Result 325, Processing Time 0.023 seconds

Post-processing of Hangul Recognition for Discriminating Pairs of Characters (유사 문자쌍을 구분하기 위한 한글 인식의 후처리)

  • Jang, Seung-Ick;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.388-393
    • /
    • 2001
  • 유사한 형태의 필기 한글 문자쌍은 한글 인식 시 발생하는 오류의 많은 부분을 차지한다. 이는 유사한 문자들의 작은 차이를 인식기가 충분히 반영하기 어렵기 때문이다. 본 논문에서는 최근 주목 받고 있는 Support Vector Machine을 이용해 유사한 문자쌍을 검증하는 한글 인식 후처리 방법을 제안한다. 제안하는 방법은, 대부분의 문자 유사쌍이 한 두개의 자모만이 상이한 점에 착안하여 자모 단위로 문자 유사쌍을 구분한다. 기존 랜덤그래프를 이용한 한글 인식기를 이용하여 자모 분할을 수행하고, Support Vector Machine을 이용하여 분할된 결과를 검증한다. 제안한 방법은 유사쌍 구분에 중요한 자모만을 선택적으로 고려하여, 기존 한글 인식기의 부족한 점을 보완한다. 실험 결과, 자주 혼동되는 문자쌍들의 인식 오류가 정정되는 것을 볼 수 있었으며 그에 따라 한글 인식의 전체 성능이 향상되었다.

  • PDF

A Study on an On-line Handwritten Hangul Character Recognition by Identifying Relative Positions of Strokes (획 상대 위치 판별을 통한 온라인 필기체 한글 문자 인식에 관한 연구)

  • 정진국;김수인;남궁재찬
    • The Journal of Information Technology and Database
    • /
    • v.4 no.2
    • /
    • pp.65-78
    • /
    • 1998
  • 본 논문에서는 획 상대위치 판별을 통한 온라인 필기체 한글 문자 인식에 관하여 연구하였다. 한글을 구성하는 획을 인식하기 위하여 각 획의 시작부분과 끝부분의 방향코드를 이용하였으며, 인식된 획들을 바탕으로 각 획들간의 상대위치 정보를 이용하여 자소를 인식하였다. 온라인 필기체 한글의 경우 획의 모양과 크기가 필기자에 따라 불규칙하게 변하므로 획의 모양보다는 획의 위치를 인식에 더 중요한 자료로 삼아 인식을 행하였다. 6,000자의 온라인 필기체 한글 문자에 대하여 실험한 결과, 문자당 평균인식속도 0.034초, 획 인식률 92.3%와 문자 인식률 94.6%를 보였다. 본 실험의 결과로서 온라인 필기체 인식시스템을 구성함에 있어서 획의 시작 부분과 끝부분의 진행방향이 획인식의 중요 요소임과 획들간의 상대적 위치가 한글 문자 인식에 있어서 중요한 요소임을 밝혔다.

Study on Hangul Character Region Detection in Natural Images (자연영상에서 한글문자 영역 검출에 관한 연구)

  • Bak, Jong-Cheon;Gwon, Gyo-Hyeon;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11a
    • /
    • pp.430-433
    • /
    • 2010
  • 최근 모바일 기기로 획득된 영상을 이용한 다양한 분야의 연구가 활발히 진행되고 있으며, 스마트폰의 보급이 확대되면서 증강현실을 지원하고자 자연영상으로부터 문자정보를 추출 및 인식하여 이미지 검색을 가능하도록 하는 많은 연구도 진행되고 있다. 자연영상에서 한글문자 영역 검출은 한글문자 인식을 위한 전단계로서 다양한 환경에 노출된 문자영역을 정확히 검출하는 것이 인식 성능을 결정함으로 중요한 전처리 단계이다. 본 연구는 한글문자 영역의 에지 및 지역적 연결요소 성분 특징을 이용하여 한글문자 영역을 검출하는 방법을 제안한다. 에지 및 연결요소 성분의 특징을 검출하고, 그 결과를 레이블화하고 이를 분석함으로서 한글문자 후보 영역을 검출한다. 검출된 후보영역은 검증과정을 수행하여 최종적인 한글문자 영역을 추출한다. 제안한 방법은 다양한 환경에서 얻어진 자연영상을 대상으로 실험한 결과, 에지 및 연결요소 성분의 두 가지 특징을 결합함으로서 한글 문자영역 검출의 정확도를 향상하였다.

  • PDF

Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints (문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식)

  • Kang, Kyung-Won;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks (다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식)

  • Lim, Kil-Taek;Kim, Ho-Yon;Nam, Yun-Seok
    • The KIPS Transactions:PartB
    • /
    • v.10B no.7
    • /
    • pp.777-784
    • /
    • 2003
  • In this Paper. we propose a recognition method of machine printed characters based on the combination of recognition units using multiple neural networks. In our recognition method, the input character is classified into one of 7 character types among which the first 6 types are for Hangul character and the last type is for non-Hangul characters. Hangul characters are recognized by several MLP (multilayer perceptron) neural networks through two stages. In the first stage, we divide Hangul character image into two or three recognition units (HRU : Hangul recognition unit) according to the combination fashion of graphemes. Each recognition unit composed of one or two graphemes is recognized by an MLP neural network with an input feature vector of pixel direction angles. In the second stage, the recognition aspect features of the HRU MLP recognizers in the first stage are extracted and forwarded to a subsequent MLP by which final recognition result is obtained. For the recognition of non-Hangul characters, a single MLP is employed. The recognition experiments had been performed on the character image database collected from 50,000 real letter envelope images. The experimental results have demonstrated the superiority of the proposed method.

조응구조의 지시사상 (mapping) 이론

  • Park, Yeong-Gyu
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.199-199
    • /
    • 1990
  • 입력된 문서 영상으로부터 분리 추출된 문자 영상을 올바르게 인식하는 것은 문서 인식에서 가장 핵심적인 부분이다. 스캐너를 통해 입력되고 분리된 실제의 문자 영상은 많은 문제점들을 가지고 있다. 한글의 경우 이 중 개별 문자 영상내의 각 자소간의 접촉은 올바른 인식을 저해하는 주요한 원인이다. 이런 접촉의 문제를 효율적으로 해결하기 위해 한글의 구조적 특성을 지닌 "방향 필터"를 정의하고, 이것을 이용하여 세선화된 문자 영상을 추적하면서 선소들을 뽑아낸다. 이렇게 하여 얻은 선소들과 선소들간의 지식을 조합하여 한글자소 획을 추출케 되고 결국에는 이런 획의 조합을 통해 문자 영상을 인식하는 방법을 제안한다.

  • PDF

Off-Line Recognition of Unconstrained Handwritten Korean Words using Over-Segementation and Lexicon Driven Post-Processing Techniques (과다 분리 및 사전 후처리 기법을 이용한 한글이 포함된 무제약 필기 문자열의 오프라인 인식)

  • Jeong, Seon-Hwa;Kim, Su-Hyeong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.5
    • /
    • pp.647-656
    • /
    • 1999
  • 본 논문에서는 오프라인 무제약 필기 한글 단어를 인식하기 위한 시스템을 제안한다. 제안된 단어 인식 시스템은 크게 다석가지 모듈-문자 분리,조합행렬생성, 특징 추출, 문자인식, 사전 후처리 -로 구성되어 있다. 문자 분리 모듈은 입력된 단어 영상을 하나의 문자보다 더 작은 이미지 조각으로 과다 분리하며 , 조합 행렬 생성모듈에서는 동적 프로그래밍 기법을 이용하여 분리된 이미지 조각들로부터 사전상의 모든 단어들과 대응되는 가능한 모든 조합을 생성한다. 문자인식모듈은 각 그룹에 대하여 일괄적으로 얻어진 특징과 유니그램을 이용하여 문자인식을 수행한다. 마지막으로 사전 후처리 모듈에서는 각 그룹에 대한 문자인식 결과와 단어 사전을 사용하여 입력단어에 대한 최종 인식 결과를 도출한다. 본 문에서 제안한 방법은 문자 분리, 문자 인식 및 후처리를 상호 보완적으로 결합함으로써 한글이 포함된 무제약 필기 문자열을 효과적으로 인식할 수 있다. 제안된 시스템의 성능을 평가하기 위하여 실제 우편 봉투 상에 쓰여진 필기 한글 단어 200개를 대상으로 실험을 하였다. 실험 결과 200개의 단어중 172개의 단어를 정인식하여 86%의 정확도를 얻을 수 있었으며 나머지 28개의 오인식된 단어들을 분석한 결과 대부분의 오류는 문자 인식기의 낮은 신뢰도 때문임을 알 수 있었다. 또한, 하나의 단어를 인식하기 위하여 약 2초가 소요되었다.

Multi-font/multi-size Hangul Character Recognition with Hierarchical Neural Networks (계층적 신경망을 이용한 다중크기의 다중활자체 한글문자인식)

  • Gwon, Jae-Uk;Jo, Seong-Bae;Kim, Jin-Hyeong
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.183-190
    • /
    • 1990
  • 본 논문에서는 인쇄체 한글문자를 실용적으로 인식하기 위하여 고안된 계층적 신경망을 소개하고, 이를 다중활자체의 한글문자를 인식하는 문제에 적용하였다. 이 신경망은 입력된 문자영상을 6가지의 유형으로 분류한 후, 해당 유형을 처리하는 신경망에서 실제 문자를 인식하도록 구성되었다. 또한 각 신경망을 모든 입력영상의 모든 출력노드에 대해 고르게 학습시키기 위하여 Backpropagation 알고리즘을 개선한 Descending Epsilon 알고리즘을 도입하였다. 그 결과 사용빈도수가 높은 한글 520자에 대해 94.4 - 98.4%의 인식률을 얻음으로써 본 논문에서 제안한 시스템이 다양한 활자체로 이루어진 실제 문서인식시스템의 문자인식부에 효과적으로 사용될 수 있음을 제시하였다.

  • PDF

A Study on Character Recognition using Connected Components Grapheme (연결성분 자소를 이용한 문자 인식 연구)

  • Lee, Kyong-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.157-160
    • /
    • 2017
  • 본 연구에서는 한글 문자 인식을 수행하였다. 한글 인식을 수행하되 고딕 인쇄체 문자를 대상으로 하였고, 자소 단위 인식을 통한 인식을 수행하되 기존 한글 문자 인식 연구에서 사용하는 자음과 모음 단위의 자소가 아닌 연결성분을 이용하여 인식하는 새로운 자소를 이용하였다. 새로운 자소들은 끝점, 2선 모임점, 3선 모임점, 4선 모임점의 특징을 추출하고 특징에 의해 자소를 인식하는 데이터베이스를 구성하여 자소를 인식하게 하였다. 또한 연결 성분을 반영한 새로운 자소로 고딕 인쇄체 문자를 인식하므로 추출된 자소를 6가지로 분류하였고, 6가지 자소에 의해 구성되는 92가지 문자 구조를 제안하고 이에 따른 문자를 데이터베이스를 구축하였고, 자소의 무게 중심을 이용한 분포를 이용하여 제안된 구조를 통하여 데이터베이스를 이용한 문자인식을 수행하였다.

  • PDF

The Recognition of The Korean Characters Using The Weighted Pattern Cluster (가중치 패턴 클러스터를 이용한 한글 문자 인식)

  • 김도형;이선화;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.319-321
    • /
    • 2001
  • 본 논문에서는 스캐너로 입력된 한글 문서 영상에서 한글 문자를 인식하는 방법을 제시한다. 입력된 한글 문자를 한글의 구조적 특징에 따라 6개의 유형으로 분리하고, 각 유형에서의 모음의 형태학적 특징에 근거하여 모음을 인식한다. 각 유형에서의 자음의 인식을 위해서 가중치 패턴 클러스터를 생성하고 생성된 클러스터와 원영상간의 유사도 측정을 통해 자음을 인식하게 된다. 오인식 가능성이 있는 자음은 오인식 교정을 위한 세부 유사도 매칭과정을 통해 최종적으로 인식된다. 제안하는 알고리즘을 바탕으로 실험한 결과 스캐너로 입력받은 상용 한글 문자 14,983자에 대해 최종 95.68%의 인식률을 보였으며, 차후 정형화된 한글 문서 인식 시스템에 응용될 수 있을 것이다.

  • PDF