• Title/Summary/Keyword: Handwritten Character Recognition

검색결과 81건 처리시간 0.027초

테이블-탑 디스플레이 기반의 온라인 필기 문자인식을 위한 전처리 기법 (Preprocessing Techniques for On-Line Handwritten Character Recognition based on Table-Top Display)

  • 김지웅;김의철;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.171-174
    • /
    • 2007
  • 최근에 인간과 컴퓨터의 상호작용을 위한 입력장치 중 테이블-탑 디스플레이라는 멀티터치 입력장치가 활발히 연구되고 있다. 본 논문에서는 테이블-탑 디스플레이라는 환경에서 인간에게 가장 직관적인 도구인 손을 사용하여 입력된 온라인 필기 숫자를 전처리하는 방법을 제안한다. 테이블-탑 디스플레이 환경에 적합한 전처리 기법으로 대표점 추출을 위한 거리 필터링과 획 구분 및 잡음제거 등을 사용하였고, 데이터를 16방향 체인코드로 변환하였다. 이는 실제 필기운동 시의 궤적을 크게 왜곡 시키지 않으면서 테이블-탑 디스플레이가 갖는 환경에 기인한 잡음을 없애고, 데이터양을 줄일 수 있는 장점이 있다. 총450개의 필기 숫자 데이터를 사용하여 실험한 결과, 잡음이 제거되고 데이터양이 줄어들었으며 인식에 용이한 체인코드를 형성해 내었다.

  • PDF

로버스트 다층전방향 신경망을 이용한 패턴인식 (Pattern Recognition using Robust Feedforward Neural Networks)

  • 황창하;김상민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.345-355
    • /
    • 1998
  • 다층전방향 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있으나 이 알고리즘은 긴 훈련시간, 극소점 문제, 이상치에 민감하다는 단점을 가지고 있다. 한편 실제문제에서는 많은 경우에 자료에 과대오차와 이상치가 포함되게 된다. 따라서 과대 오차에 민감하지 않고, 이상치의 영향을 최소화시키는 로버스트 역전파 알고리즘의 필요성이 대두되었다. 본 논문에서는 기존의 두종류의 로버스트 역전파 알고리즘을 이론적으로 비교하고 비선형 회귀 함수추정과 문자인식과 같은 패턴인식 문제에 적용하여 실험결과를 분석한다. 그리고 향후 연구과제로 신경망 학습을 위해 베이지안 기법의 사용을 제안한다.

  • PDF

이웃 각도 히스토그램 및 변형된 하우스도르프 거리를 이용한 'ㅁ', 'ㅇ' 자소 인식 (The Recognition of Grapheme 'ㅁ', 'ㅇ' Using Neighbor Angle Histogram and Modified Hausdorff Distance)

  • 장원두;김하영;차의영;김도현
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.181-191
    • /
    • 2005
  • 한글 문자 인식에 있어서 ' ㅁ '과 ' ㅇ '의 오인식은 전반적인 인석성능의 저하를 가져오는 요소가 되고 있으나 이에 대한 연구가 미흡한 실정이다. 따라서, 본 논문에서는 'ㅁ'과 'ㅇ'을 효과적으로 인식하기 위한 새로운 특징 추출 방법을 제안하였다. 제안하는 방법은 변형된 하우스도르프 거리를 이용한 최적의 이웃 반경을 설정하고, 이 반경에 의해 이웃 픽셀과의 각도를 추출하여 두 자소를 구분하는 특징으로 사용하였다 실험을 통하여 분석한 결과 제안하는 특징 추출 방법은 기존의 방법들보다 적은 특징 개수를 사용하여 효율적으로 패턴을 인식할 수 있었으며 우수한 일반성 및 안정성을 나타내었다.

  • PDF

오프라인 필기체 한글 자소 인식에 있어서 특징성능의 비교 (Comparison of Feature Performance in Off-line Hanwritten Korean Alphabet Recognition)

  • 고태석;김종렬;정규식
    • 인지과학
    • /
    • 제7권1호
    • /
    • pp.57-74
    • /
    • 1996
  • 본 논문에서는 근래의 필기체 한글인식에서 상요되고 있는 특징들의 인식 성능을 비교한다.본 연구는 인식률 뿐만 아니라 인식시스템의 효율성을 향상시키기 위한 특징 선택의 기반을 마련함에 그 목적이 있다.특징성능 비교를 위해 그 특징들의 특성들을 분석하였고,그 특성에 따라 특징들을 전역적 특징(영상변환,통계적 특징,지역/위상적 특징의 3가지 종류로 분류하였다.각 종류별로 한글 자소 특징을 나타내는데 적합한 특징들을 4-5가지씩 선정하였고,인식실험을 한글의 초성자음,횡모음,종모음별로 수행하였다. 실험에 사용된 인식기로는 오류역전파 알고리즘으로 학습된 은닉층이 하나인 다층 퍼셉트론이 사용되었다.실험에 사용된 학습 및 시험용 데이타는 PE92중 30벌이다.실험결과를 보면,1)지역/위상적 특징들이 다른 종류의 특징들보다 인식 성능이 우수하였으며,2) 통계적 특징 중에서는 망 특징과 투영특징이,전역적인 특징들 중에서는 왈쉬특징과 DCT특징이,지역/위상적 특징에서는 윤곽선 위상변화 특징과 오목성 특징이 각각 성능이 우수하였다.

  • PDF

PDA상에서의 한글 필기체 매칭 알고리즘 (A Hangul Script Matching Algorithm for PDA)

  • 조미경;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.684-693
    • /
    • 2002
  • 전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)등에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 매칭 알고리즘을 제안하고 구현하였다. 제안된 매칭 알고리즘은 입력된 데이터를 곡률(curvature)을 이용하여 기본획(primitive stroke)으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다. 제안된 매칭 알고리즘을 이용하여 다양한 실험을 하였으며 한글 스크립트로 구성된 경우 97.7%이상의 매칭률을 보여 주었고 한글 및 한자 흔합 스크립트에서는 94%이상의 매칭률을 보여 주였다.

수정된 Neocognitron을 사용한 필기체 한글인식 (Study on the Neural Network for Handwritten Hangul Syllabic Character Recognition)

  • 김은진;백종현
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.61-78
    • /
    • 1991
  • 본 논문은 역행 통로(backward path)를 가진 수정된 Neocognitron 을 한글 음절 인식을 위해 적용한 결과에 관한 것이다. Fukushima의 논문에서 Neocognitron이 $19{\times}19$ 크기의 필기체 숫자를 인식할 수있다고 논술하였다. 본 논문에서는 스캐너 또는 마우스를 이용하여 필기체 한글 문자 또는 그 일부의 $61{\times}61$ 영상을 입력하였다. 수정된 Neocognitron은 3쌍의 Us, Uc층으로 구성되어있다. 본 신경회로망에서 마지막 인식층인 Uc층은 $5{\times}5$ 크기의 세포로 된 24개의 명(plane)으로 구성되어 있는데, 각각의 세포들은 동시에 주의력(attention)을 받아들이느 자소(grapheme)의 존재와 입력층에서의 상대적 위치를 구별할 수 있다. 본 신경회로망은 10개의 단모음 자소, 14개의 단자음 자소와 그들의 공간적 특징을 가지고 학습시켰다. 쉽게 학습되지 않는 패턴들은 여러번 학습시켰다. 왜곡, 잡음, 크기변화, 변형, 회전 등을 갖는 개개의 자소를 분류할 수 있도록 학습된 신경망을 한글 음절의 인식을 위해 사용하였으며, 음절자내의 영상 분할 작업을 위해 선택적 주의력 기법을 사용하였다. 입력문자에 대한 초기 표본 실험에서 본 모형은 필기체 한글 음절자의 시험패턴중 79%를 정확하게 인식하였다. 이 연구결과는 Neocognitron이 입력 영상을 인식가능한 부분으로 분할함으로써 큰크기의 분자 집합을 갖는 필기체 문자를 인식할수 있는 강력한 모형임을 시사해준다. 똑같은 접근 방법이 구조나 자소가 아주 복잡한 한자의 인식에도 적용될 수 있다고 본다. 그러나, 모의실험에서 처리시간에 있어 매우 심한 병목현상을 보여 주었다. 모형의 실질적인 사용을 위해서는 신경칩으로서의 구현이 선결되어야 할 것이다. 또, 복모음, 복자음으로 구성된 한글 음절자 인식을 위하여 모형에 대한 더 깊은 연구가 수행되어질 필요가 있다. 두개의 단자모사이의 이웃지역을 정확히 인식하는 것은 이렇나 작업을 위해 매우 중요한 일이 될 것이다.

OCR 프로그램을 활용한 선박 항해일지 데이터 추출 모델 개발 (Development of a Ship's Logbook Data Extraction Model Using OCR Program)

  • 이다인;김성철;윤익현
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.97-107
    • /
    • 2024
  • 빠르게 발전하는 이미지 인식 기술에도 불구하고 표 형식의 문서와 수기로 작성된 문서를 완벽하게 디지털화하기에는 아직 어려움이 따른다. 본 연구는 표 형식의 수기 문서인 선박 항해일지를 작성하는 데에 사용되는 규칙을 이용하여 보정 작업을 수행함으로써 OCR 결과물의 정확도를 향상시키고자 한다. 이를 통해 OCR 프로그램을 통하여 추출된 항해일지 데이터의 정확성과 신뢰성을 높일 것으로 기대된다. 본 연구는 목포해양대학교 실습선 새누리호의 2023년에 항해한 57일간의 항해일지 데이터를 대상으로 OCR 프로그램 인식 후 발생한 오류를 보정하여 그 정확도를 개선하고자 하였다. 이 모델은 항해일지 기재 시 고려되는 몇 가지 규칙을 활용하여 오류를 식별한 후, 식별된 오류를 보정하는 방식으로 구성하였다. 모델을 활용하여 오류를 보정 후, 그 효과를 평가하고자 보정 전과 후의 데이터를 항차별로 구분한 후, 같은 항차의 같은 변수끼리 비교하였다. 본 모델을 활용하여 실제 셀 오류율은 약 11.8% 중 약 10.6%의 오류를 식별하였고, 123개의 오류 중 56개를 개선하였다. 본 연구는 항해일지 중 항해정보를 기입하는 Dist.Run부터 Stand Course까지의 정보만을 대상으로 수행하였다는 한계점이 있으므로, 추후 항해정보 뿐만 아니라 기상정보 등 항해일지의 더 많은 정보를 보정하기 위한 연구를 진행할 예정이다.

고속 필기 한글 주소 인식을 위한 낱자 인식 (Character Recognition for Fast Handwritten Korean Address Reading)

  • 정선화;임길택;송재관;남윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2001
  • 본 논문에서는 고속 필기 한글 주소 인식을 위한 낱자 인식기를 제안한다. 인식 대상은 우편번호 여섯 자리에 할당된 주소에 출현 빈도가 높은 필기 한글 469 자이다. 제안된 방법은 낱자 인식 기법을 채택하고 있으며, 인식률과 처리속도를 향상시키기 위하여 2 단계 인식 전략을 채택하였다. 인식기로는 다층퍼셉트론, 최소거리분류기, Subspace 방법을 고려한다. 다층퍼셉트론은 비교적 높은 인식률과 처리속도를 보유하지만 출력값이 확률이 아님으로써 후처리를 필요로 하는 시스템에서 사용하기 어렵다. 최소거리분류기는 간단한 알고리즘으로 처리속도가 높고 확률을 출력하는 장점을 갖지만 인식률이 낮아 활용되기 어렵다. 또한 Subspace 방법은 인식률이 높고 확률을 출력하지만 처리속도가 매우 느리다는 단점이 있다. 따라서 제안방법에서는 처리속도가 높은 인식기 - 다층퍼셉트론, 최소거리분류기 - 를 사용하여 선인식을 수행한 후, 이 결과를 활용하여 인식 대상을 제한한 후 Subspace 방법을 사용하여 정확하게 인식하는 전략을 도입함으로써, 높은 인식결과를 유지하면서 처리속도를 높이고 후처리에 적합하도록 하였다. PE92 데이터베이스를 사용하여 실험한 결과 제안방법이 한글 469 자에 대하여 비교적 높은 인식률과 처리속도를 갖음을 알 수 있었다.

  • PDF

딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구 (A Study on Improvement of Korean OCR Accuracy Using Deep Learning)

  • 강가현;고지현;권용준;권나영;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.693-695
    • /
    • 2018
  • 다음은 본 논문에서는 딥러닝을 통한 한글 OCR 정확도 향상을 제안한다. OCR은 인쇄되거나 손으로 쓴 문자를 광학적 방법으로 감지 인식하여 디지털로 인코딩하는 프로그램이다. 현재 가장 많이 쓰이는 tesseract OCR의 경우, 영문 인식의 정확도가 높다. 하지만 한글은 복잡한 구조에 비해 학습 데이터가 적어 정확도가 떨어진다. 따라서 이 연구에서는 이미지 프로세싱을 통해 원하는 이미지에서 글자 영역을 추출하고, 이를 학습 데이터로 활용한 딥러닝으로 한글 OCR의 정확도를 향상시키는 방법을 제안한다. 기존 영문과 숫자 및 몇 가지 언어에만 국한되어 발전해왔던 OCR을 다양한 언어에도 응용할 수 있을 것으로 기대된다.

  • PDF

기계학습 알고리즘 기반 하자 정보 관리 시스템 개발 - 공동주택 전용부분을 중심으로 - (A Developing a Machine Leaning-Based Defect Data Management System For Multi-Family Housing Unit)

  • 박다슬;차희성
    • 한국건설관리학회논문집
    • /
    • 제24권5호
    • /
    • pp.35-43
    • /
    • 2023
  • 공동주택 하자 분쟁의 증가와 함께, 하자관리의 중요성 또한 커지고 있다. 그러나 기존의 연구는 '공용 부분'에 초점을 맞추어 진행되었다. 또한 하자관리의 주체인 '관리사무소'를 위한 시스템 연구도 부족한 실정이다. 이는 관리사무소의 하자관리 능력의 부족과 관리 품질의 저하를 초래한다. 따라서, 본 논문에서는 관리사무소를 위한 기계학습 기반의 하자 정보 관리 시스템을 제안한다. OCR과 NLP 모듈을 사용하여 관리상의 불편한 점을 해소하는 것을 목표로 한다. OCR을 통해 수기로 작성된 하자 정보를 디지털 문서로 변환한다. 이후 언어모델을 이용하여 사용자가 지정한 양식과 함께 하자 정보를 재생성한다. 최종적으로 생성된 텍스트를 데이터베이스에 저장하고 이를 기반으로 통계적 분석을 실행한다. 이러한 일련의 과정을 통해, 관리사무소의 하자관리 역량을 향상할 수 있도록 돕고, 의사결정을 지원할 수 있을 것으로 기대한다.