• 제목/요약/키워드: Handwritten Character Recognition

검색결과 81건 처리시간 0.026초

Hough Transform과 부분 그래프 패턴을 이용한 한글 인식에 관한 연구 (A Study on the Hangul Recognition Using Hough Transform and Subgraph Pattern)

  • 구하성;박길철
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.185-196
    • /
    • 1999
  • 본 논문에서는 부분 그래프 패턴과 신경망을 이용한 새로운 한글 오프라인 인식 시스템을 제안하였다. 문자를 입력으로 받아 세선화를 행한 후 위치에 관한 잡음 제거 기능을 갖는 균형화를 수행하고 인식단의 첫번째 단계에서 순환 성분을 추출하고 인식한다. 부블럭 HT 공간에서 끝점, 굴곡점, 분기점의 특징점을 추출하고 추출된 특징점 사이의 관계를 조사하여 부분 그래프 패턴을 구성한다. 종모음이 올 수 있는 구역을 할당하고 종모음 후보점을 추출하여 미리 조사된 부분 그래프 패턴 사전과 비교하여 종모음을 추출한다. 같은 방법으로 횡모음을 추출한 후 간단한 구조 해석적 방법으로 모음을 인식한다. 본 논문의 성능비교를 위하여 실험은 활자체의 경우 가장 많이 쓰이는 명조체와 고딕체 그리고 필기체를 대상으로 한다. 고딕체의 경우 인식율 98.9%, 명조체의 경우 인식율 98.2%, 필기체의 경우 92.5% 이었다. 다중 자형 인식을 위하여 필기체와 활자체의 구분 없이 구한 전체 시스템의 인식율은 94.8% 이었다.

  • PDF

규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식 (Handwritten Korean Amounts Recognition in Bank Slips using Rule Information)

  • 지태창;이현진;김은진;이일병
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2400-2410
    • /
    • 2000
  • 한글 인식에 관한 기존의 연구는 한글 낱자 인식에 치우쳐 왔고, 실제 문서 인식 시스템 개발을 위한 연구는 거의 이루어지지 않았다. 그래서, 본 논문에서는 인식된 문자열의 오류 교정에 관한 연구로서 한글 금액열 인식기를 개발하였다. 한글 낱자 인식에서 문제가 되는 부분은 데이터의 방대함 때문에 발생한다. 컴퓨터상에서 표현될 수 있는 한글 낱자의 개수는 2000여 자 이상이다. 따라서, 기존의 연구들은 이러한 문제점을 해결하기 위해서 실생활에서 많이 쓰이는 낱자에 대해서만 실험을 했다. 하지만, 실험 대상 낱자의 개수를 1000여 자 정도로 줄였어도, 여전히 80%대 이하의 저조한 인식률을 보이고 있다. 이렇게 인식률이 저조한 범용 한글 낱자 인식기를 한글 금액 인식이라는 제한된 상황에서 사용하는 것은 적합하지 않다. 따라서, 본 연구에서는 한글 금액에 사용되는 16자의 한글 낱자만 인식할 수 있는 인식기를 제안하였다. 제안한 한글 낱자 인식기는 통계적 인식기를 사용한 다중 인식기 형태로 만들었고, 이를 통해 개별적인 특징으로 인한 인식률의 저하를 방지할 수 있다. 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액에 대한 구조적인 규칙 정보를 이용하였다. 이 규칙을 이용하여 한글 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액애 대한 구조적인 규칙 정보를 이용하였다. 이규칙을 이용하여 한글 금액의 인식 단위에 대한 인식 결과의 오류 보정을 할 수 있다. 실험 결과 제안한 한글 낱자 인식기의 1후보까지 인식률은 95.49%였고, 4후보까지 인식률은 99.72%였다. 그리고, 후처리기의 처리를 거친 금액열에 대해서는 신뢰도가 96.42%였다. 본 논문에서는 사용된 낱자의 개수가 적고, 구조안에 규칙 정보가 존재하는 한글 문자열의 경우에 제한된 글자를 인식하는 낱자 인식기와 오류를 교정할 수 있는 후처리기로 문자열 인식의 신뢰도를 향상시킬수 있는 방법을 제안하였다.

  • PDF

오프라인 필기체 전표용 한글 인식을 위한 부분 연결 다층 신경망과 결합 (Partially Connected Multi-Layer Perceptrons and their Combination for Off-line Handwritten Hangul Recognition)

  • 백영목;임길택;진성일
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.87-94
    • /
    • 1999
  • 본 논문은 필기체 한글인식에 적합한 모듈화된 부분연결 다층신경회로망 구조를 제안한다. 세가지 특징 벡터들에 대한 세 개의 부분연결 다층신경회로망 인식기를 구성하고 이를 통합하기 위한 또 하나의 부분연결 신경회로망을 결합시킴으로써 인식률을 높일 수 있도록 설계하였다. 각각의 부분연결 다층신경회로망은 한글의 이차원적 특징을 잘 반영할 수 있도록 입력층을 10개의 수용영역으로 분할하고 입력층과 은닉층 사이를 부분 연결하였다. 결합단계에서 새로운 부분연결 신경회로망을 도입하고, 그 입력으로 이미 학습된 세 개 인식기의 은닉층 출력을 이용하여 재학습한다. 제안된 인식기의 성능을 평가하기 위해서 전표처리에 많이 사용되는 한글 문자 18개를 선정하여 평가하였다.

  • PDF

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF

역전파 알고리듬과 사전을 이용한 필기체 영문자 인식 (A Recognition of Handwritten English Characters Using Back Propagation Algorithm and Dictionary)

  • 김응성;조성환;이근영
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.157-168
    • /
    • 1993
  • 본 논문에서는 역전파 알고리듬으로 학습된 신경회로망과 사전을 이용하여 필기체 영문자 인식을 수행하였다. 스캐너를 이용하여 입력된 영상화일로부터 불필요한 데이터 부분을 제거하고 문자의 다양성을 최소화하기 위해서 여러가지 전처리과정, 즉 문자분리, 중심변환, 잡음제거, 배율조정과 세선화과정을 거쳤다. 다음으로 세선화된 문체 패턴으로부터 문자의 특징이 추출되고, 신경회로망에 시험데이터에 대한 특징들을 학습시켰다. 그리고 테스트할 영문자에 대해서도 특징들을 추출하여 이미 학습된 신경회로망에 의해 분류하였다. 마지막으로 학습시간을 줄이고 인식율을 향상시키기 위한 방법과 학습시간과 은닉층의 노드수에 대해 고찰하였다. 실험 결과로서 이와 같은 시스템으로 필기체 영문제에 대하여 학습후에 약 93%의 높은 인식율을 얻을 수 있었을 사전을 이용했을 경우 인식율이 약 97%였다.

  • PDF

연결요소 분석에 기반한 인쇄체 한글 주소와 필기체 한글 주소의 구분 (Classification of Handwritten and Machine-printed Korean Address Image based on Connected Component Analysis)

  • 장승익;정선화;임길택;남윤석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.904-911
    • /
    • 2003
  • 본 논문에서는 우편봉투 상에 기입된 인쇄체 한글 주소와 필기체 한글 주소를 효과적으로 구분할 수 있는 방법을 제안한다. 문자인식 모듈을 포함하는 각종 응용 시스템에서 입력 영상이 인쇄체인지 필기체인지 구분하는 것은 매우 중요하다. 이는 대부분의 경우 인쇄체 영상과 필기체 영상이 갖는 특징이 상이하여, 각 영상에서의 문자 및 문자열 분리 방법, 문자 인식 방법 둥이 매우 상이하게 개발되기 때문이다. 본 논문에서 제안한 구분 방법은 연결요소 추출 및 병합, 특징 추출, 영상 구분 순으로 수행된다. 연결요소 추출 및 병합 단계에서는 입력영상으로부터 연결요소를 추출한 후 일부 연결요소들에 대하여 병합을 시도하며, 특징 추출 단계에서는 병합결과 얻어진 연결요소들의 그룹들로부터 폭과 위치에 관련된 특징을 추출하고, 영상 구분 단계에서는 추출한 특징을 입력으로 제공받는 다충퍼셉트론을 사용하여 구분을 시도한다. 제안한 방법의 우수성을 증명하기 위해 실제 우편물로부터 추출된 3,147개의 한글 주소 영상을 사용하여 실험한 결과, 98.85%의 구분률을 보여주었다.

다중 인식기의 다단계 결합을 통한 무제약 필기숫자 인식 (Unconstrained Handwritten Numeral Recognition using Multistage Combination of Multiple Recognizers)

  • 이관용;백종현;변혜란;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.93-93
    • /
    • 1999
  • Researches on digit recognition have been conducted actively for a long time because the classes to recognize are much fewer than other character sets and because it is very likely thatthe digit recognition can be applied to many problems in real world, The recent studies on designingrecognition system with high performance are in progress with two different aspects. One is toconstruct a recognizer using several features at the same time, and the other is to use severalrecognizers. In this paper, we propose a multistage combination method to recognize the unconstrainedhandwritten numerals. The method is a two-stage combination method which uses multiplecombination methods at the same time unlike the existing methods with only one combination method.The recognizers are first combined by several combination methods of different classes simultaneously,and then the results of them are combined by another combination method to generate a final result.Five recognizers and eight combination methods are used in the proposed system. The experimentalresults showed that the recognition rates on CENPARMI and CEDAR data were 97.75% and 98.6%,respectively and the recognition performance could be improved as the process passed through stages,We could get the best performance by combining the combination methods of different classes, whichmeans there are a complementary relation among them, The proposed method can be considered asan extended version of the existing combination methods.

유닛 재구성 방법을 이용한 PDA용 온라인 필기체 한자 인식 (On-line Handwriting Chinese Character Recognition for PDA Using a Unit Reconstruction Method)

  • 진원;김기두
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.97-107
    • /
    • 2002
  • 본 논문에서는 PDA용 온라인 필기체 한자 인식기를 구현하였다. PDA는 PC보다 느린 CPU와 적은 메모리를 사용하기 때문에, 본 논문에서는 적은 연산량과 적은 메모리를 사용하면서 높은 인식률을 갖는 인식기를 개발하는데 초점을 맞추었다. 따라서, 빠른 인식을 위하여 적은 연산 과정을 갖는 인덱스 매칭 방법을 사용하였고, 필기 한자의 획순 변동과 획수 변형을 수용함과 동시에, 문자 모델의 저장을 위한 메모리를 최소화하기 위하여 유닛 재구성 방법을 제안하였다. 사전에 정의된 유닛을 사용하여 1800개의.표준 문자 모델을 설정하였다. 입력된 데이터는 전처리 및 특징 추출 과정을 거친 후 표준 문자 모델과의 획수 및 형태적 특징을 기준으로 선정된 후보 문자들과의 유사도를 측정한다. 실험 대상 문자는 중·고등학교 표준 기초 한자 1800자를 대상으로 하였으며, 획수와 획순에 구애받지 않고 정서체로 필기한 5인의 문자 셀을 사용하였다. 실험은 문자 당 평균 인식 속도와 인식률을 측정하였으며, 이 결과 문자 셀에 대한 평균 인식률 94.3%를 얻었다. 문자 당 평균 인식 속도는 MIPS R4000 CPU를 사용한 PDA에서 0.16 초의 결과를 내었다.

2차원 웨이브렛 패킷에 기반한 필기체 문자인식의 특징선택방법 (A Feature Selection for the Recognition of Handwritten Characters based on Two-Dimensional Wavelet Packet)

  • 김민수;백장선;이귀상;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권8호
    • /
    • pp.521-528
    • /
    • 2002
  • 본 논문에서는 문자인식의 특징선택방법으로 2차원 웨이브렛 패킷을 이용하는 새로운 방법을 제안한다. 영상자료의 특징들로부터 중심특징을 선택하기 위한 차원축소 기법으로 주성분분석 기법이 주로 사용된다. 하지만, 주성분분석 기법은 고유시스템에 의존하기 때문에, 이상치나 잡음 등에 민감할 뿐만 아니라, 전역적 특징만을 선택하는 경향이 있다. 때때로, 영상자료의 중요한 특징이 가장자리 부분이나 뽀족한 부분 같은 지역적 정보일 수 있다. 이러한 경우, 주성분분석 기법은 좋은 결과를 줄 수 없다. 또한 고유시스템은 많은 계산시간을 요구한다. 본 논문에서 원 자료는 2차원 웨이브렛 패킷기저에 의해 변환되고, 최적 판별 기저가 탐색된 후, 그것으로부터 적절한 특징이 선택된다. 주성분분석 기법과 비교하여, 제안된 방법은 웨이브렛의 좋은 특성에 의해 전역적 특징뿐만 아니라 지역적 특징의 선택이 빠른 계산시간으로 이루어진다. 제안된 방법의 성능을 보이기 위해 PCA와 제안된 방법의 인식률의 실험결과가 분석되었다.

Rum-Length code를 이용한 제약없이 쓰여진 한글 필기체 주소열 분할 (An Approach to Segmentation of Address Strings of unconstrained handwritten Hangul using Run-Length Code)

  • 김경환;윤정석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.813-821
    • /
    • 2001
  • 대부분의 문자 인식기들이 인식대상영상이 인식단위로 분할되어있다는 가정아래 개발되고 있으나, 실제 필기한글의 분할에 대한 연구는 미미한 실정이다. 본 논문은 Run-length code를 이용한 능동적인 한글 분할방법을 제시한다. 전처리와 인식단위 분할에 응용할 수 있는, 한글의 구조적 특성을 반영한, 기울기 보정 알고리즘을 제안하고, 필기자들이 일반적인 필기 습관과 한글이 갖는 2차원 구조의 특성을 반영하면서 문자의 접촉점을 적극적으로 찾아내기 위한 기초 함수들과 접촉점들의 분류 방법을 제시한다. 임의의 필기자로부터 수집한 필기 한글 주소열 데이터를 이용해 수행한 실험을 통해, 초과분할을 포함하여, 88.2%의 접촉 문자들을 분리할 수 있었다.

  • PDF