• Title/Summary/Keyword: 글자 인식

Search Result 182, Processing Time 0.036 seconds

불균형 데이터 처리를 위한 과표본화 기반 앙상블 학습 기법 (Oversampling-Based Ensemble Learning Methods for Imbalanced Data)

  • 김경민;장하영;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권10호
    • /
    • pp.549-554
    • /
    • 2014
  • 필기체 낱글자 인식을 위해서 사용되는 데이터는 일반적으로 다수의 사용자들로부터 수집된 자연언어 문장들을 이용하기 때문에 해당 언어의 언어적 특성에 따라서 낱글자의 종류별 개수 차이가 매우 큰 특징이 있다. 일반적인 기계학습 문제에서 학습데이터의 불균형 문제는 성능을 저하시키는 중요한 요인으로 작용하지만, 필기체 인식에서는 데이터 자체의 높은 분산과 비슷한 모양의 낱글자 등이 성능 저하의 주요인이라 생각하기 때문에 이를 크게 고려하지 않고 있다. 본 논문에서는 이러한 데이터의 불균형 문제를 고려하여 필기체 인식기의 성능을 향상시킬 수 있는 과표본화 기반의 앙상블 학습 기법을 제안한다. 제안한 방법은 데이터의 불균형 문제를 고려하지 않은 방법보다 전체적으로 향상된 성능을 보일 뿐만 아니라 데이터의 개수가 부족한 낱글자들의 분류성능에 있어서도 향상된 결과를 보여준다.

순환신경망을 이용한 한글 필기체 인식 (Hangul Handwriting Recognition using Recurrent Neural Networks)

  • 김병희;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.316-321
    • /
    • 2017
  • 온라인 방식의 한글 필기체 인식 문제를 분석하고 순환신경망 기반의 해법을 모색한다. 한글 낱글자 인식 문제를 순서데이터 레이블링의 관점에서 서열 분류, 구간 분류, 시간별 분류의 세 단계로 구분하여 각각에 대한 해법을 살펴보며, 한글의 구성 원리를 고려한 해결 방안을 정리한다. 한글 2350글자에 대한 온라인 필기체 데이터에 GRU(gated recurrent unit)의 다층 구조를 가지는 서열 분류모델을 적용한 결과, 낱글자 인식 정확도는 86.2%, 초 중 종성 구성에 따른 6가지 유형 분류 정확도는 98.2%로 측정되었다. 유형 분류 모델로 획의 진행에 따른 유형 변화 역시 높은 정확도로 인식하는 결과를 통해, 순환신경망을 이용하여 순서 데이터에서 한글의 구조와 같은 고차원적 지식을 학습할 수 있음을 확인하였다.

상호활성화모형을 이용한 한글에서의 글자우월효과 특성 분석 (Analysis of Character Superiority Effects of Korean characters using Interactive Activation Model)

  • 박창수;방승양
    • 인지과학
    • /
    • 제11권2호
    • /
    • pp.69-78
    • /
    • 2000
  • 상호활성화모형은 원래 영어의 단어우월효과를 설명하기 위해서 개발되었다. 한글에서도 영어에서의 단어우월효과와 비슷한 현상이 존재함이 알려져 있다. 즉, 한글의 자소가 글자의 한 구성요소로 나타났을때가 자소 단독으로 나타났을 때보다 더 잘 인식된다는 것이다. 우리의 한글에서의 글자우월효과를 설명하기 위해서 기존의 상호활성화모형을 수정하였다. 그러나 한글에서의 글자우월효과는 글자의 유형에 따라 그 정도가 다양하게 나타난다는 사실이 보고된 바 있다. 특히 글자내에서 한 자소가 다른 자소들 사이에 둘러 쌓여 있을 때는 해당 자소가 글자의 맥락에 있다고 하더라도 인지하기 어렵다는 사실이 알려져 있다. 한글의 경우, 글자가 각 구성요소(자소)의 이차원적 구성이기 때문에 이런 특이한 현상이 발생한다고 추측해 볼 수 있다. 우리는 글자의 이차원적 형태에 중점을 두어 계산되어진 입력 자극의 가중치를 기존의 상호활성화모형에 도입하여 이러한 현상을 설명할 수 있었다.

  • PDF

템플릿 매칭을 이용한 자동차 에어백 부품의 각인 문자 인식 (Engraved Character Recognition of Automotive Airbag Part using Template Matching)

  • 김동현;구봉근;이해연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.859-861
    • /
    • 2015
  • 생산 기술이 발전함에 따라 제품의 생산량이 증가하고 컴퓨터 비전을 통한 제품의 양/불 판단 기술의 필요성이 증가하고 있다. 제품의 양/불 판단은 그 정확도가 중요하며, 동시에 빠른 검사를 위한 신속성이 요구된다. 기존 연구들에서 다양한 금속성 제품에 대한 양/불 판단과 각인된 글자에 대한 양/불 판단을 수행하는 연구가 지속되어 왔으나 자동차 에어백 부품 중 하나인 Upper Housing의 양/불을 판단하는 알고리즘은 부재하다. 본 논문에서는 Upper Housing에 대해 각인 문자의 양/불을 판정하는 알고리즘을 제안한다. 먼저 영상에서 기준점이 되는 원을 찾는 것부터 시작하여, 기준점을 기반으로 특정 각도로 회전시켜 미리 수집한 글자 이미지와의 템플릿 매칭을 통해 글자가 제대로 각인 되었는지를 판단한다. 실험에서는 에어백 부품에 대한 검사 장치에서 촬영한 동영상에 대하여 제안한 알고리즘을 적용하였고, 그 결과 높은 정확도로 글자를 검출할 수 있음을 확인하였다.

신중한 분류기와 학습 예제 가중치 조정을 이용한 차량번호판인식시스템의 인식성능 향상 방안 (Vehicle License Plate Recognition System Using the Cautious Classifier and the Weighted Instance Method)

  • 백남철;이상협;류광렬
    • 대한토목학회논문집
    • /
    • 제26권4D호
    • /
    • pp.549-551
    • /
    • 2006
  • 차량번호판인식시스템은 무인 카메라 등의 영상장치를 통하여 입력된 차량 이미지로부터, 차량번호판 정보를 읽어내는 시스템이다. 이러한 차량번호판인식시스템의 응용 시스템 중 과속차량 단속과 같은 일부 응용 시스템은 번호판의 글자나 숫자를 다른 글자나 숫자로 잘못 인식할 경우 심각한 문제를 발생시킬 수 있다. 이러한 문제를 피하기 위해 우리는 인식 결과에 대한 신뢰도가 낮은 경우 인식을 포기 또는 위임하는 '신중한 분류기(Cautious Classifier)'를 이용하여 인식시스템을 구성하였다. 또한 학습 예제의 가중치를 조정하는 방법을 사용하여 이러한 신중한 분류기의 성능을 향상시켰다.

증강현실을 이용한 한글의 색상 인식과 자소 패턴 분리 (Color Recognition and Phoneme Pattern Segmentation of Hangeul Using Augmented Reality)

  • 신성윤;최병석;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.29-35
    • /
    • 2010
  • 증강현실은 저렴한 장비의 보급으로 영상의 사용이 다양화 되면서, 실세계의 영상에 추가적인 이미지 및 영상을 출력할 수 있다. 최근 많은 증강현실 기법이 등장해 있으나 아직까지 정확한 문자 인식을 수행하지는 않고 있다. 본 논문에서는 시각적으로 글자로 표시된 마커를 인식하고, 마커의 글자의 색상과 일치하는 색을 찾아낸다. 그리고 그 글자를 인식하여 화면에 나타내 주는데, 본 논문에서는 수평 프로젝션에 의한 자소 패턴 분리 알고리즘을 적용하여 한글 표현의 6형식에 맞도록 자소를 분리하는 방법을 제시한다. 또한 증강 현실을 이용한 자소 패턴 분리를 실험 예제를 통하여 각 단계별로 진행되는 결과를 보여주었고, 실험 결과 검출률이 90% 이상임을 알 수 있었다.

전표 금액란에 나타나는 필기 한글의 신경망-기반 인식 (Neural Network-based Recognition of Handwritten Hangul Characters in Form's Monetary Fields)

  • 이진선;오일석
    • 한국산업정보학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-30
    • /
    • 2000
  • 한글은 부류수의 방대성과 글자간의 유사성으로 인해 인식이 어려운 문자 집합으로 간주되고 있다. 기존 연구 대부분은 일반적으로 사용되는 2,350 글자를 대상으로 인식을 시도하였는데, 이는 일반성을 제공하는 대신 낮은 성능 문제를 안고 있다. 이에 반해, 우편 영상이나 전표 영상 등의 특정 필드에 나타나는 한글만을 대상으로 하는 접근 방법이 보다 현실적이라 할 수 있다. 본 논문은 금액란에 나타나는 필기 한글을 인식하는 연구를 기술한다. 인식을 위해 모듈러 신경망 인식기를 사용하였으며, 세 종류의 특징을 사용하였다. 표준 한글 데이터베이스 PE92에 대해 실험한 결과 정인식률 97.56%를 얻었다.

  • PDF

Fuzzy ARTMAP 신경망을 이용한 차량 번호판 인식에 관한 연구 (Vehicle Plate Recognition Using Fuzzy-ARTMAP Neural Network)

  • 김동호;강은택;김현주;이정식;최연성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.625-628
    • /
    • 2001
  • 본 논문은 차량 번호판 영상을 안정적으로 추출하여 인식하는 방법으로 Fuzzy-ARTMAP 신경회로망을 이용하여 인식하는 시스템을 제안한다. 입력 영상에서 칼라정보를 이용하여 휘도값을 추출하고, 추출된 영상에서 히스토그램을 이용하여 번호판을 배경영상에서 분리하는 작업을 수행한 후, X축 영역에 축적 히스토그램을 적용하여 글자를 분리하고, Y축 영역에 축적 히스토그램을 이용하여 글자를 완전 분리하여 번호판의 문자를 분리시킨 후, 추출된 문자 영역을 Fuzzy-ARTMAP 신경망에 입력하여 문자를 인식하였다. Fuzzy-ARTMAP을 이용한 결과 기존의 다른 신경망을 이용한 것보다 문자인식 처리 시간을 단축시키고 인식률을 향상시킬 수 있었다.

  • PDF

2-D Conditional Moment for Recognition of Deformed Letters

  • Yoon, Myoong-Young
    • 한국산업정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.16-22
    • /
    • 2001
  • 본 논문에서는 화상자료의 특성인 이웃 화소간의 종속성을 표현하는데 적합한 깁스분포를 바탕으로 특징벡터를 추출하여 변형된 글자를 인식하는 새로운 방법을 제안하였다. 추출된 특징벡터는 이미지의 크기, 위치, 회전에 대하여 불변한 특성을 갖는 2차원 조건부 모멘트로 구성된다. 변형된 글자 인식을 위한 알고리즘은 특징벡터 추출하는 과정과 패턴을 인식하는 과정으로 구성하였다. (i) 특징벡터는 하나의 이미지에 대하여 추정된 조건부 깁스분포를 바탕으로 2차원 조건부 모멘트를 계산하여 추출한다. (ii) 변형된 문자 인식은 제안된 판별거리함수를 계산하여 최소거리를 산출한 미지의 변형된 문자를 원형문자로 인식한다. 제안된 방법에 대한 성능평가를 위하여, 생성된 훈련 데이터를 만들어 Workstation에서 실험 한 결과 96%이상의 인식성능이 있음을 밝혔다.

  • PDF

온라인 한글 필기 인식 알고리즘 개발 (Development of Algorithm for Online Handwriting Hangul Recognition)

  • 정다빈;이강은;정민진;문창진;김성석;김재현;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1000-1003
    • /
    • 2020
  • 본 논문은 기계학습 기반 온라인 한글 필기 인식 시스템의 첫 구현 결과를 담고 있다. 한글의 글자는 최소한 하나의 모음을 포함하고 있으며, 이 모음은 대개 직선으로 필기한다는 사전 지식을 활용하여 인식에 적용하고자 한다. 이를 위해 사용자가 온라인으로 필기하면 획 데이터를 획득하여 중성에 해당하는 모음을 찾는 알고리즘을 개발하였다. 제안한 알고리즘에서는, 우선 필기한 글자를 포함하는 사각형 R과 각 획을 둘러싸는 사각형 SR을 생성한 후, 직선을 판별하고, 이 직선들이 모음을 구성하는 후보군을 찾는 과정으로 구성되어 있다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.