• 제목/요약/키워드: Handwritten digits recognition

검색결과 34건 처리시간 0.045초

합성곱 신경망 네트워크 구조 변화에 따른 숫자 인식률 비교 (Comparison of Number Recognition Rates According to Changes in Convolutional Neural Structure)

  • 이종찬;김영현;송특섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.397-399
    • /
    • 2022
  • 딥러닝을 적용한 기술 중 숫자 인식으로 예를 들 수 있다. 숫자 인식을 통하여 여러 분야에서 활용이 되고 있다. 숫자 인식을 가능하게 한 알고리즘 중 합성곱 신경망이 있다. 합성곱 신경망은 다양한 데이터들을 인식하는 데 사용되고 있다. MNIST 숫자 데이터셋을 활용하여 합성곱 신경망 구현 과정 중 깊게 레이어층을 쌓을수록 성능향상을 기대해볼 수 있다. 본 논문에서는 합성곱 레이어를 추가함으로써 성능향상을 76.96%에서 98.87의 정확도가 산출되어 약 21.91%의 정확도가 향상됨을 확인하였다.

  • PDF

CPgraph를 이용한 숫자열 영상에서 숫자 분할 (Digit Segmentation in Digit String Image Using CPgraph)

  • 오정수
    • 한국정보통신학회논문지
    • /
    • 제23권9호
    • /
    • pp.1070-1075
    • /
    • 2019
  • 본 논문은 영상에서 숫자열을 검출하고 숫자열을 구성하고 있는 숫자들을 분할하여 숫자 인식 시스템을 위한 입력 숫자 영상을 생성하는 알고리즘을 제안하고 있다. 제안된 알고리즘은 블랍 검출을 통해 블랍화된 숫자열을 검출하고, 검출된 블랍 정보를 이용해 숫자열 영역을 지정하고, 숫자열 기울어짐을 보정한다. 그리고 제안된 알고리즘은 본 논문에서 새롭게 정의된 세 종류의 CPgraph을 이용해 숫자 기울어짐을 보정하고, 보정된 숫자열에서 숫자 분할을 위한 경계 지점을 결정한다. 일정 영역의 폰트 크기로 인쇄된 숫자열을 포함하는 영상 그룹과 필기체 숫자열을 포함하는 영상 그룹을 이용한 숫자 분할 실험에서 제안된 알고리즘 각 영상 그룹에서 100%와 90% 이상의 숫자들을 성공적으로 분할하고 있다.

다양한 컨볼루션 신경망을 이용한 태국어 숫자 인식 (Handwriting Thai Digit Recognition Using Convolution Neural Networks)

  • ;정한민;김태홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.15-17
    • /
    • 2021
  • 필기체 인식 연구는 주로 딥러닝 기술에 초점이 맞추어져 있으며, 최근 몇 년 동안 많은 발전을 이루었다. 특히, 필기체 태국어 숫자 인식은 태국 공식 문서와 영수증과 같은 숫자 정보를 포함한 많은 분야에서 중요한 연구 분야지만, 동시에 도전적인 분야이기도 하다. 대규모 태국어 숫자 데이터 집합의 부재를 해결하기 위해, 본 연구는 자체적인 데이터 집합을 구축하고 이를 다양한 컨볼루션 신경망으로 학습시켰다. 정확도 메트릭을 이용하여 평가한 결과, 배치 정규화 기반 VGG 13이 98.29%의 가장 높은 성능을 보였다.

  • PDF

HOG 특징을 이용한 다항식 방사형 기저함수 신경회로망 기반 숫자 인식 방법의 설계 (Design of Digits Recognition Method Based on pRBFNNs Using HOG Features)

  • 김봉연;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1365-1366
    • /
    • 2015
  • 본 논문에서는 HOG 특징을 이용한 다항식 방사형 기저함수 신경회로망 기반 숫자 인식 시스템의 설계를 제안한다. 제안한 숫자 인식 시스템은 HOG 특징을 이용하여 숫자를 입력 데이터로 사용하기 위해 특징을 계산한다. 다항식 방사형 기저 함수 신경회로망은 고차원 데이터의 입-출력 형태를 갖는 클래스를 분류하는데 용이하며, 활성함수의 중심점 및 분포상수는 Fuzzy C-Means(FCM) 알고리즘에 의해 초기 값을 설정한다. 또한 제안한 분류기의 최적화를 위해 Particle Swarm Optimization(PSO)를 사용하여 최적화된 분류기의 성능을 비교한다. 숫자 인식을 위하여 공인 데이터베이스인 MNIST handwritten digit database를 사용하여 분류기의 성능을 평가하고 분석한다.

  • PDF

접촉된 필기체 숫자에 대한 효과적인 분할 기반 인식 방법 (An Efficient Segmentation Based Recognition of Unconstrained Handwritten Touching Digits)

  • 김계경;김진호;박희주;부기동
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.223-230
    • /
    • 2001
  • 본 논문에서는 접촉된 숫자들에 대한 효과적인 분할 기반 인식 방법을 제안하였다. 접촉 숫자들을 연결획 정보와 분할 후보점을 기반으로 여섯 개의 접촉 유형으로 구분하였다. 전체 후보 분할점을 해석하여 네 개의 최종 후보 분할점을 도출하므로써 과 분할로 인한 오인식을 줄일 수 있도록 하였다. 이 방법에서는 다수의 분할 후보점으로부터 신뢰성이 높은 소규모의 분할 후보점들에 대해 우선권을 부여하는 방식으로 최종 분할 후보점들을 찾고 인식을 시도하기 때문에 전통적으로 분할기반 방식의 인식에서 초래되는 오분할에 의한 치명적인 오인식률을 줄일 수 있도록 하였다. NIST 접촉숫자 데이터 베이스에 대한 실험 결과 92.5%의 비교적 높은 인식 성능을 얻을 수 있었다.

  • PDF

숫자 인식을 위한 PCA 기반 pRBFNNs 패턴 분류기 설계 (Design of PCA-based pRBFNNs Pattern Classifier for Digit Recognition)

  • 이승철;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.355-360
    • /
    • 2015
  • 본 논문에서는 필기체 숫자를 인식하기 위해 주성분 분석법(PCA) 기반 방사형 기저함수 신경회로망(pRBFNNs) 패턴 분류기를 설계한다. 제안된 패턴 분류기는 PCA를 이용한 데이터 전처리 단계와 pRBFNNs를 이용한 분류 단계로 구성된다. 전처리 단계에서는 PCA를 사용하여 주어진 데이터의 정보손실을 최소화한 특징데이터를 생성하고, 이를 분류 단계인 pRBFNNs의 입력으로 사용한다. 제안된 분류기의 조건부에서는 Fuzzy C-Means(FCM) 클러스터링 알고리즘으로 구성하였고, 연결가중치는 1차 선형식을 사용하였다. 결론부에서는 최소자승법(LSE)을 사용하여 다항식 계수를 구하였다. 제안된 분류기의 성능평가를 위해 대표적인 필기체 숫자데이터인 MNIST 데이터를 사용하였으며, 제안된 분류기의 결과를 기존 다른 분류기들과 비교한다.

RAM 기반 신경망을 이용한 필기체 숫자 분류 연구 (A Study on Handwritten Digit Categorization of RAM-based Neural Network)

  • 박상무;강만모;엄성훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.201-207
    • /
    • 2012
  • RAM 기반 신경망은 2진 신경망(Binary Neural Network, BNN)에 복수개의 정보 저장 비트를 두어 교육의 반복 횟수를 누적하도록 구성된 가중치를 가지지 않는(weightless) 신경회로망으로서 한 번의 교육만으로 학습이 이루어지는 효율성이 뛰어난 신경회로망이다. 지도 학습에 기반을 둔 RAM 기반 신경망은 패턴 인식 분야에는 우수한 성능을 보이는 반면, 비지도 학습에 의해 패턴을 구분해야 하는 범주화 연구에는 적합하지 않은 모델로 분류된다. 본 논문에서는 비지도 학습 알고리즘을 제안하여 RAM 기반 신경망으로 패턴 범주화를 수행한다. 제안된 비지도 학습 알고리즘에 의해 RAM 기반 신경망은 입력 패턴에 따라 자율 학습하여 스스로 범주를 생성할 수 있으며, 이를 통해 RAM 기반 신경망이 지도 학습과 비지도 학습이 모두 가능한 복합 모델임을 증명한다. 실험에 사용한 학습 패턴으로는 0에서 9까지의 오프라인 필기체 숫자로 구성된 MNIST 데이터베이스를 사용하였다.

다중 동적 위상보존 자기구성 지도의 결합을 통한 필기숫자 데이타의 분류율 향상 (Improvement of Classification Rate of Handwritten Digits by Combining Multiple Dynamic Topology-Preserving Self-Organizing Maps)

  • 김현돈;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권12호
    • /
    • pp.875-884
    • /
    • 2001
  • 자기 구성지도는 데이타 시각화, 위상보존 매핑 등의 분야에서 널리 사용되고 있지만. 학습이 되기 전에 위상을 미리 고정시켜야 하기 때문에 실제 문제에 적용하기 어렵다는 것과 클러스터링 능력에 비해 분류율이 낮다는 결점이 있다. 이를 해결하기 위해서 자기구성 지도의 출력 노드를 동적으로 분화하고 분화된 노드를 파습하는 동적 위상보존 사기구성 지도를 제안하고, 이를 다중 결합함으로써 분류율을 향상 시켰다. 동적 위상보존 자기구성 지도의 결함 방법으로는 자기구성 지도의 K개 노드가 출격을 내도록하는 K-Winner 방법 및 K-Winner+ 가중치 방법이 제안되었는데, 이는 다수결 투표, 가중치, BKS, Byayesian, Borda, Condorect, 신뢰값 합산 등의 기존 결합 방법보다도 우수한 결과를 나타내었다. 동적 위상보존 자기 구성 지도를 통해서 위상을 고정 시켜야 하는 결점을 해결할 수 있었고. 서로 다른 특징으로 학습된 동적 위상보존 자기구성 지도들을 결합하여 분류 능력을 향상시킬 수 있었다. 필기 숫자데이타로. 실험한 결과, 제안한 방법이 자기구성 지도의 결점을 효과적으로 해결하여 98.1% 의 높은 인식률을 보였다.

  • PDF

퍼지 RBFNNs와 증분형 주성분 분석법으로 실현된 숫자 인식 시스템의 설계 (Design of Digit Recognition System Realized with the Aid of Fuzzy RBFNNs and Incremental-PCA)

  • 김봉연;오성권;김진율
    • 한국지능시스템학회논문지
    • /
    • 제26권1호
    • /
    • pp.56-63
    • /
    • 2016
  • 본 연구에서는 퍼지 RBFNNs과 증분형 주성분 분석법으로 실현된 숫자인식 시스템의 설계를 소개한다. 주성분 분석법은 차원축소를 위해 사용되는 알고리즘으로 학습데이터의 차원 수가 고차원이거나 데이터의 양이 많을 때 특징 추출을 위한 많은 계산 시간을 필요로 한다. 따라서 고차원 데이터의 효율적인 차원축소와 점진적인 학습을 위해 증분형 주성분분석법을 적용하는 방법을 제안한다. 방사형 기저함수 신경회로망의 구조는 조건부, 결론부, 추론부의 3가지 기능적 모듈로서 구분이 가능하다. 조건부에서는 FCM 클러스터링 알고리즘의 도움으로 실현된 퍼지 클러스터링의 사용으로 입력 공간을 분할한다. 또한 가우시안 함수 대신 FCM(Fuzzy C-Means)클러스터링 알고리즘의 멤버쉽 값을 사용함으로써 입력 데이터의 특성을 좀 더 잘 반영할 수 있도록 개선하였으며, 결론부에서 연결가중치는 상수항에서 일차식과 이차식, 그리고 변형된 이차식과 같은 다항식의 형태로 확장하여 사용한다. 실험 결과는 공인 숫자 데이터인 MNIST 필기체 숫자 데이터를 사용하여 제안된 숫자 인식 시스템의 효율성을 다른 연구와의 비교를 통해 입증한다.

RAM 기반 신경망의 비지도 학습에 관한 연구 (A Study on Unsupervised Learning Method of RAM-based Neural Net)

  • 박상무;김성진;이동형;이수동;옥철영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.31-38
    • /
    • 2011
  • RAM 기반 3-D 신경망은 2진 신경망(Binary Neural Network, BNN)에 복수개의 정보 저장 비트를 두어 교육의 반복 횟수를 누적하도록 구성된 가중치를 가지지 않는 신경회로망으로서 한 번의 교육만으로 학습이 이루어지는 효율성이 뛰어난 신경회로망이다. MRD(Maximum Response Detector) 기법을 이용한 3-D 신경망의 인식 방법은 지도 학습에 기반을 둔 것으로서 학습을 통해 신경망 스스로가 범주를 구분할 수 없으며 잘 구분된 범주의 학습 데이터를 통해서만 성능을 발휘할 수 있다. 본 논문에서는 기존 3-D 신경 회로망에 학습 데이터의 구분 없이 신경망 자체가 입력 패턴에 따라 학습하여 범주를 구분하는 비지도 학습 알고리즘을 제안한다. 제안된 비지도 학습 알고리즘에 의해 신경회로망은 판별자의 수를 스스로 조절할 수 있는 구조를 가지게 되며 이는 망의 유연한 확장성을 보장한다. 0에서 9까지의 다중 패턴으로 구성된 오프라인 필기체 숫자를 무작위로 추출하여 학습 패턴으로 인식 실험을 수행하였으며 실험을 통해 신경망이 스스로 비지도 학습에 의해 판별자의 수를 결정하게 되며 이것은 신경망이 각각의 필기체 숫자에 대한 개념을 가지게 되는 것으로 해석할 수 있다.