• 제목/요약/키워드: Pixel Character

검색결과 68건 처리시간 0.027초

다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 (Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks)

  • 임길택;김호연;남윤석
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.777-784
    • /
    • 2003
  • 본 논문에서는 다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 방법을 제안한다. 입력 문자영상은 한글 문자 형식 6가지와 한글 이외의 기타 문자 형식의 전체 7가지 형식으로 분류되어 인식된다. 한글 문자는 2단계의 MLP 신경망 인식기에 의해 인식된다. 첫째 단계에서는 한글 문자를 자소의 조합 형태에 따라 2개 또는 3개의 인식단위로 나누고, 각 인식단위에서 추출된 방향각도 특징 벡터를 입력으로 하는 MLP 신경망으로 1차 인식한다. 둘째 단계에서는 첫째 단계의 인식단위별 MLP 신경망 인식기의 인식양상 특징을 추출하고 다른 MLP 신경망에 입력하여 최종 한글 문자인식을 한다. 한글 이외의 기타 문자의 인식을 위해서는 단일 MLP 신경망을 사용한다. 인식 실험에서는 실제 우편물 50,000통 영상으로부터 추출한 문자영상 데이터베이스를 이용하였는데, 실험 결과 본 논문에서 제안한 방법이 매우 우수함을 알 수 있었다.

인쇄된 한글 문서의 폰트 인식 (The Font Recognition of Printed Hangul Documents)

  • 박문호;손영우;김석태;남궁재찬
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2017-2024
    • /
    • 1997
  • 본 논문은 새로운 형태의 문서 통신 방식인 지적 커뮤니케이션 시스템(IICS : Intelligent Image Communication System)의 구현을 위하여 한글 문서를 대상으로 문서를 구성하는 문자의 서체와 문자의 크기 및 기울기를 인식하고 방법을 제안한다. 서체를 인식하기 위하여 문서에서 일정한 크기의 블럭을 추출하여 주파수 분석을 하였고, 단어의 외접 사각형의 수직 거리를 이용하여 문자의 크기를 인식하였다. 문자의 기울기를 인식하기 위하여 수직 방향의 투영 프로파일을 이용하였다. 서체 인식을 위한 인식기의 가변적인 히든 노드를 이용하여 오류 역전파 알고리즘으로 학습된 MLP(Multi-layer Perceptron)를 사용하였으며, 문자의 크기와 기울기를 분류하기 위하여 Mahalanobis distance를 이용하였다. 실험을 통하여 서체 분류는 10개의 서체에 대하여 평균 95.19%의 인식률을 얻었고, 문자의 크기 분류는 5가지의 문자 크기에 대하여 평균 97.34%의 인식률을 얻었으며, 문자의 기울기는 평균 89.09%의 인식률을 얻음으로써 제안된 방법의 유용성을 입증하였다.

  • PDF

병렬 세선화 알고리즘을 이용한 1-화소 굵기의 선 구하기 (Obtaining 1-pixel Width Line Using an Enhanced Parallel Thinning Algorithm)

  • 권준식
    • 대한전자공학회논문지SP
    • /
    • 제46권1호
    • /
    • pp.1-6
    • /
    • 2009
  • 세선화 알고리즘은 문자인식, 도형 및 도면 인식 등에 매우 중요하게 사용되고 있다. 세선화 알고리즘은 여러 가지 방법으로 제안되어 왔다. 본 논문에서는 이전에 제안된 세선화 알고리즘 중 선처리가 후처리에 영향을 주지 않는 병렬 세선화 알고리즘 중에서 ZS, LW, 및 WHF 알고리즘의 문제점을 찾아내었다. ZS 알고리즘은 사선 방향에서 화소가 손실되는 문제점을 안고 있으며, LW 알고리즘은 사선 방향에서의 화소 두께가 1이 되지 못하는 문제점을 내포하고 있다. 따라서 본 알고리즘에서는 사선 방향에서 8근방을 이루며, 화소의 두께도 완전히 1이 되도록 개선시킨 병렬 세선화 알고리즘을 제안한다.

쿼드트리로 구성된 한글 문서 영상에서의 문자추출에 관한 연구 (EXTRACTION OF CHARACTERS FROM THE QUADTREE ENCODE DOCUMENT IMAGE OF HANGUL)

  • 백은경;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 추계학술대회 논문집 학회본부
    • /
    • pp.201-204
    • /
    • 1991
  • In this paper the method of representing the document image by the quadtree data structure, and extracting each character seperately from the constructed quadtree are described. The document image is represented by a binary encoded quadtree and the segmentation is performed according to the information of each leaf node of the quadtree. Then, each character is extracted by the relation of positions of segments. This method enables to extract characters without examining every pixel in the image and the required storage of document image is decreased.

  • PDF

수정된 4-이웃 연결값을 이용한 세선화 알고리즘 (A-Modified Thinning Algorithm using the 4-Neighbors Connection Value for the Character Recognition)

  • 원남식
    • 한국산업정보학회논문지
    • /
    • 제7권1호
    • /
    • pp.50-57
    • /
    • 2002
  • 본 논문은 다양한 문자 인식에 이용 가능한 WPTA4 알고리즘의 개선에 대한 연구이다. WPTA4 알고리즘은 각 화소의 연결성을 나타내는 연결 값을 이용함으로서 원래의 패턴에 매우 유사한 골격을 추출할 수 있는 알고리즘이다. 제안된 논문에서는 WPTA4 알고리즘에 나타나는 골격소멸현상을 보이고 이러한 현상을 제거할 수 있는 수정된 알고리즘을 제안하였다. 제안된 알고리즘은 골격소멸현상이 제거되었고 추출된 골격선의 품질이 우수함을 보였다.

  • PDF

문자인식을 위한 불 전파와 WPTA 알고리즘에 의한 세선화 알고리즘 (A Thinning Algorithm by the Fire Front' Propagation and WPTA Algorithm for the Character Recognition)

  • 원남식;남인길
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.63-68
    • /
    • 2004
  • 본 논문은 다양한 문자 인식에 적용하기 위한 불 전파와 WPTA 알고리즘을 이용한 세선화 알고리즘에 관한 연구이다. 제안된 알고리즘은 각 화소의 깊이 값을 나타내는 깊이정보를 이용하여 원래의 패턴에 매우 유사한 문자의 골격선을 추출할 수 있다. 본 논문에서는 새로운 세선화 알고리즘을 제안하였고, 구현한 후, 수행 결과를 나타내었다.

  • PDF

A Contour Descriptors-Based Generalized Scheme for Handwritten Odia Numerals Recognition

  • Mishra, Tusar Kanti;Majhi, Banshidhar;Dash, Ratnakar
    • Journal of Information Processing Systems
    • /
    • 제13권1호
    • /
    • pp.174-183
    • /
    • 2017
  • In this paper, we propose a novel feature for recognizing handwritten Odia numerals. By using polygonal approximation, each numeral is segmented into segments of equal pixel counts where the centroid of the character is kept as the origin. Three primitive contour features namely, distance (l), angle (${\theta}$), and arc-tochord ratio (r), are extracted from these segments. These features are used in a neural classifier so that the numerals are recognized. Other existing features are also considered for being recognized in the neural classifier, in order to perform a comparative analysis. We carried out a simulation on a large data set and conducted a comparative analysis with other features with respect to recognition accuracy and time requirements. Furthermore, we also applied the feature to the numeral recognition of two other languages-Bangla and English. In general, we observed that our proposed contour features outperform other schemes.

자소분할과 픽셀분포를 이용한 한글문자인식 (Recognition of Hangeul Character Using Grapheme Segmentation and Pixel Distribution)

  • 조영국;이동욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1919_1920
    • /
    • 2009
  • 한글 문자 인식에 관한 연구는 통계적 방법과 구조적 방법, 신경 회로망 등 다양한 방법론이 제시되어 왔다. 그러나 한글은 영문이나 숫자에 비해 방대한 문자수와 복잡한 구조로 인하여 인식에 많은 어려움을 가지고 있다. 따라서 본 논문에서는 한글을 가장 단순한 구조인 자음과 모음으로 분리한 뒤 각 개체의 픽셀 분포를 파악하고, 한글의 구조적 특징을 이용하여 자소의 행과 열에서의 peak값과 픽셀의 분포를 그룹으로 나누어 한글을 인식하는 방법을 제시한다.

  • PDF

수정된 WPTA 세선화 알고리즘 (A Modified WPTA Thinning Algorithm)

  • 원남식;남인길;전일수
    • 한국정보처리학회논문지
    • /
    • 제6권10호
    • /
    • pp.2823-2829
    • /
    • 1999
  • This paper is a study on the improvement of WPTA algorithm available for the recognition of various characters. WPTA algorithm can extract the skeleton of a character almost similar to the original pattern by using the connection value representing connectivity of each pixel. In this paper we show that the skeleton disappearance phenomena existing in WPTA and propose modified algorithm which can eliminate this phenomena.

  • PDF

신경망을 이용한 인쇄체 한자의 인식 (An recognition of printed chinese character using neural network)

  • 이성범;오종욱;남궁재찬
    • 한국통신학회논문지
    • /
    • 제18권9호
    • /
    • pp.1269-1282
    • /
    • 1993
  • 본 논문에서는 종래의 결정론적 방법과 신경망을 이용하여, 인쇄체 한자를 인식하는 방법을 제안하였다. 먼저 한자를 구성하는 획성분의 4방항백터를 추출하였다. 다음에 구해진 방향벡터에 무게중심의 메쉬를 만든 다음, 각 메쉬내의 흑화소 길이로 8$\times$8의 특징 매트릭스를 구성하였다. 정규화한 특징 매트릭스 값은 14의 문자형식으로 1차 분류하기위해 신경망에 입력으로 하였고, 이 분류된 문자는 부수를 인식하는 부수인식 신경망에서 다시 2차분류하였다. 마지막으로 2차분류된 문자는 입력한사와 표준한자와의 유사도를 적용하여 최종인식을 행하였다. 본 알고리즘이 한자의 인치에 유효함을 보였다.

  • PDF