• 제목/요약/키워드: 인쇄체

검색결과 257건 처리시간 0.021초

인쇄체 및 필기체 숫자의 효율적인 구분 인식 알고리즘 (An Efficient Classifying Recognition Algorithm of Printed and handwritten numerals)

  • 홍연찬
    • 한국지능시스템학회논문지
    • /
    • 제9권5호
    • /
    • pp.517-525
    • /
    • 1999
  • 본 논문에서는 인쇄체가 대부분을 차지하는 우편물의 우편번호 분류기에 적용하기 위해 인쇄체 및 필기체를 구분하여 인쇄체는 단일 특징과 단일 신경망으로 저차 연산함으로써 빠르게 분류하고 피기체는 복합특징과 클러스터 신경망을 통한 고차연산으로 정확한 분류를 할 수 있는 속도 면에서 효율적인 신경망 분류기를 제안한다. 제안된 분류기는 인쇄체와 필기체를 구분하여 인쇄체를 분류하는 인쇄체 분류기와 여기서 기각된 필기체 숫자를 인식하는 필기체 분류기로 구성된다. 인쇄체 분류기는 망 특징 벡터를 입력의 단일 신경망 인식기로 빠르게 인쇄체 및 정확히 필기된 필기체를 분류하며그 외의 입력패턴에 대해서는 기각한다. 그리고 필기체 분류기는 4방향 특징 및 앞단에서 추출된 망 특징의 복합특징 벡터 입력으로 [11]에서 제안된 클러스터 신경망을 이용하여 정확한 분류를 할수 있도록 구성하였다. 제안된 방법의 성능을 객관적으로 검증하기 위하여 숫자 인식 데이터 베이스로 많이 사용되는 NIST의 필기체 숫자 데이터 베이스 및 자체적으로 구성한 인쇄체 숫자 데이터에 대해 실험하였다. 임의의 NIST 필기체 숫자 데이터 500자와 인쇄체 숫자 데이터 500자에 대해 전처리와 특징추출을 제외한 분류시간측정 결과 제안된 방법을 필기체 분류기에 사용할 경우 인쇄체와 필기체의 비율에 따라 49.1%~65.5% 향상된 속도로 분류함으로써 제안된 방법을 필기체 분류기에 적용함으로써 속도 면에서 효율적임을 나타냈다.

  • PDF

지로 서식 문서의 인쇄체 숫자 인식 (Printed Numeric Character Recognition on Giro Form)

  • 김진숙;변영철;김경환;최영우;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.446-448
    • /
    • 1999
  • 본 논문에서는 일상 생활에서 쉽게 접할 수 있는 지로(Giro) 서식 상에 있는 인쇄체 숫자열 인식 방법으로서 템플릿 매칭 방법에 대해 설명한다. 지로 서식 문서 상의 인쇄체 숫자는 인쇄시의 오류로 인하여 숫자의 굵기나 높이, 그리고 폭이 다를 수는 있지만 기본적으로 폰트의 유형이 한가지라는 것과 나타날 수 있는 오류의 유형이 몇 가지로 제한되어 있다는 특징을 갖는다. 따라서 이러한 데이터 특징을 효율적으로 수용할 수 있도록 템플릿을 정의한 후 매칭 방법을 통해 숫자를 인식하는 템플릿 매칭 방법에 대해 설명한다. 실험 결과 비교적 간단한 방법을 이용하더라고 인쇄체 숫자열을 효율적으로 인식할 수 있었다.

  • PDF

도공층의 공극 구조와 인쇄후 잉크의 잔류거동에 관한 연구

  • 김병수;최창활;정성욱
    • 한국펄프종이공학회:학술대회논문집
    • /
    • 한국펄프종이공학회 2001년도 춘계학술발표논문집
    • /
    • pp.76-76
    • /
    • 2001
  • 종이가 가지는 공극 특성은 종이의 광학적 특성에 지대한 영향을 미칠 뿐만 아니라 인쇄용 지로서 사용될 때 잉크의 다공성 기질로서 잉크의 잔류 특성에도 큰 영향을 미친다. 특히 다공성 기지의 표변에 유동성이 뛰어난 물질이 가해 질 때, 이들의 유동 특성은 기질이 지 니고 있는 공극율과 공극의 분포에 따라 큰 차이를 나타내는 것으로 알려져 있다. 이러한 공극성은 백상지의 경우 사용된 펄프의 혼합 비율과 충전제의 사용량 그리고 펄프의 고해 정도에 따라 종이의 공극울이 달라진다. 종이의 공극성이 광학적 특성과 밀접한 연관성을 지니는 것은 종이의 광산란 계수를 결정하기 때문이다. 잘 알려진 바와 같이 종이의 광산란 계수는 빛의 산란과 관계되어 백색도와 백감도에 영향을 미친다. 그러나 도공지가 인쇄 용 지로 사용 될 경우, 도공지 표면에 도피되는 영크층은 도공지가 가지고 있는 구조적 특성을 변화시킬 수 있는 제3의 요인으로 간주 될 수 있다. 결국, 인쇄가 완료된 종이의 경우 원지층, 도공층 그리고 잉크층으로 구성된다. 따라서 다양 한 공극 구조를 가지는 기질위에 잉크가 도피될 경우 기질의 공극 특성에 따라 잉크 조성분 의 침투 거동에도 많은 차이가 있을 것으로 예측된다. 잉크의 구성 요소를 살펴보면 잉크의 색상을 결정하는 안료, 단일의 각 안료 입자를 도포하여 인쇄판으로부터 종이까지 운송시키 는 기능과 인쇄기에서 잉크의 유동성을 유지하고 종이 또는 기타 피인쇄체에 전이된 후에는 건조막을 형성하는 비히클 그리고 각종 기능성 첨가제로 구성되어 있다. 동일한 성분으로 구성된 잉크를 사용하여 각각 공극성이 다른 피인쇄체 위에 인쇄 될 경우 이들 조성분의 이 동과 표면 잔류 특성에 변화가 있을 것으로 생각된다. 즉 공극성이 풍부한 기질에 도피된 잉크는 반대의 경우와 비교하여 보다 많은 조성분이 종이의 공극 속으로 침투하게 될 것이 다. 이 과정에서 특히 미세한 안료 입자의 경우 피인쇄체의 표면 공극을 채우고, 비히클의 경우 미세한 공극속으로 침투되어 경화됨으로써 피인쇄체가 지니고 있는 공극량을 감소시커 게 될 것이다. 그리고 피인쇄체의 각종 형태의 공극으로 침투된 잉크의 양에 반비례적으로 피인쇄체의 표변에 잉크가 잔류하게 될 것이다. 따라서 본 연구에서는 여러가지 안료를 사용하여 각각 다른 공극 특성을 지니는 도공지를 제조한 후 이들이 가지는 공극 특성과 잉크의 잔류 거동에 대해 고찰해 보고자 하였다.

  • PDF

연결요소 분석에 기반한 인쇄체 한글 주소와 필기체 한글 주소의 구분 (Classification of Handwritten and Machine-printed Korean Address Image based on Connected Component Analysis)

  • 장승익;정선화;임길택;남윤석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.904-911
    • /
    • 2003
  • 본 논문에서는 우편봉투 상에 기입된 인쇄체 한글 주소와 필기체 한글 주소를 효과적으로 구분할 수 있는 방법을 제안한다. 문자인식 모듈을 포함하는 각종 응용 시스템에서 입력 영상이 인쇄체인지 필기체인지 구분하는 것은 매우 중요하다. 이는 대부분의 경우 인쇄체 영상과 필기체 영상이 갖는 특징이 상이하여, 각 영상에서의 문자 및 문자열 분리 방법, 문자 인식 방법 둥이 매우 상이하게 개발되기 때문이다. 본 논문에서 제안한 구분 방법은 연결요소 추출 및 병합, 특징 추출, 영상 구분 순으로 수행된다. 연결요소 추출 및 병합 단계에서는 입력영상으로부터 연결요소를 추출한 후 일부 연결요소들에 대하여 병합을 시도하며, 특징 추출 단계에서는 병합결과 얻어진 연결요소들의 그룹들로부터 폭과 위치에 관련된 특징을 추출하고, 영상 구분 단계에서는 추출한 특징을 입력으로 제공받는 다충퍼셉트론을 사용하여 구분을 시도한다. 제안한 방법의 우수성을 증명하기 위해 실제 우편물로부터 추출된 3,147개의 한글 주소 영상을 사용하여 실험한 결과, 98.85%의 구분률을 보여주었다.

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

노노그램 퍼즐을 이용한 인쇄체 영문자 인식 (A Recognition of the Printed Alphabet by Using Nonogram Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.451-455
    • /
    • 2008
  • 본 논문에서는 흑백 CCD 카메라로부터 입력되는 2가지 인쇄체(바탕, 돋움) 영문자를 인식하여 편집 가능한 텍스트 형식으로 변환하는 시스템을 구현하였다. 입력된 인쇄체 영어 문장 영상을 이진화 처리 후. 히스토그램 기법을 적용하여 수평 투영으로 각 문장의 행을 분리하고 수직 투영으로 개별 문자를 분리하였으며, 문자의 높이를 48픽셀로 변환하여 정규화 하였다. 정규화 된 개별 문자에 노노그램 퍼즐 원리를 역으로 이용하여, 픽셀을 단위로 하는 작은 사각형들로 구성된 사각형으로 문자를 덮은 후 문자의 특성을 노노그램 퍼즐의 수치 정보로 나타내어 표준 패턴 정보와 비교하여 인식하게 하였다. 바탕체 2609개, 돋움체 1475개의 문자를 대상으로 실험하여 100% 인식률을 얻었다.

체인 코드 트리밍과 가중 원형 정합을 이용한 인쇄체 숫자 인식 (Machine-printed Numeral Recognition using Weighted Template Matching with Chain Code Trimming)

  • 정민철
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.35-44
    • /
    • 2007
  • 본 논문에서는 인쇄체 숫자를 인식하기 위해 가중 원형 정합(weighted template matching) 방법을 제안한다. 원형 정합은 입력 영상 전체를 하나의 전역적인 특징으로 처리하는데 반해, 제안된 가중 원형 정합은 패턴의 특징이 나타나는 국부적인 영역에 해밍 거리(Hamming distance)의 가중치를 두어 패턴 특징을 강조하여 숫자 패턴의 인식률을 높인다. 또한 원형 정합은 영상을 이진화(binarization)할 때 발생되는 패턴의 윤곽선을 울퉁불퉁하게 만드는 랜덤 노이즈에 취약하다. 이러한 랜덤 노이즈를 제거하기 위해 본 논문에서는 체인 코드 트리밍(chain code trimming)방법을 제안한다. 체인 코드 트리밍은 패턴의 외부 윤곽선과 내부 윤곽선의 체인 코드 분석을 통해 특정 유형의 체인 코드를 제거, 교정함으로써 이루어진다. 실험에서는 기존의 원형 정합을 사용했을 때와 체인 코드 트리밍을 한 후 가중 원형 정합을 사용했을 때의 혼돈 행렬(confusion matrix)을 서로 비교한다. 실험 결과는 본 논문에서 제안한 방법에 의해 인쇄체 숫자의 인식률이 크게 향상된 것을 보인다.

  • PDF

Japanese Puzzle을 이용한 인쇄체 영문자, 숫자, 기호의 인식 (A Recognition of the Printed Alphabet, the Number and the Symbols by Using Japanese Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.119-122
    • /
    • 2007
  • 지금까지의 연구에서 Japanese Puzzle을 이용한 인쇄체 영문자 인식을 구현하여 좋은 결과를 얻었고, 본 논문 에서는 인쇄체 영문자(바탕, 돋움) 인식을 확장시켜 영문장을 인식하기 위해 키보드에서 입력 가능한 숫자 및 기호를 포함하여 인식하는 시스템을 구현하였다. 이미지를 입력 받아 이진화 처리, 히스토그램 투영을 이용한 문자 분리는 영문자 인식에서와 동일한 처리를 한다. 기호 중에서 세로 길이보다 가로 길이가 긴 기호인 -,-,= 만 가로를 정규화 하였고, 나머지는 세로를 정규화 하였다. 정규화 된 문자에 Japanese Puzzle을 역으로 적용하여 구하여진 수치 정보로부터 영문자, 숫자, 기호를 분류 및 인식하여 좋은 결과를 얻었다.

  • PDF

모바일 환경의 OCR Anyword (Anyword OCR in Ubiquitos Computing)

  • 박종경;음봉규;권용식;진성아
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.152-155
    • /
    • 2006
  • 최근 모바일기기에 유비쿼터스 콘텐츠를 구현하는 시도가 활발히 진행되고 있다. 핸드폰을 이용해 위치를 판단한다거나, 핫코드를 찍어 상품을 구매하는 등의 콘텐츠가 개발되었다. 또한, 모바일기기도 발전하여 핸드폰, PDA 같은 모바일기기의 내장 카메라모듈은 필수사항이 되었다. 본 연구는 모바일기기의 내장 카메라모듈을 이용한 모바일 환경에 적합한 한글 문자인식 시스템을 제안한다. 본 연구의 시스템은 모바일기기로 PDA를 사용하였으며, PDA의 카메라모듈을 통하여 인쇄체 한글 영상을 입력받고, 모바일기기의 느린 연산속도를 보완하기 위하여, 서버로 이미지와 기울기 정보를 전달한 후, 서버에서 기울어진 인쇄체 문자영상을 보정하고, 프로젝션을 통해 문자를 추출한 후, 차연산을 이용한 매칭 방법으로 인쇄체 한글을 인식한다. 인식한 문자들은 사용자의 수정을 거쳐 텍스트 문서로 저장할 수 있다.

  • PDF

정보 - 서체프로그램 분쟁예방 및 대응방법

  • 대한인쇄문화협회
    • 프린팅코리아
    • /
    • 제13권3호
    • /
    • pp.102-107
    • /
    • 2014
  • 한국출판문화산업진흥원(원장 이재호)은 최근 서체와 서체프로그램 저작권 관련 법률 용어 및 의미, 분쟁사례, 분쟁의 사전 예방과 대처 방법 등을 소개하는 '서체 프로그램 이용 길라잡이'를 발행했다. 이중 서체프로그램 분쟁예방 및 대응방법에 대한 내용을 소개한다. 한편 대한인쇄문화협회에서는 문화체육관광부의 지원을 받아 바른돋움체와 바른바탕체를 개발해 홈페이지(www.print.or.kr) 자료실에서 무료로 다운받아 사용할 수 있도록 하고 있다.

  • PDF