• 제목/요약/키워드: 인쇄체 문자

검색결과 70건 처리시간 0.025초

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

히스토그램 분석 기반의 인쇄체 문자열 분할 방법 (A Method of Character String Segmentation using Histogram Analysis)

  • 장승익;임길택;남윤석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.532-534
    • /
    • 2003
  • 본 논문에서는 인쇄체 우편주소 영상에서 smearing과 히스토그램 분석을 이용한 고속의 문자열 기울기 보정 및 분할 방법을 제안하였다. 제안한 방법에서는 입력 영상을 가분할 하고, 각각의 가분할 영상에 대한 수평 히스토그램을 분석하여 기울기 측정 및 보정을 수행하였다. 문자열 분할 단계에서는, 기울기가 보정된 영상에 smearing을 수행하고, 영상에 존재하는 잡영 및 각종 바코드를 제거하고, 수평 히스토그램 분석을 통해 최종 문자열 분할 결과를 도출하였다. 제안한 방법을 사용한 실험에서 2,000 장의 테스트 영상 중 1,989장의 영상에서 정확한 문자분할 결과를 얻을 수 있었으며, 제안한 방법이 유효함을 보였다.

  • PDF

노노그램 퍼즐을 이용한 인쇄체 영문자 인식 (A Recognition of the Printed Alphabet by Using Nonogram Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.451-455
    • /
    • 2008
  • 본 논문에서는 흑백 CCD 카메라로부터 입력되는 2가지 인쇄체(바탕, 돋움) 영문자를 인식하여 편집 가능한 텍스트 형식으로 변환하는 시스템을 구현하였다. 입력된 인쇄체 영어 문장 영상을 이진화 처리 후. 히스토그램 기법을 적용하여 수평 투영으로 각 문장의 행을 분리하고 수직 투영으로 개별 문자를 분리하였으며, 문자의 높이를 48픽셀로 변환하여 정규화 하였다. 정규화 된 개별 문자에 노노그램 퍼즐 원리를 역으로 이용하여, 픽셀을 단위로 하는 작은 사각형들로 구성된 사각형으로 문자를 덮은 후 문자의 특성을 노노그램 퍼즐의 수치 정보로 나타내어 표준 패턴 정보와 비교하여 인식하게 하였다. 바탕체 2609개, 돋움체 1475개의 문자를 대상으로 실험하여 100% 인식률을 얻었다.

Japanese Puzzle을 이용한 인쇄체 영문자, 숫자, 기호의 인식 (A Recognition of the Printed Alphabet, the Number and the Symbols by Using Japanese Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.119-122
    • /
    • 2007
  • 지금까지의 연구에서 Japanese Puzzle을 이용한 인쇄체 영문자 인식을 구현하여 좋은 결과를 얻었고, 본 논문 에서는 인쇄체 영문자(바탕, 돋움) 인식을 확장시켜 영문장을 인식하기 위해 키보드에서 입력 가능한 숫자 및 기호를 포함하여 인식하는 시스템을 구현하였다. 이미지를 입력 받아 이진화 처리, 히스토그램 투영을 이용한 문자 분리는 영문자 인식에서와 동일한 처리를 한다. 기호 중에서 세로 길이보다 가로 길이가 긴 기호인 -,-,= 만 가로를 정규화 하였고, 나머지는 세로를 정규화 하였다. 정규화 된 문자에 Japanese Puzzle을 역으로 적용하여 구하여진 수치 정보로부터 영문자, 숫자, 기호를 분류 및 인식하여 좋은 결과를 얻었다.

  • PDF

모바일 환경의 OCR Anyword (Anyword OCR in Ubiquitos Computing)

  • 박종경;음봉규;권용식;진성아
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.152-155
    • /
    • 2006
  • 최근 모바일기기에 유비쿼터스 콘텐츠를 구현하는 시도가 활발히 진행되고 있다. 핸드폰을 이용해 위치를 판단한다거나, 핫코드를 찍어 상품을 구매하는 등의 콘텐츠가 개발되었다. 또한, 모바일기기도 발전하여 핸드폰, PDA 같은 모바일기기의 내장 카메라모듈은 필수사항이 되었다. 본 연구는 모바일기기의 내장 카메라모듈을 이용한 모바일 환경에 적합한 한글 문자인식 시스템을 제안한다. 본 연구의 시스템은 모바일기기로 PDA를 사용하였으며, PDA의 카메라모듈을 통하여 인쇄체 한글 영상을 입력받고, 모바일기기의 느린 연산속도를 보완하기 위하여, 서버로 이미지와 기울기 정보를 전달한 후, 서버에서 기울어진 인쇄체 문자영상을 보정하고, 프로젝션을 통해 문자를 추출한 후, 차연산을 이용한 매칭 방법으로 인쇄체 한글을 인식한다. 인식한 문자들은 사용자의 수정을 거쳐 텍스트 문서로 저장할 수 있다.

  • PDF

연결성분 자소를 이용한 문자 인식 연구 (A Study on Character Recognition using Connected Components Grapheme)

  • 이경호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.157-160
    • /
    • 2017
  • 본 연구에서는 한글 문자 인식을 수행하였다. 한글 인식을 수행하되 고딕 인쇄체 문자를 대상으로 하였고, 자소 단위 인식을 통한 인식을 수행하되 기존 한글 문자 인식 연구에서 사용하는 자음과 모음 단위의 자소가 아닌 연결성분을 이용하여 인식하는 새로운 자소를 이용하였다. 새로운 자소들은 끝점, 2선 모임점, 3선 모임점, 4선 모임점의 특징을 추출하고 특징에 의해 자소를 인식하는 데이터베이스를 구성하여 자소를 인식하게 하였다. 또한 연결 성분을 반영한 새로운 자소로 고딕 인쇄체 문자를 인식하므로 추출된 자소를 6가지로 분류하였고, 6가지 자소에 의해 구성되는 92가지 문자 구조를 제안하고 이에 따른 문자를 데이터베이스를 구축하였고, 자소의 무게 중심을 이용한 분포를 이용하여 제안된 구조를 통하여 데이터베이스를 이용한 문자인식을 수행하였다.

  • PDF

연결요소 분석에 기반한 인쇄체 한글 주소와 필기체 한글 주소의 구분 (Classification of Handwritten and Machine-printed Korean Address Image based on Connected Component Analysis)

  • 장승익;정선화;임길택;남윤석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권10호
    • /
    • pp.904-911
    • /
    • 2003
  • 본 논문에서는 우편봉투 상에 기입된 인쇄체 한글 주소와 필기체 한글 주소를 효과적으로 구분할 수 있는 방법을 제안한다. 문자인식 모듈을 포함하는 각종 응용 시스템에서 입력 영상이 인쇄체인지 필기체인지 구분하는 것은 매우 중요하다. 이는 대부분의 경우 인쇄체 영상과 필기체 영상이 갖는 특징이 상이하여, 각 영상에서의 문자 및 문자열 분리 방법, 문자 인식 방법 둥이 매우 상이하게 개발되기 때문이다. 본 논문에서 제안한 구분 방법은 연결요소 추출 및 병합, 특징 추출, 영상 구분 순으로 수행된다. 연결요소 추출 및 병합 단계에서는 입력영상으로부터 연결요소를 추출한 후 일부 연결요소들에 대하여 병합을 시도하며, 특징 추출 단계에서는 병합결과 얻어진 연결요소들의 그룹들로부터 폭과 위치에 관련된 특징을 추출하고, 영상 구분 단계에서는 추출한 특징을 입력으로 제공받는 다충퍼셉트론을 사용하여 구분을 시도한다. 제안한 방법의 우수성을 증명하기 위해 실제 우편물로부터 추출된 3,147개의 한글 주소 영상을 사용하여 실험한 결과, 98.85%의 구분률을 보여주었다.

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of printed hangul text using circular pattern vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.33-33
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

문자 인식에서 단어 간의 활자 인쇄선 위치 분석과 클래스 분류 (Typographical Analyses and Classes of Characters and Words in Optical Character Recognition)

  • 정민철
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.337-342
    • /
    • 2005
  • 본 논문은 활자 인쇄선 분석과 이에 따른 클래스 분류를 제안한다. 활자 인쇄선 분석은 영문 인쇄체 인식에 있어 불가결한 요소이다. 활자 인쇄선 분석은 문자 인식에서 문자 분할을 위한 전처리 단계이다. 본 논문은 두 부분으로 나뉘는데, 첫 부분에서는 단어 간 활자 인쇄선 분석을 통한 단어 활자선 클래스를 정의한다. 두 번째 부분에서는 문자 간 활자 인쇄선 분석을 통한 문자 활자선 클래스를 정의한다. 이렇게 정의된 단어 활자선 클래스와 문자 활자선 클래스는 문자 분할시 정확한 문자 분할을 위하여 사용된다.