• Title/Summary/Keyword: 문자특징 추출

검색결과 252건 처리시간 0.031초

오프라인 문서에서 개별 문자 추출과 한자 인식에 관한 연구 (A Study on the Extraction of an Individual Character and Chinese Characters Recognition on the Off-line Documents)

  • 김의정;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1277-1288
    • /
    • 1997
  • 본 논문에서는 인체 문서 인식을 위한 전처리 과정인 개별 문자 추출 방법과 인식 방법에 대하여 논한다. 전처리에서는 접촉 문자(touching charadcter) 또는 겹친 문자 (overlaapped character) 등과 같이 추출이 곤란한 문자를 개별 문자로 추출하는 것이다. 기존의 문자 분리 방법에서는 투영((projection)에 의한 방법과 외곽선(edge)추척에 의한 방법 등을 사용하여 왔으나, 제안된 방법은 문자열 추출 후 한번의 투영으로 연결 화소를 이용하여 개별 문자를 추출한다. 인식을 위해서는 최대불록화 방법(Maximum Block Mehtod:MBM)을 이용하여 특징 추출을 한다. 최대불록화는 문자를 투영 중 처음 찾아진 점에서부터 최대한 불록을 확정 시키는 방법이다. 문자를 이루는 최대불록들을 직선 불록과 사선 불록으로 분리후 골격화 시킨다. 특히 한자 인식에서 기존의 상용 문자 인식기와 비교하여 향상된 인식율을 얻을 수 있다.

  • PDF

다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 (Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks)

  • 임길택;김호연;남윤석
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.777-784
    • /
    • 2003
  • 본 논문에서는 다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식 방법을 제안한다. 입력 문자영상은 한글 문자 형식 6가지와 한글 이외의 기타 문자 형식의 전체 7가지 형식으로 분류되어 인식된다. 한글 문자는 2단계의 MLP 신경망 인식기에 의해 인식된다. 첫째 단계에서는 한글 문자를 자소의 조합 형태에 따라 2개 또는 3개의 인식단위로 나누고, 각 인식단위에서 추출된 방향각도 특징 벡터를 입력으로 하는 MLP 신경망으로 1차 인식한다. 둘째 단계에서는 첫째 단계의 인식단위별 MLP 신경망 인식기의 인식양상 특징을 추출하고 다른 MLP 신경망에 입력하여 최종 한글 문자인식을 한다. 한글 이외의 기타 문자의 인식을 위해서는 단일 MLP 신경망을 사용한다. 인식 실험에서는 실제 우편물 50,000통 영상으로부터 추출한 문자영상 데이터베이스를 이용하였는데, 실험 결과 본 논문에서 제안한 방법이 매우 우수함을 알 수 있었다.

필기체 한글의 오프라인 인식을 위한 획 정합 방법 (A Stroke Matching Method for the Off-line Recognition of Handprinted Hanguls)

  • 김기철;이성환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.225-235
    • /
    • 1992
  • 본 논문은 오프라인 필기체 한글 인식에 관한 연구로서, 입력 문자 영상에 대한 위치 정규화, 외곽선 추적 및 세선화의 전처리 과정을 거쳐 외곽선의 방향 성분 분포, 세선화한 결과의 방향 성분 분포, 구조적 특징점 분포 등의 특징을 추출한 다음, 획을 추출하여 획의 방향과 길이에 대한중점 분포 특징으로 정합하는 필기 한글의 인식을 위한 획 정합 방법을 제안하였다. 인식 시간의 단축을 위해 먼저 외곽선의 방향성분분포를 이용하여 대분류하였으며, 한글 사용 빈도수 상위 520자로 구성되는 필기 데이타에 대한 실험 결과, 평균 91%의 인식률과 평균 0.46초의 문자당 인식 시간을 보임으로써 제안된 획 정합 방법이 입력 문자의 잡영이나 획의 기울기에 대한 변형을 효과적으로 흡수할 수 있음을 알 수 있었다.

  • PDF

문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에서의 텍스트 영역 추출 (Text Region Extraction using Pattern Histogram of Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 추계학술발표논문집
    • /
    • pp.220-224
    • /
    • 2006
  • 자연이미지에 포함된 텍스트는 많은 중요한 정보를 포함하고 있다. 그러므로 자연이미지에서 텍스트를 추출할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 문자-에지 맵 패턴 히스토그램 분석함으로서 텍스트 영역을 추출하는 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하여 16가지 에지 맵을 생성하고, 에지 맵을 조합하여 문자 특징을 갖는 8가지 문자-에지 맵을 생성한다. 8가지 문자-에지 맵과 16가지 에지 맵을 이용하여 텍스트 후보 영역을 추출하고, 문자-에지 맵의 패턴 히스토그램 및 텍스트 영역의 구조적 특징을 이용하여 텍스트 후보 영역에 대한 검증을 수행하였다. 제안한 방법은 다양한 종류의 자연이미지를 대상으로 실험하였고, 복잡한 배경, 다양한 글꼴, 다양한 텍스트 컬러로 구성된 자연이미지에서 텍스트 영역을 효과적으로 추출하였다.

  • PDF

웨어러블 장치를 위한 3D 온라인 필기인식 시스템 (3D On-line Handwriting Character Recognition System for Wearable Devices)

  • 김민지;최린
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1100-1103
    • /
    • 2014
  • 본 논문에서는 웨어러블 장치에서 펜 형태 또는 손가락 부착 형태의 입력 인터페이스로 사용할 수 있는 3D 온라인 필기인식 시스템을 제안한다. 3 축 가속도 센서와 자이로 센서를 장착한 입력 인터페이스를 사용하여 사용자는 손의 움직임을 통해 웨어러블 기기 또는 스마트 기기에 문자를 입력할 수 있다. 본 연구에서 제안하는 3D 필기인식 시스템은 필기 경로를 복원하여 획을 추출하고, 3 차원 공간의 필기문자에서 나타나는 기울임이나 왜곡, 겹쳐 쓰기를 고려한 특징점 추출 과정을 거친다. 추출한 특징점을 2 단계 결정 트리의 입력으로 사용하여 사용자가 공간상에서 필기한 알파벳을 인식한다. 10 명의 사용자에게 3 회의 필기 데이터를 입력 받아 총 780 개의 문자를 인식한 결과, 87.69%의 인식률을 얻을 수 있었다.

개선된 동적 타임 워핑 알고리즘을 이용한 효율적인 필기문자 감정 (Efficient Handwritten Character Verification Using an Improved Dynamic Time Warping Algorithm)

  • 장석우;박영재;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.19-26
    • /
    • 2010
  • 본 논문에서는 온라인 환경에서 필기 문자열을 입력받고, 입력된 문자열의 유사성을 자동으로 분석하여 두 필적이 동일인에 의해 작성된 것인지를 판단하는 새로운 필적 감정 방법을 제안한다. 제안된 방법에서는 먼저 온라인으로 입력된 문자열에 회전 프로젝션(circular projection) 방법을 적용하여 모양, 방향 등과 같이 문자열이 가진 고유의 특징을 추출하여 벡터의 형태로 저장한다. 그런 다음, 문자 인식 분야에서 많이 사용되는 기존의 동적 타임 워핑 알고리즘을 개선하여, 이를 입력된 두 문자열의 특징 벡터의 유사성을 추출하는데 적용한다. 본 논문에서 개선된 동적 타임 워핑 알고리즘은 최적화 문제에서 좋은 결과를 산출한다고 알려진 분기한정법(branch and bound)의 개념을 기존의 동적 타임 워핑 알고리즘에 효과적으로 결합함으로써 기존의 동적 타임 워핑 알고리즘의 효율을 향상시켰다. 제안된 필기 문자열 감정 알고리즘의 성능을 확인하기 위한 실험에서는 다양하게 입력된 필기 문자열을 가지고 제안된 방법의 성능을 비교 하였으며, 그 결과 제안된 방법이 기존의 알고리즘에 비해 보다 효율적으로 필적을 감정하였음을 검증하였다.

수직 강화 모폴로지와 Hough Transform을 이용한 차량 번호판 추출과 문자의 자모 분리 (Car Plate Detection using Morphology & Hough Transform And Separating Consonant & Vowel)

  • 이병모;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.789-792
    • /
    • 2001
  • 본 논문은 자동차의 번호판 인식 시스템의 한 부분인 번호판 추출과 자모 분리를 통한 문자 인식까지의 과정을 실험한 것이다. 본 논문은 gray-level에서 영상을 실험하였고, 번호판을 추출하기 위해서 morphology를 반복 적용하고 크기 보정을 통해 번호판을 추출하며, hough transform을 이용한 크기 재보정을 통해 최종적으로 번호판을 추출한다. 그리고, 문자 인식 단계에서는 먼저 hough transform을 사용하여 한글의 모음의 시작점을 얻고, 문자 특징을 이용하여 자음과 모음을 분리하여 모음을 인식한다.

  • PDF

다해상도 웨이블릿 변환과 써포트 벡터 머신을 이용한 자연영상에서의 문자 영역 검증 (Text Region Verification in Natural Scene Images using Multi-resolution Wavelet Transform and Support Vector Machine)

  • 배경숙;최영우
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.667-674
    • /
    • 2004
  • 이미지에서 문자 추출은 영상을 이해하기 위한 가장 기초적이고 중요한 문제이다. 본 논문에서는 문자의 획 특징을 이용하는 통계적인 방법으로 문자 영역을 검증하는 방법을 제안한다. 제안하는 방법은 $16\times16$ 크기의 텍스트와 비텍스트 이미지를 웨이블릿(wavelet) 변환하여 문자의 획과 방향성을 표현하는 35차원의 특징을 추출한다. 추출된 특징 중 변별력이 높은 특징만을 선택하여 SVM(Support Vector Machine) 분류기를 구성한다. 분류기론 이용하여 $16\times16$크기의 윈도우로 검증 영역을 스캔하면서, 각각의 윈도우를 텍스트와 비텍스트로 분류하고 최종적으로 검증 영역의 텍스트 여부를 결정한다. 제안한 방법을 적용함으로써 텍스트와 유사하여 구별하기 어려운 비텍스트 영역을 검증할 수 있었다.

Haar-like Feature 및 CLNF 알고리즘을 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Haar-like Feature and CLNF Algorithm)

  • 박승현;조성원
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.15-23
    • /
    • 2016
  • 본 논문은 한국의 차량 번호판 인식에 효과적인 방법을 제안한다. 획득한 자동차 이미지로부터 Haar-Like Feature를 이용해 대략적인 번호판 후보 영역을 찾아낸 후, 랭크 필터를 사용하여 전처리를 하고 캐니 에지 추출 (Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 알고리즘을 사용하여 학습된 신경망을 이용하여 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.

자연영상에서 적응적 문자-에지 맵 특징을 이용한 텍스트 영역 검출 (Text Region Detection using Feature of Adaptive Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 춘계학술발표논문집
    • /
    • pp.181-184
    • /
    • 2007
  • 자연영상에 포함된 텍스트는 많은 중요한 정보를 포함하고 있으므로 자연영상에서 텍스트 정보를 검출하는 연구가 활발히 진행되고 있다. 본 논문에서는 문자 영역의 구조적인 특정을 배열문법으로 정의한 적응적 문자-에지 맵을 제안하여 텍스트 영역을 검출한다. 캐니-에지 검출기로 에지를 추출하고, 생성된 에지 이미지를 레이블링하고 그 영역의 문자구조 특징을 분석하기 위해서 적응적 문자-에지 맵을 분석한다. 적응적 문자-에지 랩의 분포 상태를 분석함으로서 텍스트 후보 영역을 검출하고, 텍스트 영역의 에지 히스토그램 프로파일을 분석함으로서 텍스트 후보 영역에 대한 검증을 수행하여 최종적인 텍스트 영역을 검출한다. 제안한 방법은 다양한 종류의 자연영상을 대상으로 실험하였고, 기울어진 텍스트와 다양한 크기의 텍스트 구성된 자연영상에서 텍스트 영역을 효과적으로 검출하였다.

  • PDF