• 제목/요약/키워드: 문자 추출

검색결과 670건 처리시간 0.025초

주파수 특성과 역전파 신경망 알고리즘을 이용한 문자 영역 분할 방법 (A method for Character Segmentation using Frequence Characteristics and Back Propagation Neural Network)

  • 전병태;송치양
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.55-60
    • /
    • 2006
  • 문자 영역 추출을 위해서 FFT와 신경망을 이용한 방법을 본 논문에서 제안하고자 한다. 일반적으로 문자 영역은 고주파 영역에서 발견되므로 FFT를 이용하여 이 특징을 추출할 수 있다. 문자(고 주파) 영역과 비 문자(저 주파) 영역을 신경망에 학습을 시킨다. 신경망에 고주파 영역을 입력으로써 후보 영역을 추출한다. 그리고 최종 문자 영역은 후보 영역 검증을 통하여 추출된다. 실험 결과 후보 영역 추출은 학습된 경우 100% 추출율을 보여주고 있으며, 검증을 통한 후보 영역 추출율은 95%임을 알 수 있었다. 제안된 알고리즘의 장점은 알고리즘의 단순성과 실시간 처리에 있다.

  • PDF

문서 영상의 그림 영역에서 효과적인 단어 영상 추출에 관한 연구 (A Study on an Efficient method of Word Decomposition from Document Images)

  • 정창부;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.689-692
    • /
    • 2006
  • 본 논문에서는 그림 영역에서 단어 영상을 효과적으로 추출하는 방법을 제안한다. 제안 방법은 문자 성분과 그래픽 성분을 분류하기 위하여 구성 원소들의 통계값을 이용하는 상자그림 분석을 응용하고, 분류된 문자 성분들에 대하여 지역적 밀집도를 분석하여 문자 영역을 추출한다. 추출된 문자 영역에서 문자열 및 단어 영상을 추출하는 방법은 투영 히스토그램 분석 등을 적용한다. 제안 방법은 임계치 대신에 그림 영역의 통계값을 이용하였기 때문에 그림의 형태 변화에 민감하지 않으며, 지역적 밀집도 분석으로 보다 정확한 문자 영역을 추출하였다.

  • PDF

동영상에 삽입된 자막 내 문자영역화소추출 (Extraction text-region's pixel on caption of video)

  • 안권재;김계영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.43-45
    • /
    • 2011
  • 본 논문은 동영상 내 삽입된 자막을 문자인식이 가능하도록 문자영역을 이루는 화소를 추출하는 방법을 제안한다. 최초 자막영상을 통계학적 방법을 이용하여 색상극성을 결정한다. 이 후 색상극성에 따른 잡음제거 방법을 명암값기반과 형태학적기반으로 달리한다. 제안된 방법은 각 색상결정에 따른 적합한 잡음제거를 수행함으로서 추출된 화소들이 이루는 문자영역의 영상을 이용하여 문자인식을 수행하였을 때 기존방법보다 높은 문자인식률을 보였다.

  • PDF

윤곽선 추적 알고리즘과 개선된 ART1을 이용한 영문 명함 인식에 관한 연구 (A Study on the Recognition of an English Calling Card by using Contour Tracking Algorithm and Enhanced ART1)

  • 김광백;김철기;김정원
    • 지능정보연구
    • /
    • 제8권2호
    • /
    • pp.105-115
    • /
    • 2002
  • 본 논문에서는 4 방향 윤곽선 추적 알고리즘(contour tracking algorithm)과 개선된 ART1을 이용한 영문 명함인식 방법을 제안한다. 영문 명함 영상에서 문자열 추출은 영상을 3배로 축소하여 수평 스미어링 기법(smearing method)과 4방향 윤곽선 추적 방법을 적용하여 문자열 후보 영역을 추출하고 수평 및 수직의 비율과 면적을 이용하여 문자열 영역과 비문자열 영역을 구분하였다. 추출된 문자열 영역에서 개별 문자 추출은 수평 스미링 기법과 윤곽선 추적 알고리즘을 이용하여 추출하였고 개별 문자들의 인식은 ART1 알고리즘을 개선하여 인식에 적용하였다. 본 논문에서 제안한 ARTI 알고리즘은 퍼지 합 접속 연산자를 이용하여 유사도를 동적으로 조정함으로써 기존의 ART1을 개선하였다. 추출 및 인식 실험 결과, 제안된 추출 및 인식 방법이 영문 명함 인식에서 효율적인 것을 확인하였다.

  • PDF

문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에세 텍스트 영역 추출 (Text Region Extraction Using Pattern Histogram of Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;전병민
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1167-1174
    • /
    • 2006
  • 자연이미지로부터 텍스트 영역 추출은 자동차 번호판 인식 등과 같은 많은 응용프로그램에서 유용하다. 따라서 본 논문은 문자-에지 맵의 패턴 히스토그램을 이용한 텍스트 영역을 추출하는 방법을 제안한다. 16종류의 에지맵을 생성하고, 이것을 조합하여 문자 특징을 갖는 8종류 문자-에지 맵 특징을 추출한다. 문자-에지 맵의 특징을 이용하여 텍스트 후보 영역을 추출하고, 텍스트 후보 영역에 대한 검증은 문자-에지 맵의 패턴 히스토그램 및 텍스트 영역의 구조적 특징을 이용하였다. 실험결과 제안한 방법은 복잡한 배경, 다양한 글꼴, 다양한 텍스트 컬러로 구성된 자연이미지로부터 텍스트 영역을 효과적으로 추출하였다.

  • PDF

사전 정보를 이용한 자동차 번호판의 문자 위치 추출과 세그멘테이션에 관한 연구 (A Study of plate Number Extraction and Segmentation using domain Knowledge)

  • 김병훈;고미애;김영모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2003
  • 차량 번호판 인식 시스템의 번호판 인식과정은 영상획득 및 번호판 영역 추출, 개별문자 추출, 문자 인식의 3가지 핵심부분으로 구성된다. 이 중에서도 번호판 추출의 정확성은 시스템 전체의 결과에 영향을 줄 수 있는 부분이며 다양한 주변 환경에도 정확한 추출과 빠른 수행 시간을 요구한다. 본 논문에서는 검출 시간의 단축을 위하여 명암값의 차이와 사전정보를 이용하여 먼저 인식대상의 주목표인 등록번호의 위치를 추출 및 검증하고 등록번호에 대한 지역명의 상대적인 위치 정보를 이용하여 문자의 대략적인 위치를 선정, 각 요소들의 외곽 근접 선들의 투영(protection)과 이동을 통하여 번호판의 모든 문자 요소의 위치를 추출한다.

  • PDF

신경망 기반의 텍스춰 분석을 이용한 효율적인 문자 추출 (Efficient Text Localization using MLP-based Texture Classification)

  • 정기철;김광인;한정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.180-191
    • /
    • 2002
  • 본 논문은 MLP와 MultiCAMShift 알고리즘을 이용한 텍스춰 기반의 영상 내 문자 추출 방법을 제안한다. MLP를 이용한 텍스춰 분석기는 별도의 특징값 추출 단계 없이 다양한 환경의 입력 영상에 대해 효과적으로 문자 확률 영상을 생성하며, 문자 확률 영상 상에서 수행되는 MultiCAMShift 알고리즘은 국소 탐색만으로 효율적으로 문자 영역을 추출할 수 있다.

시각 신경계 반응 모델에 근거한 필기체 off-line 문자에서의 특징 추출 (Feature Extraction of Off-line Handwritten Characters Based on Optical Neural Field)

  • 홍경호;정은화;안병철
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3530-3538
    • /
    • 1999
  • 필기체 오프라인 문자 인식을 위한 특징 추출의 새로군 접근 방법으로, 인간의 시각 신경계의 반응모델에 근거한 특징 추출 방법을 제안한다. 필기체 문자의 특징 추출을 위한 신경망은 평활화 처리, 외곽선 제거, 특징 정보 추출의 3가지 단계로 나누어진다. 필기체 문자에서 발생하기 쉬운 매끄럽지 못한 화소들을 전처리 단계인 평활화 처리를 통해 제거한다. 다음 단계로 인식에 영향을 주지 않는 외곽선 정보를 추출하여 이를 제거한다. 그리고 마지막으로 문자 특징에 해당하는 정보를 추출한다. 제안된 특징 추출 시스템의 타당성을 확인하기 위한 실험은 필기체 오프라인 문자인 PE2 데이터를 사용하였다. 실험을 통해 시각 신경계 반응모델에 근거한 필기체 문자의 특징을 추출하는 시스템은 곡선이나 원, 사각형이 포함된 형태의 필기 문자에서도 특징 추출이 용이하다는 것을 확인할 수 있다.

  • PDF

손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화 (Documentation of Printed Hangul Images of the Selected Area by Finger Movement)

  • 백승복;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.51-54
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글영상을 편집 가능한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트럼으로 손가락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다

  • PDF

다중색상 모델과 문자배치 정보를 이용한 복잡한 배경 영상에서의 자동차 번호판 추출 (A License Plate Detection Method Using Multiple-Color Model and Character Layout Information in Complex Background)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1515-1524
    • /
    • 2008
  • 본 논문에서는 복잡한 배경이 나타나는 자동차 영상에서 다중색상 모델과 문자배치 정보를 이용한 번호판 추출 방법을 제안한다. 녹색 번호판과 흰색 번호판에 나타나는 문자의 배치 형태가 다르기 때문에, 먼저 번호판 색상을 추정한 후 해당 색상 번호판의 문자배치 정보를 최대한 활용하는 접근 방식을 사용하였다. RGB 색상 모델에 HSI와 YIQ 색상 모델을 결합한 다중색상 모델을 이용하여 녹색 영역이 추출되면, 해당 영역에서 추출된 연결요소를 분석하여 녹색 번호판의 문자배치 형태를 탐색한다. 이때 번호판이 추출되지 않으면, 전체 영역에서 추출된 연결요소를 분석하여 흰색 번호판의 문자배치 형태를 탐색한다. 마지막으로 번호판 문자배치 형태와 유사한 연결요소들을 묶어 번호판을 추출한다. 4개 영상에 대한 실험 결과 98.1%의 번호판 추출 성공률을 얻었으며, 제안된 방법이 빛의 세기, 그림자, 그리고 날씨의 변화에도 강건함을 알 수 있었다.

  • PDF