• 제목/요약/키워드: 문서영상 분할

검색결과 52건 처리시간 0.021초

연결요소 방법과 메디안 필터를 이용한 문서영상 기하학적 구조분석 (The Geometric Layout Analysis of the Document Image Using Connected Components Method and Median Filter)

  • 장대근;황찬식
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.805-813
    • /
    • 2002
  • 인쇄문서를 전자문서로 자동전환하기 위해서는 먼저 문서영상의 기하학적 구조를 분석하여 문자, 그림, 표 등의 세부 영역으로 분류해야한다. 그러나 문서구조의 복잡성과 그림의 크기와 밀도의 다양함은 기하학적 구조분석을 어렵게 만드는 원인이 되고 있다. 본 논문에서는 연결요소 기반의 방법을 이용하여 복잡한 구조의 문서도 세부적 영역분할이 가능하며, separable 메디안 필터를 이용하여 크기와 밀도가 다양한 문자가 그림을 분류하고, 1차원 메디안 필터를 수평, 수직방향으로 각각 적용하여 표를 구성하는 직선이 훼손되거나 직선에 문자가 붙어있는 경우에도 추출을 가능하게 함으로써, 상용제품이나 기존의 방법에 비해 영역분할 및 분류 그리고 표를 구성하는 직선추출이 우수한 방법을 제안한다.

k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법 (Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering)

  • 류제웅;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

웨이블릿 계수의 통계적 이산 분석을 이용한 문서 영상 분할 (Document Image Segmentation by the Statistical Distribution Analysis of Wavelet Coefficients)

  • 이인수;김민수;김우성;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.927-930
    • /
    • 2000
  • 본 논문은 문서 영상에 대해 투영을 사용하여 영역을 나누었고 각 영역에 대해 고주파 밴드의 웨이블렛 계수의 통계적 분산과 히스토그램을 기반으로 한 두 가지 특징을 사용하여 문자와 그림으로 분류하였다. 투영으로 나누어진 영역들에 대해 일정 크기의 블록으로 나누고 두 가지 특징에 따라 문자와 그림으로 분류하였다. 따라서 투영에 의해 나뉜 영역 중 문자와 그림이 혼합되어 의미가 모호한 영역에 대해 잘못 분류되는 가능성을 줄일 수 있었다.

  • PDF

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.

운송 컨테이너 영상의 효율적인 문자인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Efficient Character Recognization of Shipping Container Image)

  • 최재영;김낙빈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.1077-1083
    • /
    • 2000
  • 본 논문은 운송 컨테이너 식별자의 자동화 처리를 위한 문자 인식의 단계중 최종 문자 인식 전단계 까지의 처리 과정을 컨테이너의 특성에 맞게 제안하였으며, 이러한 전처리 과정은 문자 인식 시스템의 성능에 중요한 영향을 미친다. 제안한 방법은 먼저 입력된 컨테이너 컬러 영상을 명암 영상으로 바꾸고 전체 영상중 인식에 필요한 식별자 영역만을 경계선 검출과 형태학적 연산을 이용하여 추출한다. 이어서 다양한 배경색과 문자색을 판단하여 일반 문서와 같이 일관성있게 통일한 후, DCT를 이용한 명암도별 이진영역으로 분할한 후에 Otsu방법과 새로운 이진화방법을 자동으로 선택하여 효율적인 이진화가 이루어지도록 하였다. 이렇게 얻어진 이진 영상은 문자인식 단계로 넘어갈 수 있도록 개별 문자로 분할한다. 이 방법은 컨테이너 영상의 불균등한 배경색과 잡음으로 인하여 문자인식에 오류가 생기는 단점을 보완하였으며 컨테이너 특성을 최대한 반영함으로써 효과적인 전처리 결과를 얻을 수 있었다. 또한, 제안한 방법의 응용은 컨테이너 이외의 다른 상황에서도 매우 효과적으로 사용될 수 있으리라 본다.

  • PDF

다중 LBP 피처를 이용한 지문 정보 마스킹 알고리즘 (Fingerprint Information Masking Algorithm By Using Multiple LBP Features)

  • 김진호
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.281-288
    • /
    • 2017
  • 금융위원회는 2019년도까지 금융기관 및 공공기관 등에서 보유하고 있는 문서에서 지문 정보를 폐기 조치하라고 통보했다. 이를 위해 문서 영상에서 지문 정보를 검출하고 마스킹하기 위한 상용 솔루션들이 발표되고 있다. 본 논문에서는 문서 영상에 다양한 형태로 기록된 지문 후보들을 분할한 다음 인공신경망 분류기로 지문인지 여부를 판단할 때 지문의 특징이 잘 반영된 피처를 추출하기 위해 다중 LBP 피처를 설계하고 이를 이용해서 지문 정보를 마스킹하는 알고리즘을 제안하였다. 제안한 지문 정보 마스킹 알고리즘을 이용하여 금융권에서 보유하고 있는 3,497장의 문서 영상을 대상으로 지문 마스킹 실험을 수행한 결과 96.4%의 지문을 마스킹 할 수 있어서 본 알고리즘이 실제 지문 정보 마스킹 작업에 효과적으로 활용될 수 있음을 확인하였다.

세금계산서 상에서의 관심 데이터 추출 (Field Data Extraction on Tax Form Image)

  • 정재영;유돈극
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2001년도 춘계학술대회논문집:21세기 신지식정보의 창출
    • /
    • pp.268-279
    • /
    • 2001
  • 본 논문에서는 세금 계산서 상에서의 관심 영역 및 관심 영역 내의 데이터를 추출하는 알고리즘을 제안한다. 먼저, 입력되는 세금 계산서 영상의 색상 정보를 이용하여 서식을 자동으로 추출한다. 추출된 서식 영상을 가지고 문서의 기울기 및 관심 대상 영역의 위치를 파악한 후, 원 영상에 대하여 관심영역을 추출한다. 관심영역에 대한 히스토그램을 분석하여 바탕 영역으로부터 인식 대상 데이터를 추출한다. 제안한 알고리즘을 다양한 화질의 세금 계산서 영상에 대하여 적용한 결과, 정확하게 관심 영역을 분할해내고 인식 대상 데이터를 추출할 수 있음을 보인다.

  • PDF

자연영상 텍스트 이진화를 위한 3단계 색상 군집화 알고리즘 (Three-Level Color Clustering Algorithm for Binarizing Scene Text Images)

  • 김지수;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.737-744
    • /
    • 2005
  • 본 논문에서는 자연 영상에서 추출된 텍스트 영상의 이진화를 위한 3단계 색상 분할 알고리즘을 제안한다. 1단계 색상 분할은 입력 영상 중에서 텍스트색상과 배경색상이 잘 구별되는 단순 영상의 이진화를 수행하고, 2단계 색상 분할은 입력 영상에 고주파 필터를 적용하여 자연조명 이나 인공조명에 영향을 받은 영상의 이진화를 수행하며, 3단계 색상 분할은 저주파 필터를 기반으로 텍스트나 배경에 텍스쳐가 존재하는 영상의 이진화를 수행한다. 제안한 이진화 알고리즘이 그레이 정보를 이용하는 이진화 알고리즘보다 효과적으로 텍스트 영역을 이진화함을 입증하기 위해 상용문서 인식기인 아르미 6.0을 사용하여 이진화된 문자영상에 대한 인식 실험을 실행하였다. 그 결과 제안한 알고리즘의 필드 단위 인식률이 그레이 정보를 이용한 이진화 알고리즘의 인식률보다 $35\%$ 이상 우수함을 관측하였다.

최단 경로 알고리즘을 이용한 접합 영문자 분할 (Minimum-cost Path Algorithm for Separating Touching English Characters)

  • 이득용;오일석
    • 전자공학회논문지
    • /
    • 제49권10호
    • /
    • pp.102-108
    • /
    • 2012
  • 본 논문은 명암 영상에서 최단 경로 알고리즘을 이용해 인쇄체 접합 문자를 비선형으로 분리하는 방법을 제안한다. 기존의 최단 경로 알고리즘은 특정한 형태의 접합문자를 분할하지 못하는 단점을 가지고 있다. 우리는 기존 알고리즘이 실패하는 상황을 분석하고, 분석 결과를 활용하여 기존 알고리즘이 사용하는 규칙의 문제점을 파악하였다. 그런 후 기존 알고리즘을 두 가지 방향에서 개선하였다. 첫째, 새로운 벌칙항을 추가하여 보다 정교한 경로를 추정하였다. 둘째, 경로 탐색 시 상향 탐색과 하향 탐색을 병행하고 보다 좋은 해를 선택하였다. 실험을 통해 제안하는 알고리즘이 기존 알고리즘에 비해 분할 성공률 면에서 3~4%정도 우수함을 입증하였다.

공간의존행렬과 신경망을 이용한 문서영상의 효과적인 블록분할과 유형분류 (An Efficient Block Segmentation and Classification Method for Document Image Analysis Using SGLDM and BP)

  • 김중수;이정환;최흥문
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.937-946
    • /
    • 1995
  • 본 논문에서는 공간의존행렬과 신경망을 이용하여 문서영상에서 인식대상 문자가 포함되어 있는 블록들을 좀더 세분해 낼 수 있는 효과적인 방법을 제시 하였다. 제안 된 방법은 명암도 문서블록에서 공간의존행렬을 구하고 7가지 질감 특징을 추출한 뒤 신경망을 이용해 문서블록을 9가지 유형으로 분류할 수 있도록 하였다. 특히 기존에는 비문자영역으로 분류되던 수식, 도표, 순서도 등 주로 문자가 포함되어 있는 블록들을 세분해 낼 수 있도록 하였다. 또한 신경망 학습알고리즘인 BP 를 사용함으로써 기존의 선형분류시에 요구되던 유형별 임계값과 선형면결정지수를 찾는 어려움을 해소하였다. 명암도영상을 이진화하기 전에 먼저 Sobel연산을 적용함으로써 문서 뒷면에 의한 배경 잡음의 영향을 줄일 수 있도록 하였고, 교차 문지르기 후 분할함으로써 블록이 작은 조각으로 나누어지는 것을 방지하도록 하였다. 실험결과 제안한 방법에서는 문자가 포 함되어 있는 블록은 큰 문자, 중간문자, 작은 문자블록 및 수식, 순서도, 도표블록의 6가지로, 그리고 비문자블록은 인물사진, 그래프 등 3가지 유형으로 상세하게 분류 할수 堞있었으며 전체적인 분류성능도 우수함을 확인할 수 있었다.

  • PDF