• 제목/요약/키워드: Document Image Processing

검색결과 105건 처리시간 0.025초

이미지 필터와 제한조건을 이용한 문서영상 구조분석 (Document Image Layout Analysis Using Image Filters and Constrained Conditions)

  • 장대근;황찬식
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.311-318
    • /
    • 2002
  • 문서영상 구조분석은 문서영상을 세부 영역으로 분할하는 과정과 분할된 영역을 문자, 그림, 표 등으로 분류하는 과정을 포함한다. 이 중 영역분류 과정에서 영역의 크기, 흑화소 밀도, 화소 분포의 복잡도는 영역을 분류하는 기준이 된다. 그러나 그림의 경우 이러한 기준들의 범위가 넓어 경계를 정하기 어려우므로 다른 형태에 비해 상대적으로 오분류의 비율이 높다. 본 논문에서는 그림과 문자를 분류하는 과정에서 영역의 크기, 흑화소 밀도, 화소 분포의 복잡도에 의한 영향을 줄이기 위하여 메디안 필터를 이용하고, 영역확장 필터(region expanding filter)와 제한 조건들을 이용하여 영역분류에서의 오분류를 수정함으로써 상용제품을 포함한 기존 방법에 비해 그림과 문자의 분류가 우수한 문서영상 구조 분석 방법을 제안한다.

문서 영상의 영역 분류와 회전각 검출 (A Block Classification and Rotation Angle Extraction for Document Image)

  • 모문정;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.509-516
    • /
    • 2002
  • 본 논문에서는 그림, 글자, 표, 직선 등과 같은 다양한 정보를 포함하는 문서 영상 인식에 대한 효율적인 알고리즘을 제안한다. 이 시스템은 문서영상의 기울짐을 보정하기 위한 회전각검출 단계, 불필요한 배경영역을 제거하는 단계, 문서영상에 내재된 각 구성요소를 검출하는 분류 단계로 구성된다. 알고리즘은 문서의 기울어짐에 의해서 발생되는 오류를 최소화하기 위한 회전각 검출과정과 검출된 회전각을 기반으로 문서를 보정하는 전처리단계를 수행한다. 입력된 문서영상의 수평성분과 수직성분만을 이용하여 회전각을 검출하고, 문서의 구성요소 검출과정에서 불필요한 배경영역을 제거함으로써 계산시간을 최소화하였다. 그리고 영상에 내재된 그림영역, 글자영역, 표영역, 직선영역 둥의 다양한 구성요소를 분류한다. 제안한 문서 인식 시스템의 성능 평가를 위해서 다양한 문서영상에 제안한 방법을 적용하고 성공적인 결과를 보인다.

Document Structure Understanding on Subjects Registration Table

  • Ito, Yuichi;Ohno, Masanaga;Tsuruoka, Shinji;Yoshikawa, Tomohiro;Tsuyoshi, Shinogi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.571-574
    • /
    • 2003
  • This research is aimed to automate the generating process of the database from paper based table forms like this work. The registration table has so complicate table structures, ana in this research we used the registration tables as an example of general table structure understanding. We propose a table structure understanding system for some table types, and it has some steps. The first step is that the document images on paper are read from the image scanner. The second step is that a document image segments into some tables. In the third step, the character strings is extracted using image processing technology and the property of the character strings is determined. And the structured database is generated automatically. The proposed system consists of two systems. "Master document generation system" is used for the table form definition, and it doesn′t include the handwritten characters. "Structure analysis system for complete d table" is used for the written form, and it analyzes the table form filled in the handwritten character. We implemented the system using MS Visual C++ on Windows, and it can get the correct extraction rate 98% among 51 registration tables written by the different students.

  • PDF

양식 문서 영상에서 도표 구조 분석을 위한 라인 추적 알고리즘 (Line Tracking Algorithm for Table Structure Analysis in Form Document Image)

  • 김계경
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.151-159
    • /
    • 2021
  • 도표로 작성된 양식 문서에서 도표의 레이아웃 해석에 필요한 그리드 라인을 추출하기 위해 다양한 필터링 또는 모폴로지 등의 방법을 사용하여 직선 성분을 선명하게 개선시키기 위한 연구들이 많이 진행되고 있다. 도표의 직선 성분을 선명화하더라도 직선 내부에 절단 점들이 존재하거나 기울어진 경우에는 직선 추출이 어렵고 도표 셀들의 레이아웃을 논리적으로 표현하는데 여전히 어려움을 겪을 수 있다. 본 연구에서는 직선에 절단점들이 존재하거나 기울어져도 직선을 검출할 수 있는 라인 추적 알고리즘을 제안하였다. 이를 이용하여 그리드 라인을 추출하고 라인들의 교차점 및 셀 정보들을 찾아 도표의 구조를 분석할 수 있는 알고리즘을 마련하였다. 제안한 알고리즘을 실제 양식 문서 영상을 대상으로 실험한 결과 평균 0.41초 처리시간에 96.4%의 도표 구조를 분석할 수 있음을 확인하였다.

전문 처리를 위한 웹 기반 정보시스템 구현 (Implementation of Web-based Information System for Full-text Processing)

  • 김상도;문병주;류근호
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1481-1492
    • /
    • 1999
  • 1990년대 웹 개념의 등장으로 인터넷을 개방형 네트?, 사용자 친근성 및 편의성이라는 특성을 바탕으로 급속히 일반화되면서 각종 정보를 제공하는 정보 시스템에서도 커다란 변화를 가져왔다. 웹은 텍스트 정보뿐만 아니라 이미지, 오디오, 비디오 등 멀티미디어 정보를 쉽게 제공함으로써 기존 정보 시스템의 웹 기반으로의 전환을 가속화시키게 되었다. 물론 정보 내용도 텍스트 위주의 단순 초록 정보에서 전문(Full-Text) 정보로 급속히 이전되기 시작하였으며, 전문 정보를 처리하는 다양한 문서 포맷들로 등장하기 시작하였다. 하지만, 전문 정보는 본질적으로 대용량의 시스템 메모리, 막대한 처리시간, 보다 많은 전송용량 등을 요구하게 되므로 웹 기반 전문 시스템의 구축시 이러한 요인들을 세밀하게 비교 평가하여야 한다. 따라서 본 연구는 웹 기반 정보 시스템에서 어떻게 전문을 처리할 것인가에 초점을 맞추어 문서의 통합 정보 기능을 제공하는 정보시스템을 설계 구현한다. 먼저 인터넷상에서 표준 문서형식으로 사용중이거나 개발중인 문서 포맷들의 특징을 검토하고, 정보 시스템의 관점에서 전문정보를 어떤 문서 포맷으로 처리하는 것이 적합한가를 실험하고 평가한다. 그리고 이를 기반으로 본 연구의 목적인 전문 정보를 PDF 문서로 제공하는 웹 기반 정보 시스템을 설계 구현한다.

  • PDF

문자 영역 검출과 다운샘플링을 이용한 잡음에 강인한 문서 영상 이진화 (Noise Robust Document Image Binarization using Text Region Detection and Down Sampli)

  • 정진욱;전경구
    • 한국멀티미디어학회논문지
    • /
    • 제18권7호
    • /
    • pp.843-852
    • /
    • 2015
  • Binarization of document images is a critical pre-processing step required for character recognition. Even though various research efforts have been devoted, the quality of binarization results largely depends on the noise amount and condition of images. We propose a new binarization method that combines Maximally Stable External Region(MSER) with down-sampling. Particularly, we propose to apply different threshold values for character regions, which turns out to be effective in reducing noise. Through a set of experiments on test images, we confirmed that the proposed method was superior to existing methods in reducing noise, while the increase of execution time is limited.

인보이스 서류 영상의 테이블 헤더 문자 분류를 통한 구매 정보 추출 모델 (Purchase Information Extraction Model From Scanned Invoice Document Image By Classification Of Invoice Table Header Texts)

  • 신현경
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.383-387
    • /
    • 2012
  • 스캔된 인보이스에 특화된 서류 관리 자동화 시스템 구축에있어서 추출된 금전적 데이터의 정확도에대한 엄격한 요구는 인보이스 테이블을 위한 발생적 모델 설계에서 자체 인증 절차를 포함하는 것을 필요로 한다. 가격 = 단가 ${\times}$ 구매수량과 같은 내부적 관계식을 활용한 단순한 인증 절차를 사용하는 것이 전형적 방법론이다. 본 논문에서 는 영상내 테이블 헤더 부분의 탐색과 탐색된 헤더의 컬럼 구분자를 활용하는 개선된 자동 인증 절차를 갖춘 인보이스내 정보 추출 모델을 제안한다.

딥러닝을 통한 문서 내 표 항목 분류 및 인식 방법 (Methods of Classification and Character Recognition for Table Items through Deep Learning)

  • 이동석;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제24권5호
    • /
    • pp.651-658
    • /
    • 2021
  • In this paper, we propose methods for character recognition and classification for table items through deep learning. First, table areas are detected in a document image through CNN. After that, table areas are separated by separators such as vertical lines. The text in document is recognized through a neural network combined with CNN and RNN. To correct errors in the character recognition, multiple candidates for the recognized result are provided for a sentence which has low recognition accuracy.

Managing and Modeling Strategy of Geo-features in Web-based 3D GIS

  • Kim, Kyong-Ho;Choe, Seung-Keol;Lee, Jong-Hun;Yang, Young-Kyu
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.75-79
    • /
    • 1999
  • Geo-features play a key role in object-oriented or feature-based geo-processing system. So the strategy for how-to-model and how-to-manage the geo-features builds the main architecture of the entire system and also supports the efficiency and functionality of the system. Unlike the conventional 2D geo-processing system, geo-features in 3B GIS have lots to be considered to model regarding the efficient manipulation and analysis and visualization. When the system is running on the Web, it should also be considered that how to leverage the level of detail and the level of automation of modeling in addition to the support for client side data interoperability. We built a set of 3D geo-features, and each geo-feature contains a set of aspatial data and 3D geo-primitives. The 3D geo-primitives contain the fundamental modeling data such as the height of building and the burial depth of gas pipeline. We separated the additional modeling data on the geometry and appearance of the model from the fundamental modeling data to make the table in database more concise and to allow the users more freedom to represent the geo-object. To get the users to build and exchange their own data, we devised a file format called VGFF 2.0 which stands for Virtual GIS File Format. It is to describe the three dimensional geo-information in XML(eXtensible Markup Language). The DTD(Document Type Definition) of VGFF 2.0 is parsed using the DOM(Document Object Model). We also developed the authoring tools for. users can make their own 3D geo-features and model and save the data to VGFF 2.0 format. We are now expecting the VGFF 2.0 evolve to the 3D version of SVG(Scalable Vector Graphics) especially for 3D GIS on the Web.

  • PDF

제한된 문서 영상에서 패턴 분절과 구분 처리에 관한 연구 (A Study on the Pattern Segmentation and Classification in Specially Documentated Imaged)

  • 옥철호;허도근;진용옥
    • 한국통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.663-674
    • /
    • 1989
  • 본 논문은 문서자동 처리시스템의 구현을 위하여 문서영상의 패턴 분절과 구분처리 방법에 대하여 기술하였다. 가우스 분포함수의 1차 미분 연산자에 의한 윤곽선 추출과 체인 코드법에 의한 영상 분절, 2차 적률과 2차원 Rf 거리 (변환 영역)등에 의한 패턴 구분을 행하였다. 제한된 영상에 대하여 적용한 결과 문자 영역이나 지문, 사진, 도장 등 도형정보 영역을 잘 구분할 수 있음을 알았으며 사용된 알고리즘의 유용성을 검증할 수 있었다.

  • PDF