• 제목/요약/키워드: Document Image Analysis

검색결과 85건 처리시간 0.024초

Table Detection from Document Image using Vertical Arrangement of Text Blocks

  • Tran, Dieu Ni;Tran, Tuan Anh;Oh, Aran;Kim, Soo Hyung;Na, In Seop
    • International Journal of Contents
    • /
    • 제11권4호
    • /
    • pp.77-85
    • /
    • 2015
  • Table detection is a challenging problem and plays an important role in document layout analysis. In this paper, we propose an effective method to identify the table region from document images. First, the regions of interest (ROIs) are recognized as the table candidates. In each ROI, we locate text components and extract text blocks. After that, we check all text blocks to determine if they are arranged horizontally or vertically and compare the height of each text block with the average height. If the text blocks satisfy a series of rules, the ROI is regarded as a table. Experiments on the ICDAR 2013 dataset show that the results obtained are very encouraging. This proves the effectiveness and superiority of our proposed method.

공간의존행렬과 신경망을 이용한 문서영상의 효과적인 블록분할과 유형분류 (An Efficient Block Segmentation and Classification Method for Document Image Analysis Using SGLDM and BP)

  • 김중수;이정환;최흥문
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.937-946
    • /
    • 1995
  • 본 논문에서는 공간의존행렬과 신경망을 이용하여 문서영상에서 인식대상 문자가 포함되어 있는 블록들을 좀더 세분해 낼 수 있는 효과적인 방법을 제시 하였다. 제안 된 방법은 명암도 문서블록에서 공간의존행렬을 구하고 7가지 질감 특징을 추출한 뒤 신경망을 이용해 문서블록을 9가지 유형으로 분류할 수 있도록 하였다. 특히 기존에는 비문자영역으로 분류되던 수식, 도표, 순서도 등 주로 문자가 포함되어 있는 블록들을 세분해 낼 수 있도록 하였다. 또한 신경망 학습알고리즘인 BP 를 사용함으로써 기존의 선형분류시에 요구되던 유형별 임계값과 선형면결정지수를 찾는 어려움을 해소하였다. 명암도영상을 이진화하기 전에 먼저 Sobel연산을 적용함으로써 문서 뒷면에 의한 배경 잡음의 영향을 줄일 수 있도록 하였고, 교차 문지르기 후 분할함으로써 블록이 작은 조각으로 나누어지는 것을 방지하도록 하였다. 실험결과 제안한 방법에서는 문자가 포 함되어 있는 블록은 큰 문자, 중간문자, 작은 문자블록 및 수식, 순서도, 도표블록의 6가지로, 그리고 비문자블록은 인물사진, 그래프 등 3가지 유형으로 상세하게 분류 할수 堞있었으며 전체적인 분류성능도 우수함을 확인할 수 있었다.

  • PDF

팩스 문서 위·변조 방지를 위한 패턴 분석 기반의 팩스 송신처 검증 기법 (Fax Sender Verification Technique Based on Pattern Analysis for Preventing Falsification of FAX Documents)

  • 김영호;최황규
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.547-558
    • /
    • 2014
  • 최근 일반기업, 공공기관, 금융기관 등에서 수신된 팩스 문서를 사용하여 업무처리를 하는 과정에서 각종 위 변조 폐해 사례가 빈번하게 발생하고 있다. 이는 팩스로 수신한 문서만으로는 위 변조 여부를 확인할 수 없어 발생하는 결과로 이에 대한 대책이 시급한 실정이다. 본 논문에서는 수신된 팩스 문서만을 사용하여 팩스 문서의 위 변조 여부를 확인하기 위한 팩스 송신처 검증 기법을 제안한다. 제안된 기법은 송신측 팩스단말과 수신측 팩스단말간의 통신 시그널 패턴 분석과 수신된 팩스 문서 이미지의 속성패턴을 확인하여 수신된 문서가 지정된 송신처에서 보낸 팩스인지를 검증할 수 있는 기법이다. 본 논문은 제안된 기법을 실제 팩스 시스템에 적용하여 위 변조 방지 효과가 있음을 실험 결과를 통해 확인하였다.

생활양식에 따른 실내디자인 선호유형 (The Type of Preference of Interior Design according to the Life Style)

  • 박혜숙;윤정숙
    • 한국실내디자인학회논문집
    • /
    • 제27호
    • /
    • pp.64-75
    • /
    • 2001
  • As living condition has improved, agreeable living environmental plans that reflect residential traits are needed from. the first stage of house remodeling or interior construction. At the request of above, we need systematically study about the householder's preference according to the life style. The purpose of this study is to suggest the case of preferred interior by understanding preferred Interior image and interior design elements. Document and questionnaire research are used as the method of study. The subjects of research wear 702 persons from 20th to 40th. Contents are constituted with general traits, life style and preferred interior image and the analysis of the materials is quantifical analysis using statistics. In the base of the theory of interior image and interior design elements appeared In the documents, measuring apparatus is made up and suggested preferred examples of interior design depend on life style by combining preferences.

  • PDF

뉴스 클러스터링 개선을 위한 문서 임베딩 및 이미지 분석 자질의 활용 (Document Embedding and Image Content Analysis for Improving News Clustering System)

  • 김시연;김상범
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.104-108
    • /
    • 2015
  • 많은 양의 뉴스가 생성됨에 따라 이를 효과적으로 정리하는 기법이 최근 활발히 연구되어왔다. 그 중 뉴스클러스터링은 두 뉴스가 동일사건을 다루는지를 판정하는 분류기의 성능에 의존적인데, 대부분의 경우 BoW(Bag-of-Words)기반 벡터유사도를 사용하고 있다. 본 논문에서는 BoW기반의 벡터유사도 뿐 아니라 두 문서에 포함된 사진들의 유사성 및 주제의 관련성을 측정, 이를 분류기의 자질로 추가하여 두 뉴스가 동일사건을 다루는지 판정하는 분류기의 성능을 개선하는 방법을 제안한다. 사진들의 유사성 및 주제의 관련성은 최근 각광을 받는 딥러닝기반 CNN과 신경망기반 문서임베딩을 통해 측정하였다. 실험결과 기존의 BoW기반 벡터유사도에 의한 분류기의 성능에 비해 제안하는 두 자질을 사용하였을 경우 3.4%의 성능 향상을 보여주었다.

  • PDF

Managing and Modeling Strategy of Geo-features in Web-based 3D GIS

  • Kim, Kyong-Ho;Choe, Seung-Keol;Lee, Jong-Hun;Yang, Young-Kyu
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.75-79
    • /
    • 1999
  • Geo-features play a key role in object-oriented or feature-based geo-processing system. So the strategy for how-to-model and how-to-manage the geo-features builds the main architecture of the entire system and also supports the efficiency and functionality of the system. Unlike the conventional 2D geo-processing system, geo-features in 3B GIS have lots to be considered to model regarding the efficient manipulation and analysis and visualization. When the system is running on the Web, it should also be considered that how to leverage the level of detail and the level of automation of modeling in addition to the support for client side data interoperability. We built a set of 3D geo-features, and each geo-feature contains a set of aspatial data and 3D geo-primitives. The 3D geo-primitives contain the fundamental modeling data such as the height of building and the burial depth of gas pipeline. We separated the additional modeling data on the geometry and appearance of the model from the fundamental modeling data to make the table in database more concise and to allow the users more freedom to represent the geo-object. To get the users to build and exchange their own data, we devised a file format called VGFF 2.0 which stands for Virtual GIS File Format. It is to describe the three dimensional geo-information in XML(eXtensible Markup Language). The DTD(Document Type Definition) of VGFF 2.0 is parsed using the DOM(Document Object Model). We also developed the authoring tools for. users can make their own 3D geo-features and model and save the data to VGFF 2.0 format. We are now expecting the VGFF 2.0 evolve to the 3D version of SVG(Scalable Vector Graphics) especially for 3D GIS on the Web.

  • PDF

Managing Scheme for 3-dimensional Geo-features using XML

  • Kim, Kyong-Ho;Choe, Seung-Keol;Lee, Jong-Hun;Yang, Young-Kyu
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 1999년도 추계학술대회 발표요약문
    • /
    • pp.47-51
    • /
    • 1999
  • Geo-features play a key role in object-oriented or feature-based geo-processing system. So the strategy for how-to-model and how-to-manage the geo-features builds the main architecture of the entire system and also supports the efficiency and functionality of the system. Unlike the conventional 2D geo-processing system, geo-features in 3D GIS have lots to be considered to model regarding the efficient manipulation and analysis and visualization. When the system is running on the Web, it should also be considered that how to leverage the level of detail and the level of automation of modeling in addition to the support for client side data interoperability. We built a set of 3D geo-features, and each geo-feature contains a set of aspatial data and 3D geo-primitives. The 3D geo-primitives contain the fundamental modeling data such as the height of building and the burial depth of gas pipeline. We separated the additional modeling data on the geometry and appearance of the model from the fundamental modeling data to make the table in database more concise and to allow the users more freedom to represent the geo-object. To get the users to build and exchange their own data, we devised a fie format called VGFF 2.0 which stands for Virtual GIS File Format. It is to describe the three dimensional geo-information in XML(extensible Markup Language). The DTD(Document Type Definition) of VGFF 2.0 is parsed using the DOM(Document Object Model). We also developed the authoring tools for users can make their own 3D geo-features and model and save the data to VGFF 2.0 format. We are now expecting the VGFF 2.0 evolve to the 3D version of SVG(Scalable Vector Graphics) especially for 3D GIS on the Web.

  • PDF

Guidelines for Cardiovascular Magnetic Resonance Imaging from the Korean Society of Cardiovascular Imaging (KOSCI) - Part 3: Perfusion, Delayed Enhancement, and T1- and T2 Mapping

  • Im, Dong Jin;Hong, Su Jin;Park, Eun-Ah;Kim, Eun Young;Jo, Yeseul;Kim, Jeong Jae;Park, Chul Hwan;Yong, Hwan Seok;Lee, Jae Wook;Hur, Jee Hye;Yang, Dong Hyun;Lee, Bae-Young
    • Investigative Magnetic Resonance Imaging
    • /
    • 제24권1호
    • /
    • pp.1-20
    • /
    • 2020
  • This document is the third part of the guidelines for the interpretation and post-processing of cardiac magnetic resonance (CMR) studies. These consensus recommendations have been developed by a Consensus Committee of the Korean Society of Cardiovascular Imaging (KOSCI) to standardize the requirements for image interpretation and post-processing of CMR. This third part of the recommendations describes tissue characterization modules, including perfusion, late gadolinium enhancement, and T1- and T2 mapping. Additionally, this document provides guidance for visual and quantitative assessment, consisting of "What-to-See," "How-To," and common pitfalls for the analysis of each module. The Consensus Committee hopes that this document will contribute to the standardization of image interpretation and post-processing of CMR studies.

이미지와 문서 분석을 통한 개인 정보 자동 검색 시스템 (Auto Detection System of Personal Information based on Images and Document Analysis)

  • 조정현;안철웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.183-192
    • /
    • 2015
  • 본 논문에서는 통신 판매사에서 사용하는 문서와 이미지 파일에서 개인 정보의 유출을 방지할 수 있는 개인 정보 자동 검색(PIAD, Personal Information Auto Detection) 시스템을 제안한다. 제안하는 시스템은 개인 정보를 포함하는 신분증과 계약서 이미지를 자동으로 검색하고 그 결과를 사용자에게 전달하고, 문서상의 개인 정보 또한 검출할 수 있다. 본 시스템은 빠르고 정확한 검색을 위하여 선별 과정과 분석 과정으로 나뉘고, 분석 과정은 SURF, 침식과 팽창, FindContours 알고리즘들을 사용한다. 제안하는 PIAD 시스템은 272장의 입력 이미지들 중 267장을 선별 및 검출함으로써 98% 이상의 정확도를 보였다.

회전된 문서영상에서의 구성요소 분석 및 분류 (Component Analysis and Classification for Rotated Document Image)

  • 모문정;김욱현
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.169-172
    • /
    • 2001
  • 본 논문에서는 회전된 문서에서의 회전각 검출과 문서에 포함된 그림, 글자, 표, 직선과 같은 구성요소를 자동으로 분석하고 분류하는 방법을 제안한다. 본 연구는 입력영상을 획득하는 과정에서 발생되는 회전각에 의해 발생되는 오류를 최소화하기 위한 회전각 검출단계, 각 구성요소 검출에 불필요한 배경제거 단계, 각 구성요소의 특성을 통한 구성요소 분류단계로 이루어진다. 제안한 문서 인식 시스템의 성능 평가를 위해서 다양 한 문서에 제안한 방법을 적용하고, 성공적인 결과를 보인다.

  • PDF