DOI QR코드

DOI QR Code

A Block Classification and Rotation Angle Extraction for Document Image

문서 영상의 영역 분류와 회전각 검출

  • Mo, Moon-Jung (Graruate School of Yeungnam University) ;
  • Kim, Wook-Hyun (Dept.of Electronics Information Engineering, Yeungnam University)
  • 모문정 (영남대학교 대학원 컴퓨터공학과) ;
  • 김욱현 (영남대학교 전자정보공학부)
  • Published : 2002.08.01

Abstract

This paper proposes an efficient algorithm which recognizes the mixed document image consisting of the images, texts, tables, and straight lines. This system is composed of three steps. The first step is the detection of rotation angle for complementing skewed images, the second is detection of erasing an unnecessary background region and last is the classification of each component included in document images. This algorithm performs preprocessing of detecting rotation angles and correcting documents based on the detected rotation angles in order to minimize the error rate by skewness of the documentation. We detected the rotation angie using only horizontal and vertical components in document images and minimized calculation time by erasing unnecessary background region in the detecting process of component of document. In the next step, we classify various components such as image, text, table and line area included in document images. we applied this method to various document images in order to evaluate the performance of document recognition system and show the successful experimental results.

본 논문에서는 그림, 글자, 표, 직선 등과 같은 다양한 정보를 포함하는 문서 영상 인식에 대한 효율적인 알고리즘을 제안한다. 이 시스템은 문서영상의 기울짐을 보정하기 위한 회전각검출 단계, 불필요한 배경영역을 제거하는 단계, 문서영상에 내재된 각 구성요소를 검출하는 분류 단계로 구성된다. 알고리즘은 문서의 기울어짐에 의해서 발생되는 오류를 최소화하기 위한 회전각 검출과정과 검출된 회전각을 기반으로 문서를 보정하는 전처리단계를 수행한다. 입력된 문서영상의 수평성분과 수직성분만을 이용하여 회전각을 검출하고, 문서의 구성요소 검출과정에서 불필요한 배경영역을 제거함으로써 계산시간을 최소화하였다. 그리고 영상에 내재된 그림영역, 글자영역, 표영역, 직선영역 둥의 다양한 구성요소를 분류한다. 제안한 문서 인식 시스템의 성능 평가를 위해서 다양한 문서영상에 제안한 방법을 적용하고 성공적인 결과를 보인다.

Keywords

References

  1. Q. Luo and N. Sugie, 'Layout recognition of multi-kinds of table-form documents,' IEEE Computer Society, Vol.17, No.4, 1995 https://doi.org/10.1109/34.385976
  2. Y. S. Chen and Y. T. Yu, 'Thinning approach for noisy digital patterns,' Pattern Recognition 29(11), pp.1847-1862, 1996 https://doi.org/10.1016/0031-3203(96)00031-3
  3. F. Y. Shih and S. S. Chen, 'Adaptive document block segmentation and classification,' IEEE Trans, Cybernetics, Vol. 26, No.5, 1996 https://doi.org/10.1109/3477.537322
  4. J. L. Chen and H. J. Lee, 'An efficient algorithm for form structure extraction using strip projection,' Pattern Recognition 31(9), pp.1353-1368, 1998 https://doi.org/10.1016/S0031-3203(97)00156-8
  5. Z. lu, 'Detection of text regions form digital engineering drawings,' IEEE Trans, Pattern Analysis and Machine Intelligence, Vol.20, No.4, 1998
  6. L. Y. Tseng and R. C. Chen, 'Recognition and data extraction of form documents based on three types of line segments,' Pattern Recognition 31(10), pp.1525-1540, 1998 https://doi.org/10.1016/S0031-3203(98)00007-7
  7. D. Dori and Y. Velkovitch, 'Segmentation and Recognition of Dimensioning Text form Engineering Drawings,' 'Computer Vision and Image Understanding,' Vol.69, No.2,1998
  8. J. D. Hobby, 'Using Shape and Layout Information to Find Signatures, Text, and Graphics,' Computer Vision and Image Understanding 80, pp.88-110, 2000 https://doi.org/10.1006/cviu.2000.0868
  9. W. K. Partt, 'Digital Image Processing,' John Wiley & Sons, Inc., New York, 1978