연결요소와 색상정보를 이용한 실제적 문서영상 분할

Practical Page Segmentation using Connected Components and Color Information

  • 김병기 (신라대학교 컴퓨터정보공학부)
  • 발행 : 2000.01.01

초록

문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.

While page segmentation is an important step in document recognition, there haven's been many researches on it. More improvement is still needed on the segmentation of document elements in complicated or color documents. In this paper, I present a new page segmentation method which can segment pages with multiple columns, dotted lines, graphics, and photographs. I extract all connected components using contour following and combine them depending on the size and positional information of them. Separate text location is done for non-text color regions to extract possible text lines. To see the performance of the proposed method, experiments are done for 180 documents. Four commercial OCR programs are also tested and the proposed method showed the best result.

키워드

참고문헌

  1. Y. Y. Tang, et al, 'Document analysis and understanding : A brief survey,' Proceedings ICDAR, pp.17-31, 1991
  2. 김두식 외 2인, '한글문서 분석 및 인식기술의 최근 연구동향', 전자공학회지, 제24권, 제9호, pp. 1058-1070, 1997
  3. A. Antonacopoulos and R. T. Ritchings, 'Flexible page segmentation using the background,' Proceedings ICPR, pp.339- 344, 1994 https://doi.org/10.1109/ICPR.1994.576932
  4. A. Antonacopoulos and R. T. Ritchings, 'Representation and classification of complex-shaped printed regions using white tiles,' Proceedings ICDAR, pp.1132-1135, 1995
  5. 남궁재찬 외 2인, '한국어 문서로부터 문자분리 및 도형추출에 관한 연구', 전자공학회논문지, 제25권, 제9호, pp.73-83, 1988
  6. 이인동 외 2인, '블록영상의 추출 알고리즘', 한국정보과학회논문지, 제18권, 제2호, pp.218-226. 1991
  7. 장명욱외 2인, '연결화소를 이용한 문서영상의 분할 및 인식', 한국정보과학회논문지, 제20권, 제12호, pp.1741-1751, 1993
  8. 박창준 외 2인, '문서영상의 에지정보를 이용한 효과적인 블록분할 및 유형분류', 전자공학회논문지, 제33권 B편, 제10호, pp.120-129, 1996
  9. 한선화 외 3인, '문자인식 기술을 이용한 데이터베이스 구축', 한국정보처리학회 논문지, 제6권, 제7호, pp.1713-1723, 1999
  10. 김의정 외 2인, '칼라문서에서의 개별문자 추출', 한국정보처리학회 추계학술발표논문집, 제4권, 제2호, pp.595-598, 1997
  11. P. K. Kim, 'Automatic text location in complex color images using local color quantization,' Proceedings IEEE TENCON '99, Vol.1, pp.629-632, 1999 https://doi.org/10.1109/TENCON.1999.818493
  12. A. K. Jain and B. Yu, 'Document representation and its application to page decomposition,' IEEE PAMI, Vol.20, No.3, pp.294-308, 1998 https://doi.org/10.1109/34.667886
  13. M. Ozaki, 'Column segmentation by white space pattern matching,' Proceeedings ICDAR, pp.134-137, 1995 https://doi.org/10.1109/ICDAR.1995.598960
  14. T. Pavlidis and J. Zhou, 'Page segmentation by white stream,' Proceedings ICDAR, pp.944-953, 1991
  15. J. Ha, et al, 'Document page decomposition by the bounding-box projection techniques,' Proceedings ICDAR, pp.1119-1122, 1995 https://doi.org/10.1109/ICDAR.1995.602115
  16. E. Trupin and Y. Lecourtier, 'A modified contour following algorithm applied to document segmentation,' Proceedings ICPR, pp.525-528, 1992 https://doi.org/10.1109/ICPR.1992.201833
  17. T. Saitoh, et al, 'Document image segmentation and text area ordering,' Proceedings ICDAR, pp.323-329, 1993 https://doi.org/10.1109/ICDAR.1993.395722
  18. D. Drivas and A. Amin, 'Page segmentation and classification utilising bottom-up approach,' Proceedings ICDAR, pp.610-614, 1995 https://doi.org/10.1109/ICDAR.1995.601970
  19. N. Normand and C. Viard-Gaudin, 'A background based adaptive page segmentation algorithm, Proceedings ICDAR, pp.138-141, 1995 https://doi.org/10.1109/ICDAR.1995.598961
  20. D. Sylwester and S. Seth, 'A trainable, singlepass algorithm for column segmentation,' Proceedings ICDAR, pp.615-618, 1995 https://doi.org/10.1109/ICDAR.1995.601971
  21. T. Saitoh and T. Pavlidis, 'Page segmentation without rectangle assumption,' Proceedings ICPR, pp.277-280, 1992 https://doi.org/10.1109/ICPR.1992.201772
  22. J. Sauvola, M. Pietikainen, 'Page segmentation and classification using fast feature extraction and connectivity analusis,' Proceedings ICDAR, pp.1127-1131, 1995 https://doi.org/10.1109/ICDAR.1995.602118
  23. B. A. Yanikoglu and L. Vincert, 'Ground-truthing and benchmarking document page segmentation,' Proceedings ICDAR, pp.601-604, 1995 https://doi.org/10.1109/ICDAR.1995.601968
  24. S. Randriamasy and L. Vincert, 'Benchmarking page segmentation algorithms, Proceedings CVPR, pp.411-416, 1994 https://doi.org/10.1109/CVPR.1994.323859