Restoration of Numeral Strings Touched with Lines in Various Form Documents

서식 문서의 선과 접촉된 숫자열 복원에 관한 연구

  • Published : 2001.06.01

Abstract

본 논문에서는 서식 문서의 선과 숫자의 획이 접촉된 경우 숫자의 획을 접촉되기 전 상태의 원 이미지로 복원하는 방법을 제안한다. 제안하는 방법에는 서기 문서에서 추출한 숫자열을 대상으로 열 단위로 복원한다. 과정은 우선 숫자열과 접촉된 선의 위치를 찾아내고, 선을 추적하면서 접촉으로 판정되는 영역을 유형별로 분류하여, 각 유형에 적합한 획 복원 방법을 제안한다. 또한 선에 숫자의 획이 완전히 포함된 경우의 복원 방법도 제안하여 현장에서의 서식 처리 과정에서 발생하는 문제점을 해결하고자 하였다. 제안하는 방법을 평가하기 위해서 은행 입출금전표, 신용카드 매출전표 및 NIST 필기 숫자열 데이터베이스 이미지를 사용하였다.

Keywords

References

  1. S. Mori, C. Y. Suen, K. Yamamoto, 'Historical Review of OCR Research and Development,' Proc. of IEEE, Vol. 80, No.7, pp. 1029-1058, July 1992 https://doi.org/10.1109/5.156468
  2. 유진용, 권영빈, '인쇄양식위에 기록한 필기문서의 라인제거 및 문자복원', 한국정보과학회 봄 학술발표논문집, 23권 1호, pp. 289-292, 1996
  3. J. M. Gloger, 'Use of Hough Transform to Separate Merged Text/Graphics in Forms,' Proc. of 11 th International Conference on Pattern Recognition, Vol. 2, pp. 268-271, 1992 https://doi.org/10.1109/ICPR.1992.201770
  4. O. Hori, D. S. Doermann, 'Robust Table-form Structure Analysis Based on Box-reasoning,' Proc. of 3rd International Conference on Document Analysis and Recognition, Vol. 2, pp. 218-221, 1995 https://doi.org/10.1109/ICDAR.1995.598980
  5. D. Guillevic, C. Y. Suen, 'Cursive Script Recognition: A Fast Reader Scheme,' Proc. of 2nd International Conference on Document Analysis and Recognition, pp. 311-314, 1993 https://doi.org/10.1109/ICDAR.1993.395725
  6. D. Wang, S. N. Srihari, 'Analysis of Form Images,' International Journal of Pattern Recognition and Artificial Intelligence, Vol. 8, No. 5, pp. 1031-1052, 1994 https://doi.org/10.1142/S0218001494000528
  7. B. Yu, A. K. Jain, 'A Form Dropout System,' Proc. of 13th International Conference on Pattern Recognition, Vol. 3, pp. 701-705, 1996 https://doi.org/10.1109/ICPR.1996.547036
  8. S. Naoi, M. Yabuki, A. Asakawa, Y. Hotta, 'Global Interpretation in the Segmentation of Handwritten Characters Overlapping a Border,' IEICE Transactions of Information and Systems, Vol. E78-D, No.7, pp. 909-916, 1995
  9. S. N. Srihari, V. Govindaraju, A. Shekhawat, 'Interpretation of Handwritten Addresses in US Mailstream,' Proc. of 2nd International Conference on Document Analysis and Recognition, pp. 291-294, 1993. https://doi.org/10.1109/ICDAR.1993.395729
  10. Y. T. Chung, K. Y. Lee, J. H. Paik, Y. B. Lee, 'Extraction and Restoration of Digits Touching or Overlapping Lines,' Proc. of 13th International Conference on Pattern Recognition, Vol. 3, pp. 155-159, 1996 https://doi.org/10.1109/ICPR.1996.546813
  11. Y. H. Tseng, H. J. Lee, 'Interfered-character Recognition by Removing Interfering-lines and Adjusting Feature Weights', Proc. of 14th International Conference on Pattern Recognition, Vol. 2, pp. 1865-1867, 1998 https://doi.org/10.1109/ICPR.1998.712095
  12. J. Y. Yoo et. al. 'Line Removal and Restoration of Handwritten Characters on the Form Documents,' Proc. of 4th International Conference on Document Analysis and Recognition, pp. 128-131, Germany, 1997 https://doi.org/10.1109/ICDAR.1997.619827
  13. 정영태, 이관용, 백종현, 이일병, 변혜란, '선에 걸친 숫자 영상의 추출 및 복원', 한국정보과학회 봄 학술발표논문집, 23권 1호, pp. 273-276, 1996
  14. D. S. Doermann, A. Rosenfeld, 'The Processing of Form Document,' Proc. of 2nd International Conference on Document Analysis and Recognition, pp. 497-501, 1993 https://doi.org/10.1109/ICDAR.1993.395687
  15. 백종현, 조성배, 이관용, 이일병, '이중 결합구조를 갖는 다중 인식기 시스템', 한국정보과학회 봄 학술발표논문집, 23권 1호, pp. 281-284, 1996