Improvement OCR Algorithm for Efficient Book Catalog RetrievalTechnology

효과적인 도서목록 검색을 위한 개선된 OCR알고리즘에 관한 연구

  • 하문 (원광대학교 전자공학과) ;
  • 백영현 (원광대학교 전자공학과) ;
  • 문성룡 (원광대학교 전자공학과)
  • Published : 2010.01.25

Abstract

Existing character recognition algorithm recognize characters in simple conditional. It has the disadvantage that recognition rates often drop drastically when input document image has low quality, rotated text, various font or size text because of external noise or data loss. In this paper, proposes the optical character recognition algorithm which using bicubic interpolation method for the catalog retrieval when the input image has rotated text, blurred, various font and size. In this paper, applied optical character recognition algorithm consist of detection and recognition part. Detection part applied roberts and hausdorff distance algorithm for correct detection the catalog of book. Recognition part applied bicubic interpolation to interpolate data loss due to low quality, various font and size text. By the next time, applied rotation for the bicubic interpolation result image to slant proofreading. Experimental results show that proposal method can effectively improve recognition rate 6% and search-time 1.077s process result.

본 논문에서는 기울어진 문자, 다양한 크기, 글씨체, 흐린 문자를 포함한 입력영상의 문자 복원과 인식, 효율적인 도서 검색을 위한 광학문자인식 알고리즘을 제안한다. 본 논문에서 제안한 광학문자 인식알고리즘은 검출부와 인식부로 구성되며, 검출부에서는 복잡한 배경에서 정확한 도서 영역 검출을 위하여 로버츠 에지 연산자와 허도로프 거리 알고리즘을 적용하여 필요한 영역을 검출하였다. 또한 인식부에서는 문자의 크기와 경사도, 부분 손실 등의 영상에 강인성을 갖는 바이큐빅 보간법을 적용하여 데이터 손실 복원과, 반자동 기울기를 갖는 입력 영상의 보정을 하였다. 모의실험 결과 기존 알고리즘 보다 인식률에서는 6%, 검색시간에서는 1.077초 더 우수함을 확인하였다.

Keywords

References

  1. 이광로, 정희성, 김명원, "문자인식에 관한 연구", 1989.
  2. 이성환, 문자인식 이론과 실제I, 홍릉과학출판사, pp. 31-32, 1997.
  3. R. Iwamaoto and M. Ito, "Visual Extraction of Title Character Region of Books on a Shelf", Proc. of IEICE General Conf., D-343. 1996.
  4. Y. Akiyama, M. Takayama, T. Nagumo and M. Ito. "Extraction of Books from Color Images", Proc. of IEICE General Conf., D-12-31, 1998.
  5. 조동욱, "영상처리에 의한 서고에서의 도서위치 검출 시스템", 한국콘텐츠학회 2003 춘계종합학술 대회 논문집, Vol. 1, No. 1, 2003.
  6. O. Iwaki, H. kida and H. Arakawa, "A Segmentation Method Based on Office Document Hierarchical Structure", Proc. 1987 IEEE Int. Conf. on Systems, Man and Cybernetics, pp. 759-763, 1987.
  7. K. Kubota, O. Iwaki and H. Arakawa, "Document Understanding System", Proc. 7th Int. Conf. on Pattern Recognition, pp. 612-614, 1984.
  8. SIMON KAHAN, THEO PAVLIDIS, HENRY S. BAIRD, "On the Recognition of Printed Characters of Any Font and Size", IEEE Transactions on pattern analysis and machine intelligence, vol. PAMI-9, No. 2, 1987.
  9. Velappa Ganapathy, Charles C. H. Lean, "Optical Character Recognition Program for Images of Printed Text using a Neural Network", IEEE, 2006.
  10. 이성환, 문자인식 이론과 실제II, 홍릉과학출판사, pp. 21-79, 1997.
  11. D. P. Huttenlocher, G. A. Klanderman, and W. J. Rucklidge, "Comparing image using the Hausdorff distance", IEEE Transcation on Pattern Analysis and Machine Intelligence, vol. PAMI-15, No. 9, pp. 850-863, 1993.
  12. 이재원, "Hausdorff Distance와 특징정보를 이용한 영상으로부터 물체 인식", 충남대학교, 1999.
  13. D. P Huttenlocher, G. A. Klanderman, and W J Ruckhdge, "Comparing image using the Hausdorff distance," IEEE Trans Pattern Anal. Machine Intell, Vol. PAMI-15, No. 9, pp. 850-863, 1993
  14. R. Crane, "A simplified approach to Image Processing", Prentice-Hall,1997
  15. 강길봉, "확대 영상의 개선 알고리즘 제안", 제주대학교, 2001
  16. 강우형, "확대 화상의 형상 보간 알고리즘에 관한 비교 연구", 울산대학교, 1998
  17. ROBERT. KEYS, "Cubic Convolution Interpolation for Digital Image Processing", IEEE Computer Society international Conference on compter Visio
  18. 고기홍, 김성환, "영상특성 분석을 통한 초해상도 영상 복원", 한국정보처리학회 제14권 제1호, 2007
  19. R. V. Klassen, "Integer forward differencing of cubic polynomials: analysis and algorithms" ACM Transaction on Graphics, Vol. 10, No. 2, pp. 152-181, 1991 https://doi.org/10.1145/108360.108364
  20. G. Tsukumo, "Reading machine", U.S. Patent 2026329, Dec 1935