인쇄 문서 영상의 단어 단위 속성 인식

Recognition of Word-level Attributed in Machine-printed Document Images

  • 곽희규 (한국과학기술원 전산학과) ;
  • 김수형 (전남대학교 컴퓨터정보학부)
  • Gwak, Hui-Gyu (Dept. of Computer Science, Korea Advanced Institute of Science and Technology) ;
  • Kim, Su-Hyeong (Chonnam National Universityisy)
  • 발행 : 2001.05.01

초록

본 논문은 문서 영상에 존재하는 개별 단어들에 대한 속성정보 추출 방법을 제안한다. 단어 단위의 속성 인식은 단어 영상 매칭의 정확도 및 속도 개선, OCR 시스템에서 인식률 향상, 문서의 재생산 등 다양한 응용 가치를 찾을 수 있으며, 메타정보(meta-information) 추출을 통해 영상 검색(image retrieval)이나 요약(summary) 생성 등에 활용할 수 있다. 제안하는 시스템에서 고려하는 단어 영상의 속성은 언어의 종류(한글, 영문), 스타일(볼드, 이탤릭, 보통, 밑줄), 문자 크기(10, 12, 14 포인트), 문자 개수 (한글: 2, 3, 4, 5, 영문: 4, 5, 6, 7, 8, 9, 10), 서체(명조, 고딕)의 다섯 가지 정보이다. 속성 인식을 위한 특징은, 언어 종류 인식에 2개, 스타일 인식에 3개, 문자 크기와 개수는 각각 1개, 한글 서체 인식은 1개, 영문 서체 인식은 2개를 사용한다. 분류기는 신경망, 2차형 판별함수(QDF), 선형 판별함수(LDF)를 계층적으로 구성한다. 다섯 가지 속성이 조합된 26,400개의 단어 영상을 사용한 실험을 통해, 제안된 방법이 소수의 특징만으로도 우수한 속성 인식 성능을 보임을 입증하였다.

키워드

참고문헌

  1. AIIM'96 Conference Handbook, Association for Imaging and Information Methodologies, 1996
  2. D. Doermann, 'The Indexing and Retrieval of Document Images: A Survey,' Computer Vision and Image Understanding, Vol. 70, No. 3, pp. 287-298, 1998 https://doi.org/10.1006/cviu.1998.0692
  3. A. Zramdini, 'Study of Optical Font Recognition Based on Global Typographical Features,' Ph. D. thesis, University of fribourg, 1995
  4. 박문호, 손영우, 김석태, 남궁재찬, '인쇄된 한글 문서의 폰트 인식,' 한국정보처리학회논문지, 제 4권, 제 8호, pp. 2017-2024, 1997
  5. S. Kahan, T. Pavlidis and H. S. Baird, 'On the Recognition of Printed Characters of Any font and Size,' IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 9, No. 2, pp. 274-288, 1987
  6. M.C. Jung, Y.C. Shin and S.N. Srihari, 'Multifont Classification Using Typographical Attributes,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. 353-356, 1999 https://doi.org/10.1109/ICDAR.1999.791797
  7. B.B. Chaudhuri and U. Garain, 'Automatic Detection of Italic, Bold and All-Capital Words in Document Images,' Proc. 14th Int. Conf. Pattern Recognition, Brisbane, pp. 610-612, 1998 https://doi.org/10.1109/ICPR.1998.711217
  8. T.K. Ho, J.J. Hull and S.N. Srihari, 'A Computational Model for Recognition of Multi-Font Images,' Machine Vision and Applications, Vol. 5, No. 1, pp. 157-168, 1992
  9. S. Zhao and S.N. Srihari, 'A Word Recognition Algorithm for Machine-Printed Word Images of Multiple Fonts and Varying Qualities,' Proc. 3rd Int. Conf. Document analysis and Recognition, Montreal, pp. 351-354, 1995 https://doi.org/10.1109/ICDAR.1995.599011
  10. T.K. Ho, 'Font Identification of Stop Words for Font Learning and Keyword Spotting,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. 333-336, 1999
  11. Z. Lu, R. Schwartz, P. natarajan, I. Bazzi and J. Makhoul, 'Advances in the BBN BYBLOS OCR System,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. 337-340, 1999 https://doi.org/10.1109/ICDAR.1999.791793
  12. U. Garain and B.B. Chaudhuri, 'Extraction of Type Style Based Meta-Information from Imaged Documents,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. 341-344, 1999
  13. D. Xi, S. Lee and Y. Tang, 'A Novel Method for Discrimination between Oriental and European Languages by Fractal Features,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. 345-348, 1999
  14. Y. Zhu, T. Tan and Y. Wang, 'Font Recognition Based on Global Texture Analysis,' Proc. 5th Int. Conf. Document Analysis and Recognition, Bangalore, pp. Bangalore, 1999