Character Grouping using 3-D Neighborhood Graph on Raster Map

래스터 지도상에서 3차원 인접 그래프를 이용한 문자 그룹핑

  • 강용빈 ((주)키스톤, 테크놀리지 연구원) ;
  • 옥세영 (부산대학교 전자계산학과) ;
  • 조환규 (부산대학교 전자계산학과)
  • Published : 1999.02.01

Abstract

래스터 지도에서 직선 또는 곡선과 중첩되어 있는 경우의 문자는 추출하기가 쉽지 않다. 따라서 본 논문에서는 고립되어 있는 문자뿐만 아니라 문자이외의 요소와 중첩되어 있는 문자도 효과적으로 추출할수 있는 분할 정복(divide and conquer) 개념에 기반한 문자 추출방법을 제시한다. 이를 위해 먼저 이미지의 연결 요소로부터 볼록다각형(convex hull)을 생성한다. 그리고 이 다각형이 충분한게 문자영역만을 포함할때가지 볼록 다각형을 이등분하면서 가장 긴 선분(투사 선분)을 기준으로 두 영역으로 분할한다. 다음으로 문자를 추출하기 위해서 이 선분을 기준으로 연결 요소상의 픽셀의 밀집도를 계산하는 알고리즘(프로파일링)을 적용한다. 또한 지도상에서 추출된 개별적인 문자들을 의미있는 단어들로 묶기(grouping)한 새로운 알고리즘을 소개한다. 특히 지도상에 나타나는 문자의 종류는 매우 다양하고 또한 이 문자들이 놓여있는 방향 역시 일정하지 않기 때문에 이러한 단어를 찾는 kd법은 쉽지 않다. 이를 위해 본 논문에서는 3차원 인접 그래프(3-D neighborhood graph)G를 소개한다. 이 그래프 G에서 각 노드는 하나의 분리된 문자를 나타내며 자신의 크기와 위치에 따라서 3차원 공간상에서 위치하게된다. 따라서, 크기가 큰 (작은)문자들은 보다 큰 (작은) z값을 가지고 되며 이 그래프 G에서 서로 인접한 노드들을 연결함으로써 지도상에 존재하는 서로 다른 종류의 문자 스트링을 추출할수 있다. 실험결과는 서로 다른 지도 이미지에 대해서 약 95% 이상의 단어 추출율을 보여준다.

Keywords

References

  1. IEEE Transaction On PAMI v.10 no.6 A Robust Algorithm for Text String Separation from Mixed Text/Graphics Images L.A. Fletcher;R. Kakutani
  2. Proc. of 2th International Conf. on Document Analysis and Recognition A Method for Recognizing Character Strings from Maps Using Linguistic Knowledge A. Nakamura;O. Shiku
  3. IEEE Transaction On PAMI v.12 no.10 A System for Interpretation of Line Drawings R. Kasturi;S. Bow
  4. Proc. Inf. conf. on Document Analysis and Recognition v.2 Tools for Interactive Map Conversion and Vectorization L. Eikvil;K. Aas
  5. Proc. of VISION GEOMETRY Ⅳ, SPIE's International Symposium on Optics, Imaging and Instrumentation v.2573 Using the Voronoi tessllation for grouping words and multi-part symbols in documents M. Burge;G. Monagan
  6. Graphical Models and Image Processing v.55 no.3 Extraction of Binary Character/Graphics Images from Grayscale Document Images M. Kamel;A. Zhao
  7. IEEE Transaction on PAMI v.16 no.2 Recognizing Characters in Scene Images J. Ohya;A. Shio
  8. IEEE Transaction on PAMI v.11 no.12 Segmentation of document images T.Taxt;P.J. Flynn
  9. Computational Geometry an Introduction F.P. Preparata;M.I. Shamos
  10. Proc. of 2th International Conf. on Document Analysis and Recognition Appropriate Base Representation Using a Run Graph G. Monagan;M. Roosli
  11. Proc. of the 7th ICCPOL Differentiation between Orienta and European Scripts J. Ding;L. Lam
  12. Proc. of Pattern Recognition '97 v.31 no.1 Text Extraction Using Pyramid C.L. Tan;P.O.Ng