Recovery of Erased Character Strokes in the Extraction of Text Using Color Information

칼라정보에 기반한 텍스트 영역 추출에서의 지워진 획 복구

  • Kim Seon-Hyung (Dept of Computer Science, Chonnam National University) ;
  • Kim Ji-Soo (Dept of Computer Science, Chonnam National University) ;
  • Kim Soo-Hyung (Dept of Computer Science, Chonnam National University)
  • Published : 2006.05.01

Abstract

자연영상이나 스팸메일 영상으로부터 텍스트 영역을 추출하고 추출한 텍스트 영역에 이진화를 수행하고 나면 가로 방향이나 세로획 방향으로 놓여 있는 "1" 그리고 "ㅡ" 에 해당하는 한글의 종성부분이 이미지 내의 잡영을 지울 때 종종 지워지는 결과를 볼 수 있다. 이렇게 지워진 획 부분을 되살리기 위한 방법으로 텍스트 Hinting 알고리즘을 제안한다. 텍스트 Hinting 알고리즘은 이진화된 이미지의 텍스트 픽셀 위치와 동일한 좌표에 해당하는 원본 이미지의 RGB 값을 추출하여 추출된 텍스트 후보 영역의 색상을 알아낸다. 추출된 텍스트 색상 레이어 이미지와 이진화된 이미지에 OR연산을 수행하게 되면 지워진 획 부분을 복원할 수 있다. 제안한 방법을 스팸 이미지에 적용한 결과 텍스트 추출결과를 획기적으로 개선할 수 있음을 보였다.

Keywords