스케일에 강인한 LLAH 기반 문서 인식 알고리즘

Scale-Invariant Document Detection Algorithm Based on LLAH

  • 이재하 (한양대학교 컴퓨터.소프트웨어학과) ;
  • 박정주 (한양대학교 컴퓨터.소프트웨어학과) ;
  • 박종일 (한양대학교 컴퓨터.소프트웨어학과)
  • Lee, Jaeha (Department of Computer and Software, Hanyang University) ;
  • Park, Jungjoo (Department of Computer and Software, Hanyang University) ;
  • Park, Jong-Il (Department of Computer and Software, Hanyang University)
  • 발행 : 2016.11.04

초록

비슷한 코너의 모양을 가지는 다수의 글자가 포함된 문서 영상을 인식하는 일은 쉽지 않다. 일반적으로 성능이 우수하다고 알려진 SIFT 알고리즘은 코너를 기반으로 특징을 기술하는 알고리즘이기 때문에 각 글자가 비슷한 코너의 모양을 가지는 문서 영상 인식에서는 좋은 성능을 발휘하지 못한다. 반면, LLAH 는 각 단어의 크기를 알아내어 가우시안 필터와 이진화를 통해 단어를 하나의 점으로 나타내고 각 점과 점 사이의 기하 관계를 기술자로 표현하기 때문에 문서의 단어에서 점이 일관되게 추출된다면 좋은 인식 성능을 발휘한다. 그러나, 영상에서 단어의 크기를 알아내는 작업은 계산 측면에서 많은 비용을 필요로 한다. 이에 본 논문에서는 LLAH 를 사용하기 전에 반복적인 가우시안 필터와 이진화를 적용하여 단어의 크기를 알지 못하는 상황에서도 스케일에 강인하게 문서 영상을 인식할 수 있는 알고리즘을 제안한다.

키워드