장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출

Text Extraction using Character-Edge Map Feature From Scene Images

  • Park, Jong-Cheon (School of Electronical & Computer Engineering, Chungbuk Univ.) ;
  • Hwang, Dong-Guk (School of Electronical & Computer Engineering, Chungbuk Univ.) ;
  • Lee, Woo-Ram (School of Electronical & Computer Engineering, Chungbuk Univ.) ;
  • Kwon, Kyo-Hyun (School of Electronical & Computer Engineering, Chungbuk Univ.) ;
  • Jun, Byoung-Min (School of Electronical & Computer Engineering, Chungbuk Univ.)
  • 발행 : 2006.05.25

초록

본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

키워드