텐서보팅과 마르코프 랜덤 필드를 이용한 자연 영상의 텍스트 이진화

Natural Scene Text Binarization using Tensor Voting and Markov Random Field

  • 최현수 (전남대학교 전자컴퓨터공학과) ;
  • 이귀상 (전남대학교 전자컴퓨터공학과)
  • 투고 : 2015.08.28
  • 심사 : 2015.12.30
  • 발행 : 2015.12.31

초록

본 논문에서는 텐서보팅을 이용하여 기존 마르코프 랜덤 필드 메소드 안의 가우시안 혼합 모델 함수의 성능을 향상시킬 수 있는 적합한 클러스터 개수 검출 방법을 제시한다. 제안하는 방법의 핵심 포인트는 텐서보팅의 인풋 데이터 토큰의 연속성인 saliency map을 통한 중심점 개수의 추출이다. 우리는 가장 먼저 주어진 자연 영상에서 전경 및 배경 후보 영역을 분리한다. 다음으로, 분리된 각 후보 영역에 대하여 텐서보팅을 적용하여 적절한 클러스터 개수를 추출한다. 우리는 검출된 클러스터 개수를 이용하여 정확한 가우시안 혼합 모델 모델링을 수행할 수 있다. 그리고 이를 적용한 마르코프 랜덤 필드의 unary term과 pairwise term을 계산하여 자연 영상의 텍스트 이진화 결과를 반환한다. 실험 결과, 제안된 방법이 최적의 클러스터 개수를 반환하고, 향상된 텍스트 이진화 결과를 반환함을 확인하였다.

In this paper, we propose a method for detecting the number of clusters. This method can improve the performance of a gaussian mixture model function in conventional markov random field method by using the tensor voting. The key point of the proposed method is that extracts the number of the center through the continuity of saliency map of the input data of the tensor voting token. At first, we separate the foreground and background region candidate in a given natural images. After that, we extract the appropriate cluster number for each separate candidate regions by applying the tensor voting. We can make accurate modeling a gaussian mixture model by using a detected number of cluster. We can return the result of natural binary text image by calculating the unary term and the pairwise term of markov random field. After the experiment, we can confirm that the proposed method returns the optimal cluster number and text binarization results are improved.

키워드

참고문헌

  1. Mishra A., Alahari K., Jawahar C.V., "An MRF Model for Binarization of Natural Scene Text," Proc. 11th International Conference on Document Analysis and Recognition, pp. 11-16, 2011.
  2. U. Maulik and S,. Bandyopadhyay, "Performance Evaluation of Some Clustering Algorithms and Validity Indices," IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, pp. 1650-1654, 2002. https://doi.org/10.1109/TPAMI.2002.1114856
  3. J.C. Bezdek and N.R. Pal, "Some New Indices of Cluster Validity," IEEE Trans. System, Man and Cybernetics, vol. 28, no. 3, pp. 301-315, 1998. https://doi.org/10.1109/3477.678624
  4. D.L. Davies and D.W. Bouldin, "A duster separation measure," IEEE Trans. Pattern Anal. Machine Intell, Vol. 1, pp. 224-227, 1979.
  5. S Ray and R H Tun, "ADetermination of number of dusters in K-means clustering and application in colour image segmentation," Proceedings of the 4th International Conference on Advances in Pattern Recognition and Digital Techniques, pp. 137-143, 1999.
  6. Toan Nguyen, Park, J., Lee, G., "Determination of Initial Parameters for K-means Clustering by Tensor Voting," Korea Computer Congress, vol. 36, 2009.
  7. Epsttein B., Ofek E., Wexler Y, "Detecting text in natural scenes with stroke width transform,"' Proc. Computer Vision and Pattern Recognition, pp. 2963-2970, 2010.
  8. Canny J. " Computational Approach to Edge Detection," IEEE Trans. on PAMI 8, pp. 679-698, 1986.
  9. Lee, G., Toan Nguyen, Park, J., "Extraction of Text Alignment by Tensor Voting and its Application to Text Detection," Korea Institute of Information Scientists and Engineers(KllSE), vol. 36, 2009.
  10. Y. Boykov and M.-P. Jolly, "Interactive graph cuts for optimal boundary and region segmentation of objects in n-d images," In ICCV, pp. 105-112, 2009
  11. 박종현, 박순영, 이귀상, "텐서보팅에 기반한 영상처리 및 응용," 스마트미디어저널, vol. 1, no. 2, pp.23-33, 2012.
  12. Le Thi Khue Van and Gueesang Lee, "Text Extraction in HIS Color Space by Weighting Scheme," Smart Media Journal, vol. 2, no. 1, pp. 31-36, 2013.