DOI QR코드

DOI QR Code

An Implementation of Gaze Direction Recognition System using Difference Image Entropy

차영상 엔트로피를 이용한 시선 인식 시스템의 구현

  • 이규범 (성균관대학교 정보통신공학부) ;
  • 정동근 (을지대학교 의료산업학부 의료전산학) ;
  • 홍광석 (성균관대학교 정보통신공학부)
  • Published : 2009.04.30

Abstract

In this paper, we propose a Difference Image Entropy based gaze direction recognition system. The Difference Image Entropy is computed by histogram levels using the acquired difference image of current image and reference images or average images that have peak positions from $-255{\sim}+255$ to prevent information omission. There are two methods about the Difference Image Entropy based gaze direction. 1) The first method is to compute the Difference Image Entropy between an input image and average images of 45 images in each location of gaze, and to recognize the directions of user's gaze. 2) The second method is to compute the Difference Image Entropy between an input image and each 45 reference images, and to recognize the directions of user's gaze. The reference image is created by average image of 45 images in each location of gaze after receiving images of 4 directions. In order to evaluate the performance of the proposed system, we conduct comparison experiment with PCA based gaze direction system. The directions of recognition left-top, right-top, left-bottom, right-bottom, and we make an experiment on that, as changing the part of recognition about 45 reference images or average image. The experimental result shows that the recognition rate of Difference Image Entropy is 97.00% and PCA is 95.50%, so the recognition rate of Difference Image Entropy based system is 1.50% higher than PCA based system.

본 논문에서는 차영상 엔트로피 기반의 시선 인식 시스템을 제안한다. 차영상 엔트로피는 현재 입력된 영상과 참조 영상 또는 시선의 위치별 평균 영상들로부터 차영상을 획득하고, -255부터 +255까지의 히스토그램 빈도수를 이용하여 계산한다. 차영상 엔트로피 기반의 시선 인식방법은 2가지 방법이다. 1) 첫 번째 방법은 현재 입력된 영상과 시선 위치별 45개의 평균 영상들과의 차영상 엔트로피를 계산하여 현재 응시하고 있는 방향을 인식하고, 2) 두 번째 방법은 현재 입력된 영상과 45개의 참조 영상들과의 차영상 엔트로피를 계산하여 현재의 응시 방향을 인식한다. 참조 영상은 네 방향의 영상을 입력받아 시선 위치별 45개의 평균 영상을 이용하여 생성한다. 제안한 시스템의 성능을 평가하기 위해 PCA 기반의 시선 인식 시스템과 비교 실험을 하였고, 인식 방향은 좌상, 우상, 좌하, 우하 네 방향으로 하였으며, 45개의 참조 영상 또는 평균영상에 대하여 인식 영역을 변경하여 실험하였다. 실험 결과 차영상 엔트로피는 97.00%, PCA는 95.50%의 인식률을 보여 차영상 엔트로피 기반의 시스템이 PCA 기반의 시스템보다 1.50% 더 높은 인식률을 나타내었다.

Keywords

References

  1. 이현주, 석민수, '멀티미디어 환경에서 멀티모달 휴먼인터페이스 기술', 전자공학회지, 제22권 제4호, pp.407-417, 1995
  2. A. Karpov, A. Ronzhin, A. Nechaev and S. Chernakova, 'Multimodal System for Hands Free PC Control,' EUSIPCO 2005, 2005. http://signal.ee.bilkent.edu.tr/defevent/papers/cr1105.pdf
  3. T. E. Hutchinson and K. White, J.R. Worthy, N. Martin, C. Kelly, R. Lisa, A. Frey, 'Human Computer Interaction using Eye-Gaze Input,' IEEE Transaction on systems, man, and cybernetics, Vol.19, pp.1527-1533, 1989 https://doi.org/10.1109/21.44068
  4. T. Kocejko, A. Bujnowski, and J. Wtorek, 'Eye Mouse for Disabled,' Human System Interactions 2008, pp.199-202, 2008 https://doi.org/10.1109/HSI.2008.4581433
  5. P.Viola and M.J. Jones, 'Robust real-time object detection,' Technical Report Series, Compaq Cambridge research Laboratory, 2001
  6. 이흔진, 박현선, 김경수, 김희정, 정병희, 하명환, 김회율, 'DCT/LDA를 이용한 얼굴 인식', 대한 전자공학회 하계학술대회 제26권 제1호, pp.2024-2027, 2003
  7. 정성욱, 'AdaBoost기반 실시간 얼굴 표정 인식을 위한 효과적인 사각 특징점 추출', 한국과학기술원 석사학위논문, 2004
  8. A. Kuranov, R. Lienhart and Vadim Pisarevsky, 'An Empirical Analysis of Boosting Algorithms for Rapid Objects With an Extended Set of Haar-like Features,' Intel Technical Report, 2002
  9. 민지홍, 이원찬, 홍기천, 'Haar-like feature/HMM을이용한 얼굴 검출 및 인증 시스템', 2004년 한국정보과학회 가을학술발표논문집 제31권 제2호, pp.739-741, 2004
  10. 박성훈, 이재호, 김회율, 'Haar-like feature/LDA를이용한 얼굴 인식', 제16회 영상처리 및 이해에 관한 워크샵 발표논문집, pp.271-276, 2004
  11. 전종배, 하길람, 김동주, 홍광석, '이동 환경에서 히스토그램 평활화와 ROI를 이용한 치열영역 검출', 한국신호처리.시스템학회 2007 추계 학술 대회 논문집, pp.211-214, 2007
  12. L. Sirovich and M. Kirby, 'Low dimensional Procedure for the Characterization of Human Faces,' J.Opt. Soc. Amer. Vol.4, No.3, pp.519-524, 1987 https://doi.org/10.1364/JOSAA.4.000519
  13. E. Hjelmas, 'Face Detection : A Survey,' Computer Vision and Image Understanding, Vol. 83, pp.236-274, 2001 https://doi.org/10.1006/cviu.2001.0921
  14. C. E. Shannon, 'A Mathematical Theory of Communication,' The Bell Systems Technical Journal, Vol.27, pp.379-423, 1948 https://doi.org/10.1002/j.1538-7305.1948.tb01338.x