지능형 IoT서비스를 위한 기계학습 기반 동작 인식 기술

  • 최대웅 (고려대학교 컴퓨터정보학과) ;
  • 조현중 (고려대학교 컴퓨터정보학과)
  • Published : 2016.07.29

Abstract

최근 RFID와 같은 무선 센싱 네트워크 기술과 객체 추적을 위한 센싱 디바이스 및 다양한 컴퓨팅 자원들이 빠르게 발전함에 따라, 기존 웹의 형태는 소셜 웹에서 유비쿼터스 컴퓨팅 웹으로 자연스럽게 진화되고 있다. 유비쿼터스 컴퓨팅 웹에서 사물인터넷(IoT)은 기존의 컴퓨터를 대체할 수 있는데, 이것은 곧 한 사람과 주변 사물들 간에 연결되는 네트워크가 확장되는 것과 동시에 네트워크 안에서 생성되는 데이터의 수가 기하급수적으로 증가되는 것을 의미한다. 따라서 보다 지능적인 IoT 서비스를 위해서는, 수많은 미가공 데이터들 사이에서 사람의 의도와 상황을 실시간으로 정확히 파악할 수 있어야 한다. 이때 사물과의 상호작용을 위한 동작 인식 기술(Gesture recognition)은 집적적인 접촉을 필요로 하지 않기 때문에, 미래의 사람-사물 간 상호작용에 응용될 수 있는 잠재력을 갖고 있다. 한편, 기계학습 분야의 최신 알고리즘들은 다양한 문제에서 사람의 인지능력을 종종 뛰어넘는 성능을 보이고 있는데, 그 중에서도 의사결정나무(Decision Tree)를 기반으로 한 Decision Forest는 분류(Classification)와 회귀(Regression)를 포함한 전 영역에 걸쳐 우월한 성능을 보이고 있다. 따라서 본 논문에서는 지능형 IoT 서비스를 위한 다양한 동작 인식 기술들을 알아보고, 동작 인식을 위한 Decision Forest의 기본 개념과 구현을 위한 학습, 테스팅에 대해 구체적으로 소개한다. 특히 대표적으로 사용되는 3가지 학습방법인 배깅(Bagging), 부스팅(Boosting) 그리고 Random Forest에 대해 소개하고, 이것들이 동작 인식을 위해 어떠한 특징을 갖는지 기존의 연구결과를 토대로 알아보았다.

Keywords

References

  1. J. Gubbi, R. Buyya, S. Marusic, and M. Palaniswami, "Internet of things (IoT): A vision, architectural elements, and future directions", Future Generation Computer Systems, vol. 29, no. 7, pp. 1645-1660, Sep. 2013. https://doi.org/10.1016/j.future.2013.01.010
  2. Google Soli Project, https://atap.google.com/soli/
  3. L. Rokach, "Decision forest: Twenty years of research", Information Fusion, vol. 27, pp. 111-125, Jan. 2016. https://doi.org/10.1016/j.inffus.2015.06.005
  4. A. Criminisi, J. Shotton, Decision Forests for Computer Vision and Medical Image Analysis, Springer, pp. 7-45, 2013.
  5. G. E. Hinton, S. Osindero, and Y. W. The, "A fast learning algorithm for deep belief nets", Neural Computation, vol. 17, no. 7, pp. 1527-1554, May. 2006.
  6. Y. Bengio, P. Lamblin, D. Popovici, and H. Larochelle, "Greedy layer-wise training of deep networks", Advances in Neural Information Processing Systems, vol. 19, pp. 153-160, 2007.
  7. A. Krizhevsky, I. Sutskever, and G. E. Hinton, "Imagenet classification with deep convolutional neural networks", Advances in Neural Information Processing Systems, pp. 1097-1105, 2012.
  8. J. Schmidhuber, "Deep learning in neural networks: An overview", Neural Networks, vol 61, pp. 85-117, Jan. 2015. https://doi.org/10.1016/j.neunet.2014.09.003
  9. M. Fernandez-Delgado, E. Gernadas, S. Barro, and D. Amorim, "Do we need hundreds of classifiers to solve real world classification problems", Journal of Machine Learning Research, vol. 15, no. 1, pp. 3133-3181, Oct. 2014.
  10. Google Glass FAQ, https://developers.google.com/glass/, Jan. 2014.
  11. K. Fukahori, D. Sakamoto, and T. Igarashi, "Exploring subtle foot plantar-based gestures with sock-placed pressure sensors", In Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems, pp. 3019-3028, Apr. 2015.
  12. J. Wright, A. Y. Yang, A. Ganesh, S. S. Sastry, and Y. Ma, "Robust face recognition via sparse representation", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 31, no. 2, pp. 210-227, Apr. 2009. https://doi.org/10.1109/TPAMI.2008.79
  13. J. Shotton, R. Girshick, A. Fitzgibbon, T. Sharp, M. Cook, M. Finocchio, and A. Blake, "Efficient human pose estimation from single depth images", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 35, no. 12, pp. 2821-2840, Oct. 2013. https://doi.org/10.1109/TPAMI.2012.241
  14. S. Mitra, T. Acharya, "Gesture recognition: A survey", IEEE Trans. Systems, Man, and Cybermetics, Part C (Applications and Reviews), vol. 37, no. 3, pp. 311-324, 2007. https://doi.org/10.1109/TSMCC.2007.893280
  15. K. Y. Chen, S. Patel, and S. Keller, "Finexus: Tracking precise motions of multiple fingertips using magnetic sensing", In Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, pp. 1504-1514, 2016.
  16. Tharmic labs의 Myo센서, https://www.myo.com, 2012.
  17. Y. Yang, S. Chae, J. Shim, and T. D. Han, "EMG sensorbased two-hand smart watch interaction", In Adjunct Proceedings of the 28th Annual ACM Symposium on User Interface Software & Technology, pp. 73-74, Nov. 2015.
  18. Q. Yang, L. Wang, R. Yang, H. Stewenius, and D. Nister, "Stereo matching with color-weighted correlation, hierarchical belief propagation, and occlusion handling", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 31, no. 3, pp. 492-504, Mar. 2009. https://doi.org/10.1109/TPAMI.2008.99
  19. A. Sinha, C. Choi, and K. Ramani, "DeepHand: Robust hand pose estimation by completing a matrix imputed with deep features", In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 4150-4158, 2016.
  20. N. C. Camgoz, A. A. Kindiroglu, and L. Akarun, "Gesture recognition using template based random forest classifiers", In Workshop at the European Conference on Computer Vision, pp. 579-594, Sep. 2014.
  21. X. Zhao, Z. Song, J. Guo, Y. Zhao, and F. Zheng, "Realtime hand gesture detection and recognition by random forest", In Communications and Information Processing, Springer Berlin Heidelberg, vol. 289, pp. 747-755, 2012.
  22. 오일석, "패턴인식", 교보문고, 2008.
  23. L. Breiman, J. Friedman, C. J. Stone, and R. A. Olshen, Classification and Regression Trees, Chapman and Hall/CRC press, 1984.
  24. J. R. Quinlan, C4.5: Programs for Machine Learning, Morgan Kaufmann, 1993.
  25. J. Mingers, "An empirical comparison of pruning methods for decision tree induction", Machine Learning, vol. 4, no. 2, pp. 227-243, Nov. 1989. https://doi.org/10.1023/A:1022604100933
  26. T. K. Ho, "The random subspace method for constructing decision forests", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 20, no. 8, pp. 832-844, Aug. 1998. https://doi.org/10.1109/34.709601
  27. Y. Freund, R. E. Schapire. "Experiments with a new boosting algorithm", In ICML, vol. 96, pp. 148-156, 1996.
  28. T. K. Ho, "Random decision forests", In Proceedings of the Third International Conference on Document Analysis and Recognition, vol. 1, pp. 278-282, Aug. 1995.
  29. L. Breiman, "Bagging predictors", Machine Learning, vol. 24, no. 2, pp. 123-140, Aug. 1996. https://doi.org/10.1023/A:1018054314350
  30. L. Breiman, "Random forests", Machine Learning, vol. 45, no. 1, pp. 5-32, Oct. 2001. https://doi.org/10.1023/A:1010933404324
  31. P. Geurts, D. Ernst, and L. Wehenkel, "Extremely randomized trees", Machine Learning, vol. 64, no. 1, pp. 3-42, Apr. 2006. https://doi.org/10.1007/s10994-006-8257-z
  32. J. J. Rodriguez, L. I. Kuncheva, and C. J. Alonso, "Rotation forest: A new classifier ensemble method", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 28, no. 10, pp. 1619-1630, Oct. 2006. https://doi.org/10.1109/TPAMI.2006.211
  33. K. Crammer, Y. Singer, "On the algorithmic implementation of multiclass kernel-based vector machines", Journal of Machine Learning Research, vol. 2, pp. 265-292, 2001.
  34. A. Torralba, K. P. Murphy, and W. T. Freeman, "Sharing visual features for multiclass and multiview object detection", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 29, no. 5, pp. 854-869, May. 2007. https://doi.org/10.1109/TPAMI.2007.1055
  35. J. Shotton, M. Johnson, and R. Cipolla, "Semantic texton forests for image categorization and segmentation", IEEE Conference on Computer Vision and Pattern Recognition, pp. 1-8, Jun. 2008.
  36. J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio, A. Blake, and R. Moore, "Real-time human pose recognition in parts from single depth images", Communications of the ACM, vol. 56, no. 1, pp. 116-124, Jan. 2013. https://doi.org/10.1145/2398356.2398381
  37. R. Caruana, N. Karampatziakis, and A. Yessenalina, "An dmpirical evaluation of supervised learning in high dimensions", In Proceedings of the 25th International Conference on Machine Learning, pp. 96-103, Jul. 2008.
  38. L. Mitchell, T. M. Sloan, M. Mewissen, P. Ghazal, T. Forster, M. Piotrowski, and A. S. Trew, "A parallel random forest classifier for R", In Proceedings of the Second International Workshop on Emerging Computational Methods for the Life Sciences, pp. 1-6, 2011.