DOI QR코드

DOI QR Code

A Method of Activity Recognition in Small-Scale Activity Classification Problems via Optimization of Deep Neural Networks

심층 신경망의 최적화를 통한 소규모 행동 분류 문제의 행동 인식 방법

  • 김승현 (순천대학교 컴퓨터비전 및 보안실험실) ;
  • 김연호 (순천대학교 컴퓨터과학과) ;
  • 김도연 (순천대학교 컴퓨터과학과)
  • Received : 2016.09.08
  • Accepted : 2016.10.27
  • Published : 2017.03.31

Abstract

Recently, Deep learning has been used successfully to solve many recognition problems. It has many advantages over existing machine learning methods that extract feature points through hand-crafting. Deep neural networks for human activity recognition split video data into frame images, and then classify activities by analysing the connectivity of frame images according to the time. But it is difficult to apply to actual problems which has small-scale activity classes. Because this situations has a problem of overfitting and insufficient training data. In this paper, we defined 5 type of small-scale human activities, and classified them. We construct video database using 700 video clips, and obtained a classifying accuracy of 74.00%.

최근 컴퓨터를 이용한 다양한 인식 문제를 해결하기 위해 딥 러닝을 적용하는 사례가 늘어나고 있다. 딥 러닝은 학습에 필요한 요소를 학습데이터를 통해 스스로 도출해내기 때문에, 수작업(hand-craft)을 통해 특징을 도출하던 기존의 기계학습 방법보다 더 많은 장점을 갖는다. 행동인식을 위한 기존의 심층 신경망은 비디오 데이터를 일정 프레임의 이미지로 분할한 후, 분할된 각 이미지 사이의 시간적 연계성 분석을 통해 행동을 분류한다. 그러나 이러한 신경망은 소규모 행동 클래스를 갖는 분류 문제에서 학습 데이터의 부족 문제 및 과적합(overfitting) 문제로 인해 이를 실제 문제에 적용하기 어려운 경우가 많다. 이에 본 논문에서는 5가지의 소규모 행동 클래스를 정의하고, 기존 행동 인식 신경망의 최적화를 통해 이를 분류하였다. 700개의 비디오데이터를 통해 행동 데이터베이스를 구성하였고, 약 74.00%의 분류 정확도를 얻을 수 있었다.

Keywords

References

  1. E. Kim, S. Helal, and D. Cook, "Human activity recognition and pattern discovery," IEEE Pervasive Computing, Vol.9, No.1, pp.48-53, 2010. https://doi.org/10.1109/MPRV.2010.7
  2. L. Yann, B. Yoshua, and H. Geoffrey, "Deep learning," Nature, Vol.521, No.7553, pp.436-444, 2015. https://doi.org/10.1038/nature14539
  3. I. J. Kim, "Recent advances in deep learning technologies for visual recognition," Communications of the Korean Institute of Information Scientists and Engineers, Vol.33, No.9, pp.15-20, 2015.
  4. D. Jeffrey et al, "Long-term recurrent convolutional networks for visual recognition and description," in Proceeding of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2015), Boston-Massachusetts: US, pp.2625-2634, Jun., 2015.
  5. NUREG-1959, Intrusion Detection Systems and Subsystems, USNRC (United States Nuclear Regulatory Commission), p.19, Nov., 2010.
  6. Wikipedia, Activity Recognition [Internet], https://en.wikipedia.org/wiki/Activity_recognition.
  7. C. Liming and K. Ismail, "Activity recognition: Approaches, practices and trends," in Activity Recognition in Pervasive Intelligent Environments, 1st ed. Atlantis Press Pub., ch.3, pp.1-31, 2011.
  8. V. Michalis, N. Christophoros, and I. A. Kakadiaris, "A Review of Human Activity Recognition Methods," Frontiers in Robotics and AI 2:28, 2015.
  9. J. Kim, C. J. Nan, and B. T. Zhang, "Deep Learning-based Video Analysis Techniques," Communications of the Korean Institute of Information Scientists and Engineers, Vol.33, No.9, pp.21-31, 2015.