제한된 라벨 데이터 상에서 다중-태스크 반 지도학습을 사용한 동작 인지 모델의 성능 향상

Improving Human Activity Recognition Model with Limited Labeled Data using Multitask Semi-Supervised Learning

  • ;
  • ;
  • 이석룡 (한국외국어대학교 산업경영공학과)
  • 투고 : 2018.11.06
  • 심사 : 2018.12.17
  • 발행 : 2018.12.31

초록

기계 학습을 통한 인간 동작 인지 (human activity recognition) 시스템에서 중요한 요소는 충분한 양의 라벨 데이터 (labeled data)를 확보하는 것이다. 그러나 라벨 데이터를 확보하는 일은 많은 비용과 시간을 필요로 한다. 매우 적은 수의 라벨 데이터를 가지고 있는 새로운 환경 (타겟 도메인)에서 동작 인지 시스템을 구축하는 경우, 기존의 환경 (소스 도메인)의 데이터나 이 환경에서 학습된 분류기(classifier)를 사용하는 것은 도메인이 서로 다르기 때문에 바람직하지 않다. 기존의 기계 학습 방법들이 이러한 문제를 해결할 수 없으므로 전이 학습 (transfer learning) 방법이 제시되었으며, 이 방법에서는 소스 도메인에서 확보한 지식을 활용하여 타겟 도메인에서의 분류기 성능을 높이도록 하고 있다. 본 논문에서는 다중 태스크 신경망 (multitask neural network)을 사용하여 매우 제한된 수의 데이터만으로 정확도가 높은 동작 인지 분류기를 생성하는 전이 학습방법을 제안한다. 이 방법에서는 소스 및 타겟 도메인 분류기의 손실 함수 최소화가 별개의 태스크로 간주된다. 즉, 하나의 신경망을 사용하여 두 태스크의 손실 함수를 동시에 최소화하는 방식으로 지식 전이(knowledge transfer)가 일어나게 된다. 또한, 제안한 방법에서는 모델 학습을 위하여 비지도 방식(unsupervised manner)으로 라벨이 부여되지 않은 데이터를 활용한다. 실험 결과, 제안한 방법은 기존의 방법에 비하여 일관적으로 우수한 성능을 보여주고 있다.

A key to a well-performing human activity recognition (HAR) system through machine learning technique is the availability of a substantial amount of labeled data. Collecting sufficient labeled data is an expensive and time-consuming task. To build a HAR system in a new environment (i.e., the target domain) with very limited labeled data, it is unfavorable to naively exploit the data or trained classifier model from the existing environment (i.e., the source domain) as it is due to the domain difference. While traditional machine learning approaches are unable to address such distribution mismatch, transfer learning approach leverages the utilization of knowledge from existing well-established source domains that help to build an accurate classifier in the target domain. In this work, we propose a transfer learning approach to create an accurate HAR classifier with very limited data through the multitask neural network. The classifier loss function minimization for source and target domain are treated as two different tasks. The knowledge transfer is performed by simultaneously minimizing the loss function of both tasks using a single neural network model. Furthermore, we utilize the unlabeled data in an unsupervised manner to help the model training. The experiment result shows that the proposed work consistently outperforms existing approaches.

키워드

과제정보

연구 과제 주관 기관 : 한국외국어대학교

참고문헌

  1. A. Avci, S. Bosch, M. Marin-Perianu, R. Marin-Perianu, and P. Havinga, "Activity Recognition Using Inertial Sensing for Healthcare, Wellbeing and Sports Applications: A Survey," Archit. Comput. Syst. (ARCS), 2010 23rd Int. Conf., pp. 1-10, 2010.
  2. J. Yin, Q. Yang, J. J. Pan, Jie Yin, Qiang Yang, and J. J. Pan, "Sensor-based abnormal human-activity detection," IEEE Trans. Knowl. Data Eng., vol. 20, no. 8, pp. 1082-1090, 2008. https://doi.org/10.1109/TKDE.2007.1042
  3. S. Chernbumroong, S. Cang, and H. Yu, "Genetic algorithm-based classifiers fusion for multisensor activity recognition of elderly people," IEEE J. Biomed. Heal. Informatics, vol. 19, no. 1, pp. 282-289, Jan. 2015. https://doi.org/10.1109/JBHI.2014.2313473
  4. D. Guan, W. Yuan, Y.-K. Lee, A. Gavrilov, and S. Lee, "Activity Recognition Based on Semi-supervised Learning," in 13th IEEE International Conference on Embedded and Real-Time Computing Systems and Applications (RTCSA 2007), 2007, pp. 469-475.
  5. Z. Huang, Z. Pan, and B. Lei, "Transfer learning with deep convolutional neural network for SAR target classification with limited labeled data," Remote Sensing, vol. 9, p.907, 2017 https://doi.org/10.3390/rs9090907
  6. R. Caruana, "Multitask Learning," Mach. Learn., vol. 28, no. 1, pp. 41-75, 1997. https://doi.org/10.1023/A:1007379606734
  7. M. Kandemir, A. Vetek, M. Gonen, A. Klami, and S. Kaski, "Multi-task and multi-view learning of user state," Neurocomputing, vol. 139, pp. 97-106, Sep. 2014. https://doi.org/10.1016/j.neucom.2014.02.057
  8. Y. Xue, X. Liao, L. Carin, and B. Krishnapuram, "Multi-Task Learning for Classification with Dirichlet Process Priors," J. Mach. Learn. Res., vol. 8, no. Jan, pp. 35-63, 2007.
  9. A. Niculescu-Mizil and R. Caruana, "Predicting good probabilities with supervised learning," in Proceedings of the 22nd international conference on Machine learning - ICML '05, 2005, pp. 625-632.
  10. L. Hu, Y. Chen, J. Wang, C. Hu, and X. Jiang, "OKRELM: online kernelized and regularized extreme learning machine for wearable-based activity recognition," Int. J. Mach. Learn. Cybern., vol. 9, no. 9, pp. 1577-1590, Sep. 2018. https://doi.org/10.1007/s13042-017-0666-8
  11. A. Blum and T. Mitchell, "Combining labeled and unlabeled data with co-training," in Proceedings of the eleventh annual conference on Computational learning theory - COLT' 98, 1998, pp. 92-100
  12. D. Anguita, A. Ghio, L. Oneto, X. Parra, and J. L. Reyes-Ortiz, "A Public Domain Dataset for Human Activity Recognition Using Smartphones," in European Symposium on Artificial Neural Networks, 2013.
  13. D. Roggen et al., "Collecting complex activity datasets in highly rich networked sensor environments," in 2010 Seventh International Conference on Networked Sensing Systems (INSS), 2010, pp. 233-240