DOI QR코드

DOI QR Code

Data Augmentation using a Kernel Density Estimation for Motion Recognition Applications

움직임 인식응용을 위한 커널 밀도 추정 기반 학습용 데이터 증폭 기법

  • 정우순 (대구대학교 정보통신공학과) ;
  • 이형규 (덕성여자대학교 소프트웨어학과)
  • Received : 2022.08.10
  • Accepted : 2022.08.29
  • Published : 2022.08.30

Abstract

In general, the performance of ML(Machine Learning) application is determined by various factors such as the type of ML model, the size of model (number of parameters), hyperparameters setting during the training, and training data. In particular, the recognition accuracy of ML may be deteriorated or experienced overfitting problem if the amount of dada used for training is insufficient. Existing studies focusing on image recognition have widely used open datasets for training and evaluating the proposed ML models. However, for specific applications where the sensor used, the target of recognition, and the recognition situation are different, it is necessary to build the dataset manually. In this case, the performance of ML largely depends on the quantity and quality of the data. In this paper, training data used for motion recognition application is augmented using the kernel density estimation algorithm which is a type of non-parametric estimation method. We then compare and analyze the recognition accuracy of a ML application by varying the number of original data, kernel types and augmentation rate used for data augmentation. Finally experimental results show that the recognition accuracy is improved by up to 14.31% when using the narrow bandwidth Tophat kernel.

머신러닝(ML, Machine Learning)기반 응용에서의 인식성능은 적용된 모델의 종류와 크기, 학습환경 및 학습에 사용되는 데이터 등 다양한 요인에 따라 결정된다. 특히 학습에 사용되는 데이터가 충분치 않을 경우 인식성능이 저하되거나 과적합(Overfitting)등의 문제가 발생하기도 한다. 이미지 인식을 주요 대상으로 하는 기존 연구들은 학습을 위한 데이터셋이 풍부하고 검증된 데이터셋을 사용하여 학습 및 인식성능을 평가할 수 있다. 하지만 사용된 센서, 인식의 대상, 인식 상황이 다른 특정 응용들의 경우 데이터셋을 직접 구축해야 한다. 이런 경우, ML모델의 성능은 데이터의 양과 품질에 따라 달라진다. 본 논문에서는 이용 가능한 학습용 데이터가 충분치 않은 움직임 인식응용에 효율적으로 사용될 수 있는 비모수 추정 방식의 일종인 커널 밀도 추정 알고리즘을 사용하여 학습용 데이터를 증폭한 후, 사용된 커널의 종류에 따라, 원본 데이터의 수 및 증폭 비율에 따라 증폭된 데이터가 원본 데이터의 특징을 잘 반영하는지 인식 정확도 변화를 토대로 비교 분석한다. 실험결과, 본 연구에서 사용한 움직임 인식응용에서는 좁은 대역폭을 가진 Tophat 커널로 증폭된 데이터셋에서 최대 14.31%의 인식 정확도 향상을 확인하였다.

Keywords

Acknowledgement

본 연구는 방위사업청과 국방과학연구소가 지원하는 미래전투체계 네트워크 기술 특화연구센터 사업의 일환으로 수행되었습니다.(UD190033ED)

References

  1. Bank, D., et al., (2003). Autoencoders, https://doi.org/10.48550/arxiv.2003.05991
  2. Deng, J. et al. (2009). ImageNet: A Large-Scale Hierarchical Image Database, https://doi.org/10.1109/CVPR.2009.5206848.
  3. Deng, L. (2012). The mnist database of handwritten digit images for machine learning research. IEEE Signal Processing Magazine, 29(6), 141-142. https://doi.org/10.1109/MSP.2012.2211477
  4. Goodfellow, Ian J. et al. (2014). Generative Adversarial Networks, https://doi.org/10.48550/arxiv.1406.2661
  5. Izenman, A. J. (1991). Review Papers: Recent Developments in Nonparametric Density Estimation, https://doi.org/10.1080/01621459.1991.10475021
  6. Jung, W. and Lee, H.G. (2022) Energy-Accuracy Aware Finger Gesture Recognition for Wearable IoT Devices. Sensors, https://doi.org/10.3390/s22134801
  7. Kim, K. et al. (2020). Fault Detection Using Signal Reconstruction Model Based on Autoencoder in Thermal Power Plant, KIEE, 69(6), 800-807. https://doi.org/10.5370/KIEE.2020.69.6.800
  8. Krizhevsky, A. & Hinton, G. (2009). Learning multiple layers of features from tiny images. Technical Report, University of Toronto, Toronto, Ontario
  9. Scikit-learn, https://scikit-learn.org/stable/auto_examples/neighbors/plot_kde_1d.html#sphx-glr-auto-examples-neighbors-plot-kde-1d-py
  10. Wang, H. et al. (2018). A Bayesian Scene-Prior-Based Deep Network Model for Face Verification. Sensors. https://doi.org/10.3390/s18061906.
  11. Zhu, X., Vondrick, C., Fowlkes, C. and Ramanan, D. (2015). Do We Need More Training Data?, https://doi.org/10.48550/arXiv.1503.01508.