전이 학습과 SHAP 분석을 이용한 설명가능한 동물 울음소리 분류 기법

Explainable Animal Sound Classification Scheme using Transfer Learning and SHAP Analysis

  • 이재승 (고려대학교 전기전자공학과) ;
  • 문재욱 (고려대학교 전기전자공학과) ;
  • 박성우 (고려대학교 전기전자공학과) ;
  • 황인준 (고려대학교 전기전자공학과)
  • Jaeseung Lee (School of Electrical Engineering, Korea University) ;
  • Jaeuk Moon (School of Electrical Engineering, Korea University) ;
  • Sungwoo Park (School of Electrical Engineering, Korea University) ;
  • Eenjun Hwang (School of Electrical Engineering, Korea University)
  • 발행 : 2024.05.23

초록

인간의 산업 활동으로 인하여 동물들의 생존이 위협받으면서, 동물의 서식 분포를 효과적으로 파악할 수 있는 자동 야생동물 모니터링 기술의 필요성이 점점 더 커지고 있다. 그중에서도 동물 소리 분류 기술은 시각적으로 식별이 어려운 동물에게도 효과적으로 적용할 수 있는 장점으로 인하여 널리 사용되고 있다. 최근 심층학습 기반의 분류 모델들이 좋은 판별 성능을 보여주고 있어 동물 소리 분류에 많이 사용되고 있지만, 희귀종과 같이 개체 수가 적어 데이터가 부족한 경우에는 학습이 제대로 이루어지지 않을 수 있다. 또한, 이러한 모델들은 모델 내부에서 일어나는 추론 과정을 알 수 없어 결과를 완전히 신뢰하고 사용하는 데 제약이 따른다. 이에 본 논문에서는 전이 학습을 통해 데이터 부족 문제를 고려하고, SHAP을 이용하여 분류 모델의 추론 과정을 해석하는 설명가능한 동물 소리 분류 기법을 제안한다. 실험 결과, 제안하는 기법은 지도 학습을 한 경우보다 분류 성능이 향상됨을 확인하였으며, SHAP 분석을 통해 모델의 분류 근거를 이해할 수 있었다.

키워드

과제정보

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.RS-2023-00262750, 인공지능 기반 소리인식기술을 이용한 감염병매개모기(일본뇌염 및 말라리아) 자동예찰 시스템 개발)

참고문헌

  1. R. Almond, M. Grooten, and T. Petersen. "Living Planet Report 2020 - Bending the curve of biodiversity loss", in World Wide Fund for Nature, 2020.
  2. 이재승, 김은빈, 문재욱, 황인준. "앙상블을 사용한 Focal Loss 기반의 동물 소리 분류 기법", 한국정보과학회 한국컴퓨터종합학술대회, 대한민국 제주, 2023, pp. 860-862.
  3. F. Zhuang, Z. Qi, K. Duan, D. Xi, Y. Zhu, H. Zhu, H. Xiong, and Q. He. "A Comprehensive Survey on Transfer Learning", arXiv preprint, arXiv:1911.02685, 2019.
  4. S. Lundberg and S. Lee. "A Unified Approach to Interpreting Model Predictions", in NeurIPS, California, USA, 2017, pp. 4768-4777.
  5. A. Cramer, V. Lostanlen, A. Farnsworth, J. Salamon, and J. Bello. "Chirping up the Right Tree: Incorporating Biological Taxonomies into Deep Bioacoustic Classifiers", in ICASSP, Barcelona, Spain, 2020, pp. 901-905.
  6. K. He, X. Zhang, S. Ren, and J. Sun. "Deep Residual Learning for Image Recognition", in CVPR, Nevada, USA, 2016, pp. 770-778.
  7. M. Tan and Q. Le. "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", in ICML, California, USA, 2019, pp. 6105-6114.
  8. A. Howard et al. "Searching for MobileNetV3", in ICCV, Seoul, Korea, 2019, pp. 1314-1324.
  9. X. Zhang, X. Zhou, M. Lin, and J. Sun. "ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices", in CVPR, Utah, USA, 2018, pp. 6848-6856.
  10. I. Radosavovic, R. Kosaraju, R. Girshick, K. He, and P. Dollar. "Designing Network Design Spaces", in CVPR, Washington, USA, 2020, pp. 10428-10436.
  11. G. Huang, Z. Liu, L. Maaten, and K. Weinberger. "Densely Connected Convolutional Networks", in CVPR, Hawaii, USA, 2017, pp. 4700-4708.