DOI QR코드

DOI QR Code

Optimizing Input Parameters of Paralichthys olivaceus Disease Classification based on SHAP Analysis

SHAP 분석 기반의 넙치 질병 분류 입력 파라미터 최적화

  • 조경원 (호남대학교) ;
  • 백란 (호남대학교 컴퓨터공학과)
  • Received : 2023.10.28
  • Accepted : 2023.12.27
  • Published : 2023.12.31

Abstract

In text-based fish disease classification using machine learning, there is a problem that the input parameters of the machine learning model are too many, but due to performance problems, the input parameters cannot be arbitrarily reduced. This paper proposes a method of optimizing input parameters specialized for Paralichthys olivaceus disease classification using SHAP analysis techniques to solve this problem,. The proposed method includes data preprocessing of disease information extracted from the halibut disease questionnaire by applying the SHAP analysis technique and evaluating a machine learning model using AutoML. Through this, the performance of the input parameters of AutoML is evaluated and the optimal input parameter combination is derived. In this study, the proposed method is expected to be able to maintain the existing performance while reducing the number of input parameters required, which will contribute to enhancing the efficiency and practicality of text-based Paralichthys olivaceus disease classification.

머신러닝을 이용한 텍스트 기반 어류 질병 분류에서 머신러닝 모델의 입력 파라미터가 너무 많은 문제가 존재하지만, 성능의 문제로 임의로 입력 파라미터를 줄일 수 없다. 본 논문에서는 이 문제를 해결하고자 SHAP 분석 기법을 활용해 넙치 질병 분류에 특화된 입력 파라미터 최적화 방안을 제시한다. 제안한 방법은 SHAP 분석 기법을 적용하여 넙치 질병 문진표에서 추출한 질병 정보의 데이터 전처리와 AutoML을 활용한 머신러닝 모델 평가 과정을 포함한다. 이를 통해 AutoML의 입력 파라미터의 성능을 평가하고, 최적의 입력 파라미터 조합을 도출한다. 본 연구에서 제안 방법은 필요한 입력 파라미터 수를 감소시키면서도 기존의 성능을 유지할 수 있을 것으로 기대되며, 이는 텍스트 기반 넙치 질병 분류의 효율성 및 실용성을 높이는 데 기여할 것이다.

Keywords

Acknowledgement

본 논문은 2023년도 호남대학교 학술연구비 지원으로 수행되었음.

References

  1. FAO, "2018 The STATE OF WORLD FISHERIES AND AQUACULTURE," pp. 85, 2018.
  2. Statistics Korea, "2020 Fish Farming Trend Survey Results", https://eiec.kdi.re.kr/policy/materialView.do?num=211933&topic=O&pp=20
  3. Fisheries Newspaper, "Increase in Infectious Diseases in Domestic and Imported Seafood in Korea", https://www.isusanin.com/news/articleView.html?idxno=30689
  4. National Institute of Fisheries Science, "Fish disease incidence statistics", https://www.nifs.go.kr/fishguard/disease03
  5. H. S. Son, H. S Choi, "Image Augmentation of Paralichthys Olivaceus Disease Using SinGAN Deep Learning Model," The J. of the Korea Contents Association, vol. 21, no. 12, 2021, pp. 322-330.
  6. J. Y. Kang, H. S. Son, H. S Choi, "A Comparison of Pre-Processing Techniques for Enhanced Identification of Paralichthys olivaceus Disease based on Deep Learning," The J. of the Korea Contents Association, vol. 22, no. 3, 2022, pp. 71-80. https://doi.org/10.5392/JKCA.2022.22.11.071
  7. H. S. Son, H. K. Lim, H. S. Choi, "A Study on Disease Prediction of Paralichthys Olivaceus using Deep Learning Technique," Smart Media J., vol. 11, no. 4, 2022, pp. 62-68. https://doi.org/10.30693/SMJ.2022.11.4.62
  8. S. M. Lundberg, S. I. Lee. "A unified approach to interpreting model predictions," In Proc. Advances in neural information processing systems 30, 2017.
  9. S. K. Karmaker, M. M. Hassan, M. J. Smith, L. Xu, C. Zhai, K. Veeramachaneni, "Automl to date and beyond: Challenges and opportunities," ACM Computing Surveys, vol. 54, no. 8, 2021, pp. 1-36. https://doi.org/10.1145/3470918
  10. P. Geurts, D. Ernst, L. Wehenkel, "Extremely randomized trees," Machine learning, vol. 63, 2006, pp. 3-42. https://doi.org/10.1007/s10994-006-6226-1
  11. L. Breiman, "Random forests," Machine learning, vol. 45, 2001, pp. 5-32. https://doi.org/10.1023/A:1010933404324
  12. T. Chen, C. Guestrin, "Xgboost: A scalable tree boosting system," In Proc. the 22nd acm sigkdd int. conf. on knowledge discovery and data mining, August 2016, pp. 785-794.
  13. G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma, Q. Ye, T. Y. Liu, "Lightgbm: A highly efficient gradient boosting decision tree," In Proc. Advances in neural information processing systems 30, 2017.
  14. L. Breiman, "Bagging predictors," Machine learning, vol. 24, 1996, pp. 123-140. https://doi.org/10.1007/BF00058655
  15. C. Cortes, V. Vapnik, "Support-vector networks," Machine learning, vol. 20, 1995, pp. 273-297. https://doi.org/10.1007/BF00994018