DOI QR코드

DOI QR Code

A Study on the i-YOLOX Architecture for Multiple Object Detection and Classification of Household Waste

생활 폐기물 다중 객체 검출과 분류를 위한 i-YOLOX 구조에 관한 연구

  • 왕웨이광 (동신대학교 컴퓨터학과 대학원) ;
  • 정경권 (동신대학교 전기공학과) ;
  • 이태원 (동신대학교 컴퓨터학과)
  • Received : 2023.12.11
  • Accepted : 2023.12.20
  • Published : 2023.12.31

Abstract

In addressing the prominent issues of climate change, resource scarcity, and environmental pollution associated with household waste, extensive research has been conducted on intelligent waste classification methods. These efforts range from traditional classification algorithms to machine learning and neural networks. However, challenges persist in effectively classifying waste in diverse environments and conditions due to insufficient datasets, increased complexity in neural network architectures, and performance limitations for real-world applications. Therefore, this paper proposes i-YOLOX as a solution for rapid classification and improved accuracy. The proposed model is evaluated based on network parameters, detection speed, and accuracy. To achieve this, a dataset comprising 10,000 samples of household waste, spanning 17 waste categories, is created. The i-YOLOX architecture is constructed by introducing the Involution channel convolution operator and the Convolution Branch Attention Module (CBAM) into the YOLOX structure. A comparative analysis is conducted with the performance of the existing YOLO architecture. Experimental results demonstrate that i-YOLOX enhances the detection speed and accuracy of waste objects in complex scenes compared to conventional neural networks. This confirms the effectiveness of the proposed i-YOLOX architecture in the detection and classification of multiple household waste objects.

생활 폐기물 쓰레기는 기후 변화, 자원 부족, 환경 오염을 불러오는 대표적인 문제로서, 이러한 문제를 해결하기 위해 지능적으로 쓰레기를 분류하는 방식을 연구하였고, 전통적인 분류 알고리즘부터 기계학습, 신경망에 이르기까지 많은 연구가 진행되고 있다. 그러나, 다양한 환경과 조건에서 쓰레기를 분류하기에는 여전히 데이터셋이 부족하고, 신경망 네트워크 구성 복잡도가 증가하며, 성능 측면에서도 실생활에 적용하기에 아직 미흡하다. 따라서 본 논문에서는 신속한 분류와 정확도 향상을 위해 i-YOLOX를 제안하고, 네트워크 매개변수, 검출속도, 정확도 등을 평가한다. 이를 위해 17개의 폐기물 범주를 포함하는 10,000개의 가정용 쓰레기 대상 샘플로 데이터 세트를 구성하고, YOLOX 구조에 Involution 채널 컨볼루션 연산자와 CBAM(Convolution Branch Attention Module)을 도입하여 i-YOLOX를 구성하고, 기존의 YOLO 구조와 성능을 비교한다. 실험 결과 복잡한 장면에서 쓰레기 객체 검출 속도와 정확도가 기존의 신경망에 비해 향상되어, 제안한 i-YOLOX 구조가 생활 폐기물 다중 객체 검출과 분류에 효과적임을 확인하였다.

Keywords

References

  1. Chen Z, Yang J, Chen L, et al. Garbage classification system based on improved ShuffleNet v2 [J]. Resources, Conservation and Recycling, 178: pp, 106090, 2022.
  2. Bochkovskiy A, Wang C-Y, Liao H-Y. YOLOv4: Optimal Speed and Accuracy of Object Detection[C]. proceedings of the Computer Vision and Pattern Recognition (CVPR). 2020.
  3. Ge Z, Liu S, W ang F, et al. YOLOX: Exceeding YOLO Series in 2021 [J]. arXiv preprint arXiv:210708430, arXiv: 2107.08430,2021.
  4. Li D, Hu J, Wang C, et al. Involution: Inverting the inherence of convolution for visual recognition[C]. proceedings of the Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pp, 12321-12330, 2021.
  5. Lin T Y, Dollar P, Girshick R, et al. Feature Pyramid Networks for Object Detection[C]. proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). pp, 936-944, 2017.
  6. Fu C-Y, Liu W, Ranga A, et al. Dssd: Deconvolutional single shot detector [J]. arXiv preprint arXiv:170106659, 2017.
  7. Mamalis T, Stipanovic D, Voulgaris P. Stochastic Learning Rate Optimization in the Stochastic Approximation and Online Learning Settings [J]. arXive-prints, arXiv:2110.10710, 2021.
  8. Loshchilov I, Hutter F. SGDR: Stochastic Gradient Descent with Warm Restarts [J]. arXiv preprint arXiv:160803983, 2016.
  9. Zhang H, Cisse M, Dauphin Y N, et al., "mixup: Beyond Empirical Risk Minimization." proceedings of the International Conference on Learning Representations, 2018.
  10. Bochkovskiy A, Wang C-Y, Liao H-Y. "YOLOv4: Optimal Speed and Accuracy of Object Detection." proceedings of the Computer Vision and Pattern Recognition (CVPR), 2020.