Comparison of Fire Detection Performance according to the Number of Bounding Boxes for YOLOv5

YOLOv5 학습 시 바운딩 박스 개수에 따른 화재 탐지 성능 비교

  • Published : 2022.10.03

Abstract

In order to detect an object in yolv5, a process of annotating location information on an existing image is required when learning an image. The most representative method is to draw a bounding box on an image to store location information as meta information. However, if the boundary of the object is ambiguous, it will be difficult to make a bounding box. A representative example would be to classify parts that are not fire and parts that are fire. Therefore, in this paper, images of 100 samples judged to have caught fire were learned by varying the number of boxes. The results showed better fire detection performance in the model where the bounding box was trained by annotating it with three boxes by segmenting it slightly more than annotating it with one box by holding the edge as large as possible during annotating it with one box.

YOLOv5에서 객체 탐지를 위해 이미지를 학습 시 기존의 이미지에 위치 정보를 어노테이션 하는 과정이 필요한다. 가장 대표적인 방법이 이미지에 바운딩 박스를 그려 위치 정보를 메타정보로 저장하게 하는 것이다. 하지만 객체의 경계가 모호한 경우 바운딩 박스를 하는 것에 어려움을 겪게 된다. 그 대표적인 예시가 화재인 부분과 화재가 아닌 부분을 분류하는 것이다. 따라서 본 논문에서는 화재가 났다고 판단되는 샘플 100개의 이미지를 바운딩 박싱 개수를 달리하여 학습시켜 보았다. 그 결과 바운딩 박스를 어노테이션 시 가장자리를 가능한 크게 잡아 하나의 박스로 어노테이션하는 것보다 조금 더 세분화 하여 박스 3개로 어노테이션하여 학습시킨 모델에서 더 뛰어난 화재 탐지 성능을 보여주었다.

Keywords

Acknowledgement

"본 연구는 과학기술정보통신부 및 정보통신기획평가원의 지역지능화혁신인재양성(Grand ICT연구센터) 사업의 연구결과로 수행되었음" (IITP- 2022-2020-0-01791). 또한, 본 논문은 부산광역시 및 (재)부산인재평생교육진흥원의 BB21플러스 사업으로 지원된 연구임.