• Title/Summary/Keyword: YOLOv2

Search Result 84, Processing Time 0.042 seconds

Object Detection Accuracy Improvements of Mobility Equipments through Substitution Augmentation of Similar Objects (유사물체 치환증강을 통한 기동장비 물체 인식 성능 향상)

  • Heo, Jiseong;Park, Jihun
    • Journal of the Korea Institute of Military Science and Technology
    • /
    • v.25 no.3
    • /
    • pp.300-310
    • /
    • 2022
  • A vast amount of labeled data is required for deep neural network training. A typical strategy to improve the performance of a neural network given a training data set is to use data augmentation technique. The goal of this work is to offer a novel image augmentation method for improving object detection accuracy. An object in an image is removed, and a similar object from the training data set is placed in its area. An in-painting algorithm fills the space that is eliminated but not filled by a similar object. Our technique shows at most 2.32 percent improvements on mAP in our testing on a military vehicle dataset using the YOLOv4 object detector.

A Study on Image Preprocessing Methods for Automatic Detection of Ship Corrosion Based on Deep Learning (딥러닝 기반 선박 부식 자동 검출을 위한 이미지 전처리 방안 연구)

  • Yun, Gwang-ho;Oh, Sang-jin;Shin, Sung-chul
    • Journal of the Korean Society of Industry Convergence
    • /
    • v.25 no.4_2
    • /
    • pp.573-586
    • /
    • 2022
  • Corrosion can cause dangerous and expensive damage and failures of ship hulls and equipment. Therefore, it is necessary to maintain the vessel by periodic corrosion inspections. During visual inspection, many corrosion locations are inaccessible for many reasons, especially safety's point of view. Including subjective decisions of inspectors is one of the issues of visual inspection. Automation of visual inspection is tried by many pieces of research. In this study, we propose image preprocessing methods by image patch segmentation and thresholding. YOLOv5 was used as an object detection model after the image preprocessing. Finally, it was evaluated that corrosion detection performance using the proposed method was improved in terms of mean average precision.

Automated Analysis of Scaffold Joint Installation Status of UAV-Acquired Images

  • Paik, Sunwoong;Kim, Yohan;Kim, Juhyeon;Kim, Hyoungkwan
    • International conference on construction engineering and project management
    • /
    • 2022.06a
    • /
    • pp.871-876
    • /
    • 2022
  • In the construction industry, fatal accidents related to scaffolds frequently occur. To prevent such accidents, scaffolds should be carefully monitored for their safety status. However, manual observation of scaffolds is time-consuming and labor-intensive. This paper proposes a method that automatically analyzes the installation status of scaffold joints based on images acquired from a Unmanned Aerial Vehicle (UAV). Using a deep learning-based object detection algorithm (YOLOv5), scaffold joints and joint components are detected. Based on the detection result, a two-stage rule-based classifier is used to analyze the joint installation status. Experimental results show that joints can be classified as safe or unsafe with 98.2 % and 85.7 % F1-scores, respectively. These results indicate that the proposed method can effectively analyze the joint installation status in UAV-acquired scaffold images.

  • PDF

Mask and non-mask user face recognition study through image sharpness evaluation (이미지 선명도 평가를 통한 마스크 및 비마스크 사용자 얼굴인식 연구)

  • Choi, Rock-Hyun;Moon, Jun-Bum;Lee, Jong-Cheol;Lee, Hyun-Kee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.242-243
    • /
    • 2022
  • 코로나 팬데믹으로 세계가 큰 피해를 보고 있다. 기존 얼굴인식 보안시스템이 마스크 사용자 인식이 어려워 마스크 사용자를 인식할 수 있는 방안이 필요하다. 얼굴인식을 위한 영상처리 기술이 딥러닝에 의해 크게 발전하고 있으며, 여전히 전처리 기술 또한 중요하다. 본 논문에서는 영상처리 기술의 선명도 평가 함수와 YOLOv5를 사용해 학습 재학습 이후 변화하는 성능을 확인하였고, 비마스크 사용 시 분류정확도가 1%, 학습 손실률에서 0.2% 정도의 성능 개선을 확인하였다.

  • PDF

A Study on Filter Pruning for Real-Time Object Detection in Embedded Board Environments (임베디드 보드 환경에서 실시간 객체 탐지를 위한 필터 프루닝 연구)

  • Jongwoong Seo;Hanse Ahn;Seungwook Son;Yongwha Chung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.536-539
    • /
    • 2023
  • 딥러닝 기술은 더 많은 분야와 과제에 적용되기 위해서 네트워크는 더 복잡하고 거대한 형태로 발전해왔다. YOLOv7-tiny과 같은 객체탐지 네트워크는 다양한 객체와 환경에서 활용하기 위해 COCO 데이터 세트를 대상으로 발전해왔다. 그러나 본 논문에서 적용할 모델은 임베디드 보드 환경에서 실시간으로 1개의 Class를 대상으로 객체를 탐지하는 네트워크 모델이 찾고자 프루닝을 적용하였다. 모델의 프루닝을 할 필터를 찾기 위해 본 논문에서는 클러스터링을 통한 필터 프루닝 방법을 제안한다. 본 논문의 제안 방법을 적용했을 때 기준 모델보다 정확도가 7.6% 감소하였으나, 파라미터가 1% 미만으로 남고, 속도는 2.1배 증가함을 확인하였다.

Semantic SLAM & Navigation Based on Sensor Fusion (센서융합 기반 의미론적 SLAM 및 내비게이션)

  • Gihyeon Lee;Seung-hyun Ahn;Suhyeon Sin;Hyesun Ryu;Yuna Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.848-849
    • /
    • 2023
  • 본 논문은 로봇의 실내 환경에서의 자율성을 높이기 위한 SLAM과 내비게이션 방법을 제시한다. 2D LiDAR와 카메라를 이용하여 위치를 인식하고 사람과 장애물을 의미론적으로 검출하며, ICP와 RTAB-map, YOLOv3를 통합하여 Semantic Map을 생성하고 실내 환경에서 자율성을 유지한다. 이 연구를 통해 로봇이 복잡한 환경에서도 높은 수준의 자율성을 유지할 수 있는지 확인하고자 한다.

Dataset Augmentation on Fallen Person Objects in a Autonomous Driving Tractor Environment (자율주행 트랙터 환경에서 쓰러진 사람에 대한 데이터 증강)

  • Hwapyeong Baek;Hanse Ahn;Heesung Chae;Yongwha Chung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.553-556
    • /
    • 2023
  • 데이터 증강은 데이터 불균형 문제를 해결하기 위해 일반화 성능을 향상시킨다. 이는 과적합 문제를 해결하고 정확도를 높이는 데 도움을 준다. 과적합을 해결하기 위해서 본 논문에서는 분할 마스크 라벨링을 자동화하여 효율성을 높이고, RoI를 활용한 분할 Copy-Paste 데이터 증강 기법을 제안한다. 본 논문의 제안 방법을 적용한 결과 YOLOv8 모델에서 기존의 분할, 박스 Copy-Paste 데이터 증강 기법과 비교해서 쓰러진 사람 객체에 대한 정확도가 10.2% 증가함으로써 제안한 방법이 일반화 성능을 높이는 데 효과가 있음을 확인하였다.

Real-time 3D Object Perception Algorithm Implementation for Autonomous Driving Robots at Construction Sites (건설 현장을 위한 자율주행 로봇의 실시간 3D 객체 인지 알고리즘 구현)

  • Ji-Ye Choi;In-Gu Choi;Hyeong-Keun Hong;Jae-Wook Jeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.11-12
    • /
    • 2024
  • 건설 현장에서 자율주행 로봇의 안전한 주행을 위해 동적 장애물의 정확한 인식 및 추적이 중요하다. 본 논문에서는 실시간 3D 객체 인식 및 추적을 위한 방법을 제안한다. Complex-YOLOv4 모델을 이용한 객체 인식, SORT 알고리즘 확장을 통한 객체 추적을 구현하였다. Jetson AGX Orin 보드의 ROS2 환경에서 시스템을 구축하여, 실시간 3D 객체 인식 및 추적이 가능함을 확인하였다.

A method based on embedding to detect core regions in unstructured document (임베딩 기반의 비정형 문서 핵심 영역 식별)

  • Min Ji Park;Yeong Jun Hwang;Byung Hoon Park;Sooyeon Shin;Chi hoon Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.607-610
    • /
    • 2024
  • 기업의 운영에 있어서 기업의 핵심 정보가 유출되지 않도록 관리하는 것은 매우 중요하다. 따라서, 사내에서 유통되는 문서들에 대해 핵심적인 정보가 사외로 유출되지 않도록 관리하고 추적하는 것은 필수적이다. 특히, 데이터가 구조화되지 않고, 다양한 형식으로 구성되어있는 비정형 문서 내에서 핵심 정보를 식별하는 것은 기술적으로 어려움이 존재한다. 본 논문에서는 YOLOv8을 사용하여 비정형 문서 내에서 영역을 식별하고, 자연어 처리 모델인 Word2Vec을 사용하여 비정형 문서 내에서 핵심 내용을 식별한 후 이를 시각화함으로써 사내에서 유통되는 비정형 문서 내의 핵심 정보를 식별하고 추적하는 방법을 제안하였다.

Estimation of fruit number of apple tree based on YOLOv5 and regression model (YOLOv5 및 다항 회귀 모델을 활용한 사과나무의 착과량 예측 방법)

  • Hee-Jin Gwak;Yunju Jeong;Ik-Jo Chun;Cheol-Hee Lee
    • Journal of IKEEE
    • /
    • v.28 no.2
    • /
    • pp.150-157
    • /
    • 2024
  • In this paper, we propose a novel algorithm for predicting the number of apples on an apple tree using a deep learning-based object detection model and a polynomial regression model. Measuring the number of apples on an apple tree can be used to predict apple yield and to assess losses for determining agricultural disaster insurance payouts. To measure apple fruit load, we photographed the front and back sides of apple trees. We manually labeled the apples in the captured images to construct a dataset, which was then used to train a one-stage object detection CNN model. However, when apples on an apple tree are obscured by leaves, branches, or other parts of the tree, they may not be captured in images. Consequently, it becomes difficult for image recognition-based deep learning models to detect or infer the presence of these apples. To address this issue, we propose a two-stage inference process. In the first stage, we utilize an image-based deep learning model to count the number of apples in photos taken from both sides of the apple tree. In the second stage, we conduct a polynomial regression analysis, using the total apple count from the deep learning model as the independent variable, and the actual number of apples manually counted during an on-site visit to the orchard as the dependent variable. The performance evaluation of the two-stage inference system proposed in this paper showed an average accuracy of 90.98% in counting the number of apples on each apple tree. Therefore, the proposed method can significantly reduce the time and cost associated with manually counting apples. Furthermore, this approach has the potential to be widely adopted as a new foundational technology for fruit load estimation in related fields using deep learning.