• 제목/요약/키워드: YOLOv8 모델

검색결과 39건 처리시간 0.04초

라즈베리파이와 YOLOv5를 이용한 해양쓰레기 시계열 변화량 분석 (Analysis Temporal Variations Marine Debris by using Raspberry Pi and YOLOv5)

  • 김보람;박미소;김재원;도예빈;오세윤;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1249-1258
    • /
    • 2022
  • 해양쓰레기란 고의 또는 부주의로 해안에 방치되거나 해양으로 유입·배출되어 해양환경에 해로운 결과를 미치거나 미칠 우려가 있는 물질로 정의된다. 본 연구에서는 효율적인 해양쓰레기 수량 파악 방법 및 변화량 분석을 위하여 객체 탐지 기법을 이용한 해양쓰레기 탐지 및 해양쓰레기의 변화량 분석을 수행하였다. 연구지역은 거제도 북동부 유호 몽돌 해수욕장이며 2022년 9월 12일부터 10월 14일까지 32일 동안 15분 간격으로 수집한 이미지를 통해 변화량을 분석하였다. One-Stage 방식의 객체 탐지 모델인 YOLOv5x를 이용한 해양쓰레기 탐지는 페트병 mAP 0.869, 스티로폼 부표 mAP 0.862의 성능을 도출하였다. 결과적으로 해양쓰레기는 8일 간격으로 큰 감소 폭을 보였으며, 성상별로는 스티로폼 부표의 수량이 3배 정도 많고 변화폭 역시 더 크게 나타남을 파악하였다.

YOLO 기반 저시력자를 위한 체외진단의료기기 판독 시스템 (YOLO-Based System for Detecting the Results of In-Vitro Diagnostics (IVD) for low-vision people)

  • 신지민;백유진;우다현;윤영인;임빈;김민희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1035-1036
    • /
    • 2023
  • 본 논문은 저시력자를 위한 체외진단 의료기기 결과 판독 시스템을 제안한다. 이 시스템은 YOLOv8n 객체 탐지 모델을 기반으로 하며, 라즈베리파이4B+에서 홈 디바이스 형태로 구현하였다. 사용자는 음성 및 물리 버튼을 통해 명령을 입력하고, 동작 감지를 통해 자동으로 체외진단 의료기기를 촬영하여 학습된 모델로 결과를 판독하고 해당 결과를 사용자에게 출력한다. 또한, 판독 결과물과 함께 검사 일시 및 의료기기 종류를 데이터베이스에 저장하여 사용자에게 보다 높은 편의성을 제공한다.

Adaptive Face Mask Detection System based on Scene Complexity Analysis

  • Kang, Jaeyong;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.1-8
    • /
    • 2021
  • 코로나바이러스-19(COVID-19)의 대유행에 따라 전 세계 수많은 확진자가 발생하고 있으며 국민을 불안에 떨게 하고 있다. 바이러스 감염 확산을 방지하기 위해서는 마스크를 제대로 착용하는 것이 필수적이지만 몇몇 사람들은 마스크를 쓰지 않거나 제대로 착용하지 않고 있다. 본 논문에서는 영상 이미지에서의 효율적인 마스크 감지 시스템을 제안한다. 제안 방법은 우선 입력 이미지의 모든 얼굴의 영역을 YOLOv5를 사용하여 감지하고 감지된 얼굴의 수에 따라 3가지의 장면 복잡도(Simple, Moderate, Complex) 중 하나로 분류한다. 그 후 장면 복잡도에 따라 3가지 ResNet(ResNet-18, 50, 101) 중 하나를 기반으로 한 Faster-RCNN을 사용하여 얼굴 부위를 감지하고 마스크를 제대로 착용하였는지 식별한다. 공개 마스크 감지 데이터셋을 활용하여 실험한 결과 제안한 장면 복잡도 기반 적응적인 모델이 다른 모델에 비해 가장 성능이 뛰어남을 확인하였다.

딥러닝 기술을 이용한 영상에서 흡연행위 검출 (Detection of Smoking Behavior in Images Using Deep Learning Technology)

  • 김동준;최유진;박경민;박지현;이재문;황기태;정인환
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.107-113
    • /
    • 2023
  • 본 논문은 인공지능 기술을 활용하여 영상에서 흡연 행위를 검출하는 방법을 제안한다. 흡연은 정적 현상이 아니라 행위에 해당하기 때문에 객체 탐지 기술에 행위를 탐지할 수 있는 자세 추정 기술을 접목하였다. 이미지에서 흡연자를 검출하기 위하여 흡연자 검출 학습 모델을 개발하였으며, 영상에서 흡연행위를 검출하기 위하여 흡연행위의 특성을 자세 추정 기술에 적용하였다. 객체 탐지를 위하여 YOLOv8을 사용하였으며, 자세 추정을 위하여 OpenPose를 이용하였다. 또한, 영상에 흡연자 및 비흡연자가 포함되어 있는 경우 사람들만 분리하는 방법도 적용하였다. 제안된 방법은 파이선으로 Google Colab NVIDEA Tesla T4 GPU를 사용구현 하였고, 테스트 결과 주어진 영상에서 흡연 행위를 완벽하게 검출함을 알 수 있었다.

인공 지능을 이용한 흉부 엑스레이 이미지에서의 이물질 검출 (Detecting Foreign Objects in Chest X-Ray Images using Artificial Intelligence)

  • 한창화
    • 한국방사선학회논문지
    • /
    • 제17권6호
    • /
    • pp.873-879
    • /
    • 2023
  • 본 연구는 인공지능(AI)을 사용하여 흉부 엑스레이 이미지에서 이물질을 탐지하는 방법을 탐구하였다. 의료영상학, 특히 흉부 엑스레이는 폐렴이나 폐암과 같은 질병을 진단하는 데 매우 중요한 역할을 한다. 영상의학 검사가 증가함에 따라 AI는 효율적이고 빠른 진단을 위한 중요한 도구가 되었다. 하지만 이미지에는 단추나 브래지어 와이어와 같은 일상적인 장신구를 포함한 이물질이 포함될 수 있어 정확한 판독을 방해할 수 있다. 본 연구에서는 이러한 이물질을 정확하게 식별하는 AI 알고리즘을 개발하였고, 미국 국립보건원 흉부 엑스레이 데이터셋을 가공하여 YOLOv8 모델을 기반으로 처리하였다. 그 결과 정확도, 정밀도, 리콜, F1-score가 모두 0.91에 가까울 정도로 높은 탐지 성능을 보였다. 이번 연구는 AI의 뛰어난 성능에도 불구하고 이미지 내 이물질로 인해 판독 결과가 왜곡될 수 있는 문제점을 해결함으로써 영상의학 분야에서 AI의 혁신적인 역할과 함께, 임상 구현에 필수적인 정확성에 기반하여 신뢰성을 강조하였다.

테스트베드 환경에서 교통 표지판 검출의 성능 분석: 예비 연구 (Performance Analysis of Traffic Sign Detection in the Testbed Environment : A Preliminary Study)

  • 시종욱;김성영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.7-8
    • /
    • 2023
  • 자율주행 자동차에 관한 연구에서 상황을 인지하기 위한 교통 표지판을 다양한 환경에서 인식하도록 하는 과정은 필수적인 요소이다. 이러한 교통 표지판은 객체 검출 방법을 통해 인지할 수 있지만, 환경에 따라 성능 차이가 크다. 본 논문에서는 Yolov4 모델을 기반으로 공개된 데이터 세트를 이용해 학습하고, 테스트 배드 환경에서 교통 표지판을 검출한다. 테스트 배드에서 조건, 거리, 강수량에 따른 다양한 환경에 대한 교통 표지판 검출의 성능을 비교 및 분석한 결과를 보인다.

  • PDF

자율주행 트랙터 환경에서 쓰러진 사람에 대한 데이터 증강 (Dataset Augmentation on Fallen Person Objects in a Autonomous Driving Tractor Environment)

  • 백화평;안한세;채희성;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.553-556
    • /
    • 2023
  • 데이터 증강은 데이터 불균형 문제를 해결하기 위해 일반화 성능을 향상시킨다. 이는 과적합 문제를 해결하고 정확도를 높이는 데 도움을 준다. 과적합을 해결하기 위해서 본 논문에서는 분할 마스크 라벨링을 자동화하여 효율성을 높이고, RoI를 활용한 분할 Copy-Paste 데이터 증강 기법을 제안한다. 본 논문의 제안 방법을 적용한 결과 YOLOv8 모델에서 기존의 분할, 박스 Copy-Paste 데이터 증강 기법과 비교해서 쓰러진 사람 객체에 대한 정확도가 10.2% 증가함으로써 제안한 방법이 일반화 성능을 높이는 데 효과가 있음을 확인하였다.

임베딩 기반의 비정형 문서 핵심 영역 식별 (A method based on embedding to detect core regions in unstructured document)

  • 박민지;황영준;박병훈;신수연;이치훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.607-610
    • /
    • 2024
  • 기업의 운영에 있어서 기업의 핵심 정보가 유출되지 않도록 관리하는 것은 매우 중요하다. 따라서, 사내에서 유통되는 문서들에 대해 핵심적인 정보가 사외로 유출되지 않도록 관리하고 추적하는 것은 필수적이다. 특히, 데이터가 구조화되지 않고, 다양한 형식으로 구성되어있는 비정형 문서 내에서 핵심 정보를 식별하는 것은 기술적으로 어려움이 존재한다. 본 논문에서는 YOLOv8을 사용하여 비정형 문서 내에서 영역을 식별하고, 자연어 처리 모델인 Word2Vec을 사용하여 비정형 문서 내에서 핵심 내용을 식별한 후 이를 시각화함으로써 사내에서 유통되는 비정형 문서 내의 핵심 정보를 식별하고 추적하는 방법을 제안하였다.

Fashion Category Oversampling Automation System

  • Minsun Yeu;Do Hyeok Yoo;SuJin Bak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.31-40
    • /
    • 2024
  • 국내 온라인 패션 플랫폼은 개인사업자가 제품정보를 직접 등록하기 때문에 개인사업자의 불편함을 초래한다. 많은 제품군을 한꺼번에 수동 등록하므로 수기 입력된 제품정보로 인한 신뢰성 문제가 발생한다. 등록된 상품 이미지의 저품질 및 데이터 수의 불균형으로 인한 편향도 심각하게 제기된다. 본 연구는 오버샘플링 기법을 통해 데이터 편향을 최소화하고 13개 패션 카테고리의 다중 분류를 수행하는 ResNet50 모델을 제안한다. 컴퓨팅 자원과 오랜 학습시간을 최소화하기 위해 전이학습을 활용했다. 결과적으로, 데이터 수가 매우 부족했던 클래스의 데이터 증강을 통해 기본 CNN 모델에 비해 최대 33.4%의 향상된 식별력을 보여주었다. 모든 결과의 신뢰성은 정밀도-재현율 곡선으로 보장한다. 본 연구는 국내 온라인 패션 플랫폼 산업의 발전을 한 단계 끌어올릴 수 있을 것으로 기대한다.