• 제목/요약/키워드: Yolo

검색결과 387건 처리시간 0.023초

딥 러닝 및 칼만 필터를 이용한 객체 추적 방법 (Object Tracking Method using Deep Learning and Kalman Filter)

  • 김기철;손소희;김민섭;전진우;이인재;차지훈;최해철
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.495-505
    • /
    • 2019
  • 딥 러닝의 대표 알고리즘에는 영상 인식에 주로 사용되는 CNN(Convolutional Neural Networks), 음성인식 및 자연어 처리에 주로 사용되는 RNN(Recurrent Neural Networks) 등이 있다. 이 중 CNN은 데이터로부터 자동으로 특징을 학습하는 알고리즘으로 특징 맵을 생성하는 필터까지 학습할 수 있어 영상 인식 분야에서 우수한 성능을 보이면서 주류를 이루게 되었다. 이후, 객체 탐지 분야에서는 CNN의 성능을 향상하고자 R-CNN 등 다양한 알고리즘이 등장하였으며, 최근에는 검출 속도 향상을 위해 YOLO(You Only Look Once), SSD(Single Shot Multi-box Detector) 등의 알고리즘이 제안되고 있다. 하지만 이러한 딥러닝 기반 탐지 네트워크는 정지 영상에서 탐지의 성공 여부를 결정하기 때문에 동영상에서의 안정적인 객체 추적 및 탐지를 위해서는 별도의 추적 기능이 필요하다. 따라서 본 논문에서는 동영상에서의 객체 추적 및 탐지 성능 향상을 위해 딥 러닝 기반 탐지 네트워크에 칼만 필터를 결합한 방법을 제안한다. 탐지 네트워크는 실시간 처리가 가능한 YOLO v2를 이용하였으며, 실험 결과 제안한 방법은 기존 YOLO v2 네트워크에 비교하여 7.7%의 IoU 성능 향상 결과를 보였고 FHD 영상에서 20 fps의 처리 속도를 보였다.

YOLO v4 기반 혼잡도로에서의 움직이는 물체 검출 및 식별 (Detection and Identification of Moving Objects at Busy Traffic Road based on YOLO v4)

  • 이추담;정석용;왕욱비;진락;손진구;송정영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.141-148
    • /
    • 2021
  • 일부 네거리나 혼잡도로에서 특정 시간대에 행인이 많고 도로가 막혀서 발생하는 교통사고가 적지 않다. 특히 인근에 학교교차로가 있어 바쁜 시간에 학생들의 교통안전을 지키는 것이 중요하다. 과거에는 교통 신호등을 설 계 했을 때 행인의 안전성을 고려하지 않고 자동차 인식과 교통 최적화에 대하여 연구 했다. 행인, 특히 학생들의 안전을 확보하는 전제에서 가능한 한 도로의 소통을 유지하는 것이 본 연구의 중점적인 연구 방향이다. 본 연구는 사람, 오토바이, 자전거, 자동차, 버스의 식별문제를 중점적으로 연구할 것이다. 조사와 비교를 통해 본 연구는 YOLO v4 네트워크로 목표물의 위치와 수량을 식별하는 것을 제시한다. YOLO v4는 작은 목표물의 식별 능력이 강하고 정밀도가 높으며 처리속도가 빠르다는 특징을 가지고 있으며, 데이터 수집 대상을 설정하여 이미지 집합을 훈련하고 테스트 한다. 움직이는 영상에서 목표물의 정확도, 실수율과 누락율에 대한 통계를 사용하여, 본 연구에서 훈련된 네트워크는 움직이는 이미지 속의 사람, 오토바이, 자전거, 자동차와 버스를 정확하게 식별 할 수 있다.

Yolo V4 딥러닝 지능기술을 이용한 과일 불량 부위 검출 (Fruit's Defective Area Detection Using Yolo V4 Deep Learning Intelligent Technology)

  • 최한석
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.46-55
    • /
    • 2022
  • 과일 품질 자동 선별 시스템에서 흠집이나 부패한 부위가 존재하는 불량 과일을 우선적으로 검출하여 제거하는 작업은 매우 중요하다. 본 연구에서는 기존의 영상처리 기법을 이용하여 불량 부위가 있는 과일 검출하는 방법의 한계점을 극복하기 위하여, 최신 인공지능 기술인 Yolo V4 딥러닝 지능기술을 이용하여 과일 불량 부위를 검출하는 방법을 제안한다. 본 연구에서는 흠집 또는 부패 부위가 존재하는 1,100개의 불량 사과 및 1,300개의 불량 배를 포함한 총 2,400개의 불량 과일에 대하여 Yolo V4 딥러닝 모델을 사용하여 학습하고 불량 부위 검출 실험을 하였다. 성능 실험 결과에 따르면 사과의 정확률은 0.80, 재현율은 0.76, IoU는 69.92%, mAP는 65.27%이고, 배의 정확률은 0.86, 재현율은 0.81, IoU는 70.54%, mAP는 68.75%의 성능을 나타내었다. 본 연구에서 제안한 방법은 기존 영상처리 기법을 이용한 방법보다 불량 부위가 있는 과일을 실시간으로 정확하게 선별하여 기존 과일 자동 품질 선별시스템의 성능을 획기적으로 개선할 수 있다.

YOLO 기반의 교통 신호등 인식을 통한 오토바이 운전자의 신호 위반 여부 확인 (YOLO-based Traffic Signal Detection for Identifying the Violation of Motorbike Riders)

  • 아리아 비스마 와휴타마;황민태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.141-143
    • /
    • 2022
  • 본 논문에서는 YOLO(You Only Look Once) 기반의 교통 신호등 인식을 통해 오토바이 운전자의 신호 위반 여부를 확인하는 기술을 제안하고자 한다. 오토바이 전면에 탑재될 하드웨어 모듈은 YOLO 기반의 객체 탐지를 위한 카메라 모듈과 라즈베리 파이, 신호 위반 시 오토바이의 현재 위치 정보 수집을 위한 GPS 모듈, 그리고 수집 정보를 클라우드 DB로 전송하는 LoRa 통신 모듈로 구성된다. 소프트웨어 기능의 핵심은 오토바이의 교통 신호 위반 여부를 판단하는 컴포넌트이다. 본 논문에서는 카메라 앵글 내에 있는 교통 신호등 객체를 먼저 인식한 후 빨간색 신호일 때에만 이 객체가 화면 상에서 오른쪽(좌회전의 경우)이나 위쪽(직진의 경우)으로 사라지면 신호 위반으로 판단하는 기능을 제안한다. 그리고, 오토바이 운전자가 신호를 위반한 것으로 판단되면 운전자의 신상 정보(이름, 휴대폰 번호 등), 오토바이 정보(번호판, 등록번호 등), 위반 상황의 스냅샷 사진, 위치 정보 및 날짜/시각 정보를 클라우드 DB로 전달하도록 한다. 이러한 위반 정보는 운전자의 스마트폰에 푸시 알림으로 전달하여 위반 사실을 인지하도록 하고, 관할 경찰서에서는 신호 위반 스티커를 발부하는 데 활용될 수 있으므로 궁극적으로는 오토바이 운전자의 교통 신호 위반을 사전에 방지할 수 있을 것으로 기대된다.

  • PDF

이미지 객체 및 메타정보 기반 GPT 활용 SNS 문장 작성 보조 시스템 (GPT-enabled SNS Sentence writing support system Based on Image Object and Meta Information)

  • 이동희;문미경;최봉준
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.160-165
    • /
    • 2023
  • 본 연구에서는 SNS와 같이 이미지와 함께 글을 작성하는 활동을 보조하기 위해 YOLO와 GPT를 활용한 SNS 문장 작성 보조 시스템을 제안한다. YOLO 모델을 활용하여 글 작성 시 삽입되는 이미지에서 객체를 추출하고 메타정보인 GPS 정보, 생성 시간 정보도 추출하여 함께 GPT의 프롬프트 값으로 사용한다. YOLO 모델을 사용하기 위해 양식 이미지 데이터로 학습하여 사용했으며 해당 모델의 mAP score는 평균 약 0.25이다. GPT는 '맛집 리뷰' 주제의 1,000개의 블로그 텍스트 데이터를 학습하였으며, 본 연구에서 학습된 모델을 사용하여 이미지에서 추출한 2가지 타입의 키워드로 문장을 생성하였다. 생성된 문장의 실용성을 평가하기 위해 설문을 진행하였으며 설문 결과의 명확한 분석을 위해 폐쇄형 설문을 진행하였다. 삽입한 이미지와 키워드 문장을 제공하여 질문에 대해 3가지 평가 항목을 두어 진행하였다. 설문 결과 이미지의 핵심 키워드 경우 유의미한 문장을 생성한다는 결과를 얻을 수 있었다. 본 연구를 통해서 이미지 기반 문장 생성 시 이미지 키워드와 GPT 학습 내용과의 관계에 따라 결과물의 정확성이 달라진다는 결과를 얻을 수 있었다.

YOLO기법을 사용한 차량가속도 및 차두거리 산출방법 (Vehicle Acceleration and Vehicle Spacing Calculation Method Used YOLO)

  • 길정원;황재성;권재경;이철기
    • 한국ITS학회 논문지
    • /
    • 제23권1호
    • /
    • pp.82-96
    • /
    • 2024
  • 교통류에서는 거시적인 지표로 속도, 교통량, 밀도가 중요한 파라미터로 활용되고 있으며, 미시적인 지표로는 가속도와 차두거리가 중요한 파라미터로 활용되고 있다. 속도와 교통량은 현재 설치된 교통정보 수집장치로 수집이 가능하지만 가속도와 차두거리는 안전과 자율주행분야 등에 필요성이 있지만 현재 교통정보 수집장치로는 수집이 불가능한 실정이다. 객체인식 기법인 YOLO는 정확도와 실시간성이 우수하여 교통분야를 포함하여 다양한 분야에서 활용되고 있다. 본 연구에서는 YOLO를 활용하여 가속도와 차두거리를 측정하기 위해 측정 간격을 조밀하게 설정하여 간격별 차량의 속도 변화와 차량 간 통행시간 차이를 통해 가속도와 차두거리를 측정하는 모델을 개발하였다. 지점별 교통특성에 따라 가속도와 차두거리의 범위가 다름을 확인하였고, 측정률 확보를 위한 기준거리와 화면각도에 따른 비교분석을 수행하다. 측정간격은 20m, 각도는 직각에 가까울수록 측정률이 높아짐을 분석하였다. 이를 통해 교차로별 안전도 분석과 국내 차량행태모델 분석에 기여할 수 있을 것이다.

Real-time Human Detection under Omni-dir ectional Camera based on CNN with Unified Detection and AGMM for Visual Surveillance

  • Nguyen, Thanh Binh;Nguyen, Van Tuan;Chung, Sun-Tae;Cho, Seongwon
    • 한국멀티미디어학회논문지
    • /
    • 제19권8호
    • /
    • pp.1345-1360
    • /
    • 2016
  • In this paper, we propose a new real-time human detection under omni-directional cameras for visual surveillance purpose, based on CNN with unified detection and AGMM. Compared to CNN-based state-of-the-art object detection methods. YOLO model-based object detection method boasts of very fast object detection, but with less accuracy. The proposed method adapts the unified detecting CNN of YOLO model so as to be intensified by the additional foreground contextual information obtained from pre-stage AGMM. Increased computational time incurred by additional AGMM processing is compensated by speed-up gain obtained from utilizing 2-D input data consisting of grey-level image data and foreground context information instead of 3-D color input data. Through various experiments, it is shown that the proposed method performs better with respect to accuracy and more robust to environment changes than YOLO model-based human detection method, but with the similar processing speeds to that of YOLO model-based one. Thus, it can be successfully employed for embedded surveillance application.

경기 불황과 욜로(YOLO): 지각된 부정적 경제 상황이 소비자의 현재에 편향된 선호에 미치는 영향 (Recession and YOLO: The Influence of Negative Perception of Economic Situation on Present-Biased Preference)

  • 정보희;정혜욱
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.135-144
    • /
    • 2021
  • 본 연구에서는 밀레니얼 세대를 중심으로 한 욜로 추구 현상의 기저 매커니즘을 파악하여 지각된 경제 불황의 현재 편향적 소비 행동에 미치는 영향을 알아보고자 하였다. 또한 지각된 경제 불황이 소비자의 현재 편향적 선택 행동에 미치는 영향을 매개하는 요인으로 개인의 고정주의 성향을 제안하고 이를 실증적으로 검증함으로써 암묵적 이론 관련 연구 결과를 확장하고자 하였다. 학부생을 대상으로 한 세 번의 실험 연구에서 부정적 경제 상황이 점화되거나, 부정적 경제 상황을 더 높이 지각한 소비자들은 현재 편향된 소구에 대한 더 높은 선호를 보고하였고, 현재에 편향된 대안을 선호하는 경향을 보여주었다. 이러한 연구 결과는 저성장과 코로나 19 사태로 경기 침체를 경험하는 현 상황에서 마케터에게 보다 효과적이고 유용한 실질적 지침을 제공한다.

YOLO 기반의 광학 음악 인식 기술 및 가상현실 콘텐츠 제작 방법 (YOLO based Optical Music Recognition and Virtual Reality Content Creation Method)

  • 오경민;홍요섭;백건영;전찬준
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.80-90
    • /
    • 2021
  • 딥러닝에 기반한 광학 음악 인식 기술(Optical Music Recognition, OMR)을 사용하여 도출된 결과를 가상현실 (Virtual Reality, VR) 게임에 적용시킨 것을 제안한다. 딥러닝 모델은 YOLO v5를 사용했으며 검출되지 않은 객체를 검출하기 위해 Hough transform 사용, 보표 크기 수정 등을 수행한다. 출력된 결과 파일을 사용하여 VR 게임에서 BPM, 최대 콤보 수, 음정과 박자를 분석하여 사용하고 리소스 관리를 위한 Object Pooling 기술을 통해 노트가 밀리는 현상을 방지한다. 광학 음악 인식 기술을 통해 나온 음악 요소로 VR 게임을 제작하여 VR 콘텐츠 제공과 함께 광학 음악 인식의 활용성을 넓히는 것을 확인하였다.

혼재된 환경에서의 효율적 로봇 파지를 위한 3차원 물체 인식 알고리즘 개발 (Development of an Efficient 3D Object Recognition Algorithm for Robotic Grasping in Cluttered Environments)

  • 송동운;이재봉;이승준
    • 로봇학회논문지
    • /
    • 제17권3호
    • /
    • pp.255-263
    • /
    • 2022
  • 3D object detection pipelines often incorporate RGB-based object detection methods such as YOLO, which detects the object classes and bounding boxes from the RGB image. However, in complex environments where objects are heavily cluttered, bounding box approaches may show degraded performance due to the overlapping bounding boxes. Mask based methods such as Mask R-CNN can handle such situation better thanks to their detailed object masks, but they require much longer time for data preparation compared to bounding box-based approaches. In this paper, we present a 3D object recognition pipeline which uses either the YOLO or Mask R-CNN real-time object detection algorithm, K-nearest clustering algorithm, mask reduction algorithm and finally Principal Component Analysis (PCA) alg orithm to efficiently detect 3D poses of objects in a complex environment. Furthermore, we also present an improved YOLO based 3D object detection algorithm that uses a prioritized heightmap clustering algorithm to handle overlapping bounding boxes. The suggested algorithms have successfully been used at the Artificial-Intelligence Robot Challenge (ARC) 2021 competition with excellent results.