• 제목/요약/키워드: Yolo-Cnn

검색결과 72건 처리시간 0.03초

Intelligent Activity Recognition based on Improved Convolutional Neural Network

  • Park, Jin-Ho;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제25권6호
    • /
    • pp.807-818
    • /
    • 2022
  • In order to further improve the accuracy and time efficiency of behavior recognition in intelligent monitoring scenarios, a human behavior recognition algorithm based on YOLO combined with LSTM and CNN is proposed. Using the real-time nature of YOLO target detection, firstly, the specific behavior in the surveillance video is detected in real time, and the depth feature extraction is performed after obtaining the target size, location and other information; Then, remove noise data from irrelevant areas in the image; Finally, combined with LSTM modeling and processing time series, the final behavior discrimination is made for the behavior action sequence in the surveillance video. Experiments in the MSR and KTH datasets show that the average recognition rate of each behavior reaches 98.42% and 96.6%, and the average recognition speed reaches 210ms and 220ms. The method in this paper has a good effect on the intelligence behavior recognition.

딥러닝 표정 인식을 통한 운동 영상 유튜브 하이라이트 업로드 자동화(RPA) 설계 (Design of Automation (RPA) for uploading workout videos to YouTube highlights through deep learning facial expression recognition)

  • 신동욱;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.655-657
    • /
    • 2022
  • 본 논문은 유튜브에 업로드 된 운동 영상을 시청하는 사람의 얼굴 영역을 YoloV3을 이용하여 얼굴 영상에서 눈 및 입술영역을 검출하는 방법을 연구하여, YoloV3은 딥 러닝을 이용한 물체 검출 방법으로 기존의 특징 기반 방법에 비해 성능이 우수한 것으로 알려져 있다. 본 논문에서는 영상을 다차원적으로 분리하고 클래스 확률(Class Probability)을 적용하여 하나의 회귀 문제로 접근한다. 영상의 1 frame을 입력 이미지로 CNN을 통해 텐서(Tensor)의 그리드로 나누고, 각 구간에 따라 객체인 경계 박스와 클래스 확률을 생성해 해당 구역의 눈과 입을 검출한다. 검출된 이미지 감성 분석을 통해, 운동 영상 중 하이라이트 부분을 자동으로 선별하는 시스템을 설계하였다.

객체 검출을 위한 트랜스포머와 공간 피라미드 풀링 기반의 YOLO 네트워크 (Transformer and Spatial Pyramid Pooling based YOLO network for Object Detection)

  • 권오준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.113-116
    • /
    • 2021
  • 일반적으로 딥러닝 기반의 객체 검출(Object Detection)기법은 합성곱 신경망(Convolutional Neural Network, CNN)을 통해 입력된 영상의 특징(Feature)을 추출하여 이를 통해 객체 검출을 수행한다. 최근 자연어 처리 분야에서 획기적인 성능을 보인 트랜스포머(Transformer)가 영상 분류, 객체 검출과 같은 컴퓨터 비전 작업을 수행하는데 있어 경쟁력이 있음이 드러나고 있다. 본 논문에서는 YOLOv4-CSP의 CSP 블록을 개선한 one-stage 방식의 객체 검출 네트워크를 제안한다. 개선된 CSP 블록은 트랜스포머(Transformer)의 멀티 헤드 어텐션(Multi-Head Attention)과 CSP 형태의 공간 피라미드 풀링(Spatial Pyramid Pooling, SPP) 연산을 기반으로 네트워크의 Backbone과 Neck에서의 feature 학습을 돕는다. 본 실험은 MSCOCO test-dev2017 데이터 셋으로 평가하였으며 제안하는 네트워크는 YOLOv4-CSP의 경량화 모델인 YOLOv4s-mish에 대하여 평균 정밀도(Average Precision, AP)기준 2.7% 향상된 검출 정확도를 보인다.

  • PDF

Guided Attention Mechanism을 활용한 화재사고 시 물체에 가려진 사람 탐지 기법 (A Technique for detecting a person hidden behind an object in a fire situation)

  • 유연준;홍석민;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.740-742
    • /
    • 2023
  • 객체 인식 연구에 있어서 딥러닝 기반의 사람 인식에 있어서 많은 연구들이 공개되고 있다. 특히 화재사고에 있어서 연기로 인해 가시성이 떨어져 인명구조에 어려움이 발생한다. 이에 열화상 카메라와 딥러닝을 통해 사람을 인식하는 기술이 연구되고 있다. 기존 연구에서는 열화상 카메라와 YOLO 딥러닝을 통해 사람을 인식하는데 95%의 성능을 보였지만, YOLO는 그리드 셀에서 하나의 분류만하기 때문에 물체에 가려진 사람을 판별하는데 정확도가 낮았다. 본 논문에서는 이와 같은 한계를 극복하기 위해 기존 Faster R-CNN 알고리즘을 사용한다. 신체부위 Guided Attention mechanism을 사용하여 가중치를 준 Feature Map을 RPN에 적용시켜 학습모델을 구현한다면 더 높은 정확도를 얻을 수 있다. 향후 본 논문에서 제안하는 기법은 많은 실험과 다양한 데이터 셋을 통해 실질적인 검증을 할 예정이다.

휴먼포즈 인식을 적용한 무형문화재 탈춤 동작 디지털전환 (The digital transformation of mask dance movement in intangible cultural asset based on human pose recognition)

  • 강수형;박성건;박광영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.678-680
    • /
    • 2023
  • 본 연구는 2022년 유네스코 인류무형유산 대표목록에 등재된 탈춤 동작을 디지털화하여 후속 세대에게 정보를 제공하는 것을 목적으로 한다. 데이터 수집은 국가무형문화제로 지정된 탈춤 단체 13개, 시도무형문화재 단체 5개에 소속된 무형문화재, 전승자 39명이 관성식 모션 캡처 장비를 착용하고, 8대의 카메라를 이용하여 수집하였다. 데이터 가공은 바운딩박스를 수행하였고, 탈춤동작 추정은 YOLO v8을 사용하였고 탈춤 동작 분류는 YOLO v8에 CNN모델을 결합하여 130개의 탈춤을 분류하였다. 연구결과, mAP-50은 0.953, mAP50-95는 0.596, Accuracy 70%를 달성하였다. 향후 학습용 데이터셋 구축량이 늘어나고, 데이터 품질이 개선된다면 탈춤 분류 성능은 더욱 개선될 것이라 기대한다.

딥러닝 기반의 보행자 탐지 및 경보 시스템 연구 (A Study on Deep Learning-based Pedestrian Detection and Alarm System)

  • 김정환;신용현
    • 한국ITS학회 논문지
    • /
    • 제18권4호
    • /
    • pp.58-70
    • /
    • 2019
  • 보행자 교통사고의 경우 사고 발생 시 사망사고로 연결되는 위험성이 있다. 국내 지능형 교통시스템(ITS)은 질 좋은 교통 인프라를 구축하고 있음에도 불구하고, 거의 교통정보 수집에만 이용되고 있어, 위험상황 발생 시 지능적인 위험 요소 분류가 이루어지지 않고 있다. 본 연구에서 제안하는 시스템의 주요 구성 요소인 CNN 기반의 보행자 탐지 분류 모델의 경우 제한적인 환경에서 설치 운영되는 것을 가정하여 임베디드 시스템 기반으로 구현되었다. 기존 YOLO의 인공신경망 모델을 개선하여 My-Tiny-Model3라는 새로운 모델을 생성하였고, 20,000번의 반복 학습 기준으로 평균 정확도 86.29%와 21.1 fps의 실시간 탐지 속도 결과를 보였다. 그리고, 이러한 탐지 시스템을 기반으로 하여 ITS 체계와 연계 가능한 시스템 구현 및 프로토콜 연동 시나리오를 구성하였다. 본 연구를 통해 기존 ITS 체계와 연동하는 보행자 사고 방지 시스템을 구현한다면, 새로운 인프라 구축비용을 절감하고 보행자 교통사고 발생률을 줄이는 데 도움이 될 것이다. 또한, 기존의 시스템 감시인력 소요에 따른 비용 또한 줄일 수 있을 것으로 기대된다.

딥러닝을 이용한 객체 검출 알고리즘 (Popular Object detection algorithms in deep learning)

  • 강동연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2019
  • Object detection is applied in various field. Autonomous driving, surveillance, OCR(optical character recognition) and aerial image etc. We will look at the algorithms that are using to object detect. These algorithms are divided into two methods. The one is R-CNN algorithms [2], [5], [6] which based on region proposal. The other is YOLO [7] and SSD [8] which are one stage object detector based on regression/classification.

Vehicle Orientation Detection Using CNN

  • Nguyen, Huu Thang;Kim, Jaemin
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.619-624
    • /
    • 2021
  • Vehicle orientation detection is a challenging task because the orientations of vehicles can vary in a wide range in captured images. The existing methods for oriented vehicle detection require too much computation time to be applied to a real-time system. We propose Rotate YOLO, which has a set of anchor boxes with multiple scales, ratios, and angles to predict bounding boxes. For estimating the orientation angle, we applied angle-related IoU with CIoU loss to solve the underivable problem from the calculation of SkewIoU. Evaluation results on three public datasets DLR Munich, VEDAI and UCAS-AOD demonstrate the efficiency of our approach.

TensorRT 엔진과 SSD를 이용한 Face detection (Objedet detection using TensorRT engine and SSD)

  • 유혜빈;김상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.574-576
    • /
    • 2020
  • 최근에는 딥러닝 기술의 발달로 물체 인식 및 검출에 관한 기술들 또한 발탄하고 있다. 검출에 관한 여러 기법(Faster R-CNN, R-CNN, YOLO, SSD 등) 중 SSD는 다른 기법들과는 다르게 높은 정확도와 빠른 속도가 특징이다. 동시에 여러 detection network들도 쉽게 이용이 가능하다. 본 논문에서는 detection netowork중 Mobilenet V2 network를 이용하여 SSD와 결합해 모델을 훈련하고, TensorRT engine을 이용하여 더 빠른 속도로 검출할 수 있는 방법에 대해 논의한다. 이 방법을 통해 face detector를 만들어 여러 상황에서 쓰일 수 있도록 한다.

인공지능을 활용한 도주경로 예측 및 추적 시스템 (Escape Route Prediction and Tracking System using Artificial Intelligence)

  • 양범석;박대우
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1130-1135
    • /
    • 2022
  • 서울특별시는 25개 구청에 7만5천여대의 CCTV가 설치되어 있다. 각 구청은 CCTV관제를 위한 관제센터를 구축하고 시민의 안전을 위해 24시간 CCTV영상관제를 수행하고 있다. 서울특별시는 유관기관과 MOU를 체결하여 긴급/응급 상황에 신속한 대응이 가능하도록 구청의 CCTV영상을 제공하여 시민이 안전한 스마트시티통합플랫폼을 구축하고 있다. 본 논문에서는, 서울특별시 관할구청에서 사건 발생 시, CCTV영상에 대해 인공지능 DNN 기반의 Template Matching 기술, MLP 알고리즘과 CNN 기반으로 YOLO SPP DNN모델을 사용하여 사람과 차량을 판별하여 도주경로를 예측한다. 또한, 관할구청을 이탈하여, 차량 및 사람이 도주 시, 인접 구청에 영상정보와 상황정보를 자동전파 하도록 설계한다. 인공지능을 활용한 도주경로 예측 및 추적 시스템은 스마트시티 통합플랫폼을 전국으로 확장시킬 수 있다.