• Title/Summary/Keyword: 객체검출 모델

Search Result 242, Processing Time 0.033 seconds

HOG and Color Information based 2-Stages Pedestrian Detection System (HOG와 컬러정보 기반의 2단계 보행자 탐지 시스템)

  • Jang, Gyu-Jin;Kim, Jin-Pyung;Kim, Moon-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1365-1368
    • /
    • 2015
  • 컴퓨터 비전 분야의 활용영역과 시장성이 증대하면서 가장 많이 사용되는 객체인식 및 탐지 기술과 관련된 연구는 꾸준히 진행되고 있다. 최근에는 ADAS(Advanced Driver Assistance Systems)와 특징적인 객체를 인식 추적할 수 있는 지능형 감시시스템에서의 가장 핵심적인 기술로 자리 잡고 있다. 본 연구에서는 보행자 탐지에 사용하는 특징들 중에서 조명변화에 강건한 HOG와 Cascade-Adaboost를 기반으로 보행자 탐지 모델을 후보영역을 검출하고 검출된 영역에서 컬러정보를 추출하여 의사결정 트리에 적용시켜 최종 보행자를 탐지하는 시스템을 제안한다.

Analyzing the client's emotions and judging the effectiveness of counseling using a YOLO-based facial expression recognizer (YOLO 기반 표정 인식기를 활용한 내담자의 감정 분석 및 상담 효율성 판단)

  • Yoon, Kyung Seob;Kim, Minji
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.477-480
    • /
    • 2021
  • 본 논문에서는 딥러닝 기술을 활용한 객체 검출(object detection) 모델인 YOLO를 기반으로 하는 감정에 따른 표정 인식 시스템을 활용하여 상담 시 보조 도구로 사용하는 방법을 제공한다. 또한, 머신러닝 기술 기반의 툴킷인 dlib 라이브러리를 사용하여 마스크 착용자의 눈 형태 관측을 통한 표정 인식 및 감정 분석의 정확도 상승을 도모하였다. 이 기술은 코로나19의 장기화로 온라인 수업이나 화상회의를 지원하는 플랫폼들이 전성기를 누리고 있는 현시점에서 다양한 분야로 확장할 수 있을 것으로 기대한다.

  • PDF

Detection of Power Transmission Equipment in Image using Guided Grad-CAM (Guided Grad-CAM 을 이용한 영상 내 송전설비 검출기법)

  • Park, Eun-Soo;Kim, SeungHwan;Mujtaba, Ghulam;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.709-713
    • /
    • 2020
  • 본 논문에서 육안으로도 구별하기 힘든 송전선과 같은 객체가 포함된 송전설비를 효과적으로 검출하는 방법을 제안한다. 객체 인식 모델에 송전탑 데이터 셋을 학습시켜 송전설비 Region of Interest(ROI)를 추출한다. 송전선 데이터 셋을 ResNet50 에 학습하고, 추출된 ROI 영상을 Guided Grad-CAM 을 출력한다. 추출된 Guided Grad-CAM 에 노이즈 제거 후처리를 적용하여 송전설비를 추출한다. 본 논문에서 제안된 기법을 적용할 경우 드론 또는 UAV 헬기 등에서 촬영된 영상으로 송전설비 유지보수가 가능하다.

  • PDF

Real-time Hand Region Detection and Tracking using Depth Information (깊이정보를 이용한 실시간 손 영역 검출 및 추적)

  • Joo, SungIl;Weon, SunHee;Choi, HyungIl
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.1 no.3
    • /
    • pp.177-186
    • /
    • 2012
  • In this paper, we propose a real-time approach for detecting and tracking a hand region by analyzing depth images. We build a hand model in advance. The model has the shape information of a hand. The detecting process extracts out moving areas in an image, which are possibly caused by moving a hand in front of a camera. The moving areas can be identified by analyzing accumulated difference images and applying the region growing technique. The extracted moving areas are compared against a hand model to get justified as a hand region. The tracking process keeps the track of center points of hand regions of successive frames. For this purpose, it involves three steps. The first step is to determine a seed point that is the closest point to the center point of a previous frame. The second step is to perform region growing to form a candidate region of a hand. The third step is to determine the center point of a hand to be tracked. This point is searched by the mean-shift algorithm within a confined area whose size varies adaptively according to the depth information. To verify the effectiveness of our approach, we have evaluated the performance of our approach while changing the shape and position of a hand as well as the velocity of hand movement.

AR Tourism Service Framework Using YOLOv3 Object Detection (YOLOv3 객체 검출을 이용한 AR 관광 서비스 프레임워크)

  • Kim, In-Seon;Jeong, Chi-Seo;Jung, Kye-Dong
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.21 no.1
    • /
    • pp.195-200
    • /
    • 2021
  • With the development of transportation and mobiles demand for tourism travel is increasing and related industries are also developing significantly. The combination of augmented reality and tourism contents one of the areas of digital media technology, is also actively being studied, and artificial intelligence is already combined with the tourism industry in various directions, enriching tourists' travel experiences. In this paper, we propose a system that scans miniature models produced by reducing tourist areas, finds the relevant tourist sites based on models learned using deep learning in advance, and provides relevant information and 3D models as AR services. Because model learning and object detection are carried out using YOLOv3 neural networks, one of various deep learning neural networks, object detection can be performed at a fast rate to provide real-time service.

A Study on the Elevator System Using Real-time Object Detection Technology YOLOv5 (실시간 객체 검출 기술 YOLOv5를 이용한 스마트 엘리베이터 시스템에 관한 연구)

  • Sun-Been Park;Yu-Jeong Jeong;Da-Eun Lee;Tae-Kook Kim
    • Journal of Internet of Things and Convergence
    • /
    • v.10 no.2
    • /
    • pp.103-108
    • /
    • 2024
  • In this paper, a smart elevator system was studied using real-time object detection technology based on YOLO(You only look once)v5. When an external elevator button is pressed, the YOLOv5 model analyzes the camera video to determine whether there are people waiting, and if it determines that there are no people waiting, the button is automatically canceled. The study introduces an effective method of implementing object detection and communication technology through YOLOv5 and MQTT (Message Queuing Telemetry Transport) used in the Internet of Things. And using this, we implemented a smart elevator system that determines in real time whether there are people waiting. The proposed system can play the role of CCTV (closed-circuit television) while reducing unnecessary power consumption. Therefore, the proposed smart elevator system is expected to contribute to safety and security issues.

Performance Evaluation of YOLOv5s for Brain Hemorrhage Detection Using Computed Tomography Images (전산화단층영상 기반 뇌출혈 검출을 위한 YOLOv5s 성능 평가)

  • Kim, Sungmin;Lee, Seungwan
    • Journal of the Korean Society of Radiology
    • /
    • v.16 no.1
    • /
    • pp.25-34
    • /
    • 2022
  • Brain computed tomography (CT) is useful for brain lesion diagnosis, such as brain hemorrhage, due to non-invasive methodology, 3-dimensional image provision, low radiation dose. However, there has been numerous misdiagnosis owing to a lack of radiologist and heavy workload. Recently, object detection technologies based on artificial intelligence have been developed in order to overcome the limitations of traditional diagnosis. In this study, the applicability of a deep learning-based YOLOv5s model was evaluated for brain hemorrhage detection using brain CT images. Also, the effect of hyperparameters in the trained YOLOv5s model was analyzed. The YOLOv5s model consisted of backbone, neck and output modules. The trained model was able to detect a region of brain hemorrhage and provide the information of the region. The YOLOv5s model was trained with various activation functions, optimizer functions, loss functions and epochs, and the performance of the trained model was evaluated in terms of brain hemorrhage detection accuracy and training time. The results showed that the trained YOLOv5s model is able to provide a bounding box for a region of brain hemorrhage and the accuracy of the corresponding box. The performance of the YOLOv5s model was improved by using the mish activation function, the stochastic gradient descent (SGD) optimizer function and the completed intersection over union (CIoU) loss function. Also, the accuracy and training time of the YOLOv5s model increased with the number of epochs. Therefore, the YOLOv5s model is suitable for brain hemorrhage detection using brain CT images, and the performance of the model can be maximized by using appropriate hyperparameters.

Image Segmentation and Determination of the Count of Clusters using Modified Fuzzy c-Means Clustering Algorithm (변형된 FCM을 이용한 칼라영상의 영역분할과 클러스터 수 결정)

  • 윤후병;정성종;안동언;두길수
    • Proceedings of the IEEK Conference
    • /
    • 2001.06c
    • /
    • pp.177-180
    • /
    • 2001
  • 영상에 존재하는 객체들을 인식하기 위해서는 먼저 영상의 영역분할이 필요하다. 통계적 모델을 이용한 영상의 영역분할은 미리서 분할하고자 하는 클러스터의 수를 결정한 후 이를 토대로 영상을 분할하게 된다. 그러나 영상마다 특성상 분할하고자 하는 클러스터 수가 다를 경우 이를 수동적으로 해주는 것은 비능률적이다. 따라서 본 논문은 영상의 영역분할에 통계적 모델에서 미리 결정해줘야 하는 클러스터의 수 문제를 자동으로 검출하고 퍼지 c-Means 글러스터링 알고리즘을 통한 영상의 영역분할 시 노이즈문제를 이웃한 픽셀들의 멤버쉽 값을 평균화합으로써 해결하는 방법을 제안하였다.

  • PDF

Determination of the Count of Clusters and Image Segmentation using Modified Fuzzy c-Means Clustering Algorithm (영상의 클러스터 수 결정과 변형된 퍼지 c-Means 클러스터링을 이용한 영역 분할)

  • 윤후병;정성종;안동언
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.598-600
    • /
    • 2000
  • 영상에 존재하는 객체들을 인식하기 위해서는 먼저 영상의 영역 분할이 필요하다. 통계적 모델을 이용한 영상의 영역 분할은 미리서 분할하고자 하는 클러스터의 수를 결정한 후 이를 토대로 영상을 분할하게 된다. 그러나 영상마다 특성상 분할하고자 하는 클러스터 수가 다를 경우 이를 수동적으로 해주는 것은 비능률적이다. 따라서 본 논문은 영상의 영역 분할에 통계적 모델에서 미리 결정해줘야 하는 클러스터의 수 문제를 자동으로 검출하고 퍼지 c-Means 클러스터링 알고리즘을 통한 영상의 영역 분할 시 노이즈 문제를 이웃한 픽셀들의 멤버쉽 값을 평균화함으로써 해결하는 방법을 제안하였다.

  • PDF

A Study on Flame Detection using Faster R-CNN and Image Augmentation Techniques (Faster R-CNN과 이미지 오그멘테이션 기법을 이용한 화염감지에 관한 연구)

  • Kim, Jae-Jung;Ryu, Jin-Kyu;Kwak, Dong-Kurl;Byun, Sun-Joon
    • Journal of IKEEE
    • /
    • v.22 no.4
    • /
    • pp.1079-1087
    • /
    • 2018
  • Recently, computer vision field based deep learning artificial intelligence has become a hot topic among various image analysis boundaries. In this study, flames are detected in fire images using the Faster R-CNN algorithm, which is used to detect objects within the image, among various image recognition algorithms based on deep learning. In order to improve fire detection accuracy through a small amount of data sets in the learning process, we use image augmentation techniques, and learn image augmentation by dividing into 6 types and compare accuracy, precision and detection rate. As a result, the detection rate increases as the type of image augmentation increases. However, as with the general accuracy and detection rate of other object detection models, the false detection rate is also increased from 10% to 30%.