• 제목/요약/키워드: Region-based CNN

검색결과 78건 처리시간 0.025초

딥러닝을 이용한 객체 검출 알고리즘 (Popular Object detection algorithms in deep learning)

  • 강동연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2019
  • Object detection is applied in various field. Autonomous driving, surveillance, OCR(optical character recognition) and aerial image etc. We will look at the algorithms that are using to object detect. These algorithms are divided into two methods. The one is R-CNN algorithms [2], [5], [6] which based on region proposal. The other is YOLO [7] and SSD [8] which are one stage object detector based on regression/classification.

딥러닝 기반의 제품 포장에 인쇄된 유통기한 결함 검출 방법 (Deep Learning-Based Defects Detection Method of Expiration Date Printed In Product Package)

  • 이종운;정승수;유윤섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.463-465
    • /
    • 2021
  • 현재 식품 포장 및 박스에 인쇄된 유통기한 검사 방법은 일부 제품만 샘플링하여 사람의 눈으로 검사하는 방법이다. 이러한 샘플링 검사는 극히 일부분의 제품만 검사 가능하다는 한계를 지니고 있다. 따라서 카메라를 활용한 정확한 검사가 요구된다. 본 논문에서는 제품 포장에 인쇄된 유통기한 결함 검출방법에 인공지능 기술인 딥 러닝 객체인식 기술 모델을 제안한다. 제안된 방법으로는 딥러닝 객체인식 모델 중에 Faster R-CNN 모델을 이용해 인쇄된 유통기한을 검출을 학습하고 Faster R-CNN 방법을 이용해서 수집된 칼라이미지를 그레이 이미지와 이진화 이미지로 변환한 이미지에 대해 각각 성능을 비교하고 검출 성능을 확인한다. 딥 러닝 기술에 적용한 박스에 인쇄된 유통기한 검출 성능은 기존 비전 검사기의 검출 성능과 비슷한 검출 성능을 보였다.

  • PDF

Vehicle Manufacturer Recognition using Deep Learning and Perspective Transformation

  • Ansari, Israfil;Shim, Jaechang
    • Journal of Multimedia Information System
    • /
    • 제6권4호
    • /
    • pp.235-238
    • /
    • 2019
  • In real world object detection is an active research topic for understanding different objects from images. There are different models presented in past and had significant results. In this paper we are presenting vehicle logo detection using previous object detection models such as You only look once (YOLO) and Faster Region-based CNN (F-RCNN). Both the front and rear view of the vehicles were used for training and testing the proposed method. Along with deep learning an image pre-processing algorithm called perspective transformation is proposed for all the test images. Using perspective transformation, the top view images were transformed into front view images. This algorithm has higher detection rate as compared to raw images. Furthermore, YOLO model has better result as compare to F-RCNN model.

R-FCN과 Transfer Learning 기법을 이용한 영상기반 건설 안전모 자동 탐지 (Image-Based Automatic Detection of Construction Helmets Using R-FCN and Transfer Learning)

  • 박상윤;윤상현;허준
    • 대한토목학회논문집
    • /
    • 제39권3호
    • /
    • pp.399-407
    • /
    • 2019
  • 대한민국에서 건설업은 타 업종들과 비교하여 안전사고의 위험성이 가장 높게 나타난다. 따라서 건설업 내 안전성 향상을 도모하기 위해 여러 연구가 예전부터 진행이 되어 왔고, 본 연구에선 건설현장 영상 데이터를 기반으로 물체 탐지 및 분류 알고리즘을 이용해서 효과적인 안전모 자동탐지 시스템을 구축하여 건설현장 노동자들의 안전성 향상에 기여하고자 한다. 본 연구에서 사용된 알고리즘은 Convolutional Neural Network (CNN) 기반의 물체 탐지 및 분류 알고리즘인 Region-based Fully Convolutional Networks (R-FCN)이고 이를 Transfer Learning 기법을 사용하여 딥러닝을 실시하였다. ImageNet에서 수집한 1089장의 사람과 안전모가 포함된 영상으로 학습을 시행하였고 그 결과, 사람과 안전모의 mean Average Precision (mAP)은 각각 0.86, 0.83로 측정되었다.

Sub-Frame Analysis-based Object Detection for Real-Time Video Surveillance

  • Jang, Bum-Suk;Lee, Sang-Hyun
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제11권4호
    • /
    • pp.76-85
    • /
    • 2019
  • We introduce a vision-based object detection method for real-time video surveillance system in low-end edge computing environments. Recently, the accuracy of object detection has been improved due to the performance of approaches based on deep learning algorithm such as Region Convolutional Neural Network(R-CNN) which has two stage for inferencing. On the other hand, one stage detection algorithms such as single-shot detection (SSD) and you only look once (YOLO) have been developed at the expense of some accuracy and can be used for real-time systems. However, high-performance hardware such as General-Purpose computing on Graphics Processing Unit(GPGPU) is required to still achieve excellent object detection performance and speed. To address hardware requirement that is burdensome to low-end edge computing environments, We propose sub-frame analysis method for the object detection. In specific, We divide a whole image frame into smaller ones then inference them on Convolutional Neural Network (CNN) based image detection network, which is much faster than conventional network designed forfull frame image. We reduced its computationalrequirementsignificantly without losing throughput and object detection accuracy with the proposed method.

Automatic detection of periodontal compromised teeth in digital panoramic radiographs using faster regional convolutional neural networks

  • Thanathornwong, Bhornsawan;Suebnukarn, Siriwan
    • Imaging Science in Dentistry
    • /
    • 제50권2호
    • /
    • pp.169-174
    • /
    • 2020
  • Purpose: Periodontal disease causes tooth loss and is associated with cardiovascular diseases, diabetes, and rheumatoid arthritis. The present study proposes using a deep learning-based object detection method to identify periodontally compromised teeth on digital panoramic radiographs. A faster regional convolutional neural network (faster R-CNN) which is a state-of-the-art deep detection network, was adapted from the natural image domain using a small annotated clinical data- set. Materials and Methods: In total, 100 digital panoramic radiographs of periodontally compromised patients were retrospectively collected from our hospital's information system and augmented. The periodontally compromised teeth found in each image were annotated by experts in periodontology to obtain the ground truth. The Keras library, which is written in Python, was used to train and test the model on a single NVidia 1080Ti GPU. The faster R-CNN model used a pretrained ResNet architecture. Results: The average precision rate of 0.81 demonstrated that there was a significant region of overlap between the predicted regions and the ground truth. The average recall rate of 0.80 showed that the periodontally compromised teeth regions generated by the detection method excluded healthiest teeth areas. In addition, the model achieved a sensitivity of 0.84, a specificity of 0.88 and an F-measure of 0.81. Conclusion: The faster R-CNN trained on a limited amount of labeled imaging data performed satisfactorily in detecting periodontally compromised teeth. The application of a faster R-CNN to assist in the detection of periodontally compromised teeth may reduce diagnostic effort by saving assessment time and allowing automated screening documentation.

학습기반 효율적인 얼굴 검출 시스템 설계 (Design of an efficient learning-based face detection system)

  • 김현식;김완태;박병준
    • 디지털산업정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.213-220
    • /
    • 2023
  • Face recognition is a very important process in video monitoring and is a type of biometric technology. It is mainly used for identification and security purposes, such as ID cards, licenses, and passports. The recognition process has many variables and is complex, so development has been slow. In this paper, we proposed a face recognition method using CNN, which has been re-examined due to the recent development of computers and algorithms, and compared with the feature comparison method, which is an existing face recognition algorithm, to verify performance. The proposed face search method is divided into a face region extraction step and a learning step. For learning, face images were standardized to 50×50 pixels, and learning was conducted while minimizing unnecessary nodes. In this paper, convolution and polling-based techniques, which are one of the deep learning technologies, were used for learning, and 1,000 face images were randomly selected from among 7,000 images of Caltech, and as a result of inspection, the final recognition rate was 98%.

기계 학습 알고리즘을 이용한 효과적인 대상 영역 분할 (Effective Detection of Target Region Using a Machine Learning Algorithm)

  • 장석우;이경주;정명희
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.697-704
    • /
    • 2018
  • 다양한 종류의 컬러 영상 콘텐츠에 포함되어 있는 사람의 얼굴 영역은 다른 사람들과 특정인을 구별해 줄 수 있는 개인의 정보에 해당하므로, 입력된 컬러 영상으로부터 가려지지 않은 사람의 얼굴 영역들을 정확하게 검출하는 작업은 매우 중요하다. 본 논문에서는 입력되는 컬러 영상으로부터 기계 학습 알고리즘 중의 하나인 딥러닝 알고리즘을 이용하여 사람의 얼굴 영역을 정확하게 검출하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 RGB 색상 모델로 입력되는 영상을 $YC_bC_r$ 색상 모델로 변경한 다음, 기 학습된 타원형의 피부 색상 분포 모델을 활용하여 다른 영역들은 제거하고 사람의 피부 영역만을 먼저 분할한다. 그런 다음, CNN 모델 기반의 딥러닝 알고리즘을 적용하여 이전 단계에서 검출된 피부 영역 내에서 사람의 얼굴 영역을 강인하게 검출한다. 실험 결과에서는 제안된 방법이 입력되는 다양한 컬러 영상으로부터 사람의 얼굴 영역들을 기존의 방법에 비해 보다 효율적으로 분할한다는 것을 보여준다. 본 논문에서 제안된 얼굴 영역 검출 방법은 영상 보안, 물체 인식 및 추적, 얼굴 인식 등과 같은 멀티미디어 및 형태 인식과 관련된 실제적인 응용 분야에서 매우 유용하게 활용될 것으로 기대된다.

RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교 (Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision)

  • 이예지;김신;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.146-149
    • /
    • 2022
  • 기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.

  • PDF

DeepSDO: Solar event detection using deep-learning-based object detection methods

  • Baek, Ji-Hye;Kim, Sujin;Choi, Seonghwan;Park, Jongyeob;Kim, Jihun;Jo, Wonkeum;Kim, Dongil
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.46.2-46.2
    • /
    • 2021
  • We present solar event auto detection using deep-learning-based object detection algorithms and DeepSDO event dataset. DeepSDO event dataset is a new detection dataset with bounding boxed as ground-truth for three solar event (coronal holes, sunspots and prominences) features using Solar Dynamics Observatory data. To access the reliability of DeepSDO event dataset, we compared to HEK data. We train two representative object detection models, the Single Shot MultiBox Detector (SSD) and the Faster Region-based Convolutional Neural Network (R-CNN) with DeepSDO event dataset. We compared the performance of the two models for three solar events and this study demonstrates that deep learning-based object detection can successfully detect multiple types of solar events. In addition, we provide DeepSDO event dataset for further achievements event detection in solar physics.

  • PDF