• Title/Summary/Keyword: R-CNN

Search Result 248, Processing Time 0.033 seconds

A Study on Fruit Quality Identification Using YOLO V2 Algorithm

  • Lee, Sang-Hyun
    • International Journal of Advanced Culture Technology
    • /
    • v.9 no.1
    • /
    • pp.190-195
    • /
    • 2021
  • Currently, one of the fields leading the 4th industrial revolution is the image recognition field of artificial intelligence, which is showing good results in many fields. In this paper, using is a YOLO V2 model, which is one of the image recognition models, we intend to classify and select into three types according to the characteristics of fruits. To this end, it was designed to proceed the number of iterations of learning 9000 counts based on 640 mandarin image data of 3 classes. For model evaluation, normal, rotten, and unripe mandarin oranges were used based on images. We as a result of the experiment, the accuracy of the learning model was different depending on the number of learning. Normal mandarin oranges showed the highest at 60.5% in 9000 repetition learning, and unripe mandarin oranges also showed the highest at 61.8% in 9000 repetition learning. Lastly, rotten tangerines showed the highest accuracy at 86.0% in 7000 iterations. It will be very helpful if the results of this study are used for fruit farms in rural areas where labor is scarce.

Object Classification with Angular Margin Loss Function (각도 마진 손실 함수를 적용한 객체 분류)

  • Park, Seonji;Cho, Namik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.224-227
    • /
    • 2022
  • 객체 분류는 입력으로 주어진 이미지에 포함된 객체의 종류를 판단하는 기술이다. 대표적인 딥러닝 기반의 객체 분류 방법으로서 Faster R-CNN[2], YOLO[3] 등의 모델이 개발되었으나, 여전히 성능 향상의 여지가 있다. 본 연구에서는 각도 마진 손실 함수를 기존의 몇 가지 객채 분류 모델에 적용하여 성능 향상을 유도한다. 각도 마진 손실 함수는 얼굴 인식 모델인 SphereFace [4]에서 제안한 방법으로, 얼굴 인식과 같이 단일 도메인의 데이터셋을 분류하는 문제를 풀기 위해 제안되었다. 이는 기존 소프트맥스 함수에서 클래스 결정 경계선에 마진을 주는 방식으로 클래스 간의 구분 능력을 향상시킨다. 본 논문은 각도 마진 손실 함수를 CIFAR10, CIFAR100 데이터셋의 분류 문제에 적용하였으며 ResNet, EfficientNet, MobileNet 등의 백본 네트워크로 실험하여 평균적으로 mAP 성능이 향상되는 것을 확인하였다.

  • PDF

Implant sample recommendation system that matches patient's tooth color (치아 색에 맞는 임플란트 표본 추천 시스템)

  • Kim, Changjin;Sim, Kyudong;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.305-308
    • /
    • 2020
  • 임플란트 시술 수요가 늘고 시장이 성장하면서 관련 기술도 발전하고 있다. 특히 기능성과 심미성 향상을 위해 많은 기술이 연구되고 있다. 이 중 심미성에 있어 주변 치아와의 색 유사도가 높은 임플란트를 제작하는 것이 주요 연구 중 하나이다. 본 논문에서는 심미성 높은 임플란트 제작을 위해, 다음과 같은 임플란트 표본 추천 시스템을 제안한다. 휴대 조명 장치와 의료용 치아 패치를 사용한 색 보정으로 촬영 환경 차이를 최소화하여 치아의 정확한 색을 추출한다. Mask R-CNN 모델을 통해 보정된 영상에서 치아를 검출하고, 군집화를 통해 색상 단위로 치아 영역을 구분한다. 치아의 영역별 색상과 임플란트 표본 사이의 색상 거리를 계산하여 유사한 표본들을 추천한다. 위 시스템을 통해 사용자는 주변 환경에 영향을 받지 않고, 치아의 색을 정확히 분석하여 이를 임플란트 표본과 비교할 수 있게 된다.

  • PDF

Automatic Attendance Check System Using Face Recognition In A Masked Environment (마스크를 착용한 환경에서 얼굴 인식을 활용한 자동 출석체크 시스템)

  • Kim, Young-Kook;Lim, Chae-Hyun;Son, Min-Ji;Kim, Myung-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.23-26
    • /
    • 2020
  • 본 논문에서는 CCTV를 통해 얻은 영상에서 얼굴을 인식하여 자동으로 출석 여부를 체크하는 시스템을 소개한다. 이 시스템은 CNN을 바탕으로 RetinaFace 모델을 사용하여 얼굴을 탐지하고, 탐지된 얼굴을 ArcFace 모델로 R512의 목표 공간으로 임베딩한다. 기존 데이터베이스에 등록된 얼굴과 CCTV를 통해 얻은 얼굴들의 임베딩 벡터 사이의 Angular Cosine Distance를 측정하여 동일 인물인지 판단하는 매칭 알고리즘을 제안한다. 실험을 통해 두 모델을 동시에 사용할 최적의 환경을 파악하고, 마스크 착용으로 얼굴의 하단부가 가려지는 폐색 문제에 더욱 효과적으로 대응하여 매칭 성능을 높이는 방법을 제안한다.

  • PDF

Plant leaf area estimation using synthetic dataset and deep learning model (합성 데이터셋과 딥러닝 모델을 이용한 식물 엽면적 추정)

  • Suh, Hyun Kwon;Ahn, Juyeon;Park, Hyeonji
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.90-92
    • /
    • 2022
  • 이 논문에서는 합성된 애기장대 데이터셋을 활용하여 딸기의 엽면적을 추정할 수 있는 딥러닝 모델을 제안한다. 제안된 모델에서는 개별 잎 검출을 위하여 합성 데이터셋으로 학습된 Mask R-CNN 의 객체 검출 모델을 사용하였고, 이어 이미지 후처리 작업에 해당되는 모폴로지 연산의 침식 및 팽창, 픽셀 카운터를 통해 엽면적을 추정하였다. 각기 다른 역할을 수행하는 신경망 계층에 어텐션 메커니즘 적용하여 검출 성능의 향상과 검출 시간을 단축하였다. 제안된 모델은 딸기 데이터셋을 사용하지 않는 합성된 데이터셋만으로도 실제 온실에서 획득한 다양한 이미지에서의 딸기 엽면적을 추정하는 데에 우수한 성능을 보여준다.

  • PDF

Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision (RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교)

  • Lee, Yegi;Kim, Shin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.146-149
    • /
    • 2022
  • 기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.

  • PDF

A Technique for detecting a person hidden behind an object in a fire situation (Guided Attention Mechanism을 활용한 화재사고 시 물체에 가려진 사람 탐지 기법)

  • Yeon-Jun Yoo;;Yong-Tae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.740-742
    • /
    • 2023
  • 객체 인식 연구에 있어서 딥러닝 기반의 사람 인식에 있어서 많은 연구들이 공개되고 있다. 특히 화재사고에 있어서 연기로 인해 가시성이 떨어져 인명구조에 어려움이 발생한다. 이에 열화상 카메라와 딥러닝을 통해 사람을 인식하는 기술이 연구되고 있다. 기존 연구에서는 열화상 카메라와 YOLO 딥러닝을 통해 사람을 인식하는데 95%의 성능을 보였지만, YOLO는 그리드 셀에서 하나의 분류만하기 때문에 물체에 가려진 사람을 판별하는데 정확도가 낮았다. 본 논문에서는 이와 같은 한계를 극복하기 위해 기존 Faster R-CNN 알고리즘을 사용한다. 신체부위 Guided Attention mechanism을 사용하여 가중치를 준 Feature Map을 RPN에 적용시켜 학습모델을 구현한다면 더 높은 정확도를 얻을 수 있다. 향후 본 논문에서 제안하는 기법은 많은 실험과 다양한 데이터 셋을 통해 실질적인 검증을 할 예정이다.

DeepSDO: Solar event detection using deep-learning-based object detection methods

  • Baek, Ji-Hye;Kim, Sujin;Choi, Seonghwan;Park, Jongyeob;Kim, Jihun;Jo, Wonkeum;Kim, Dongil
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.46 no.2
    • /
    • pp.46.2-46.2
    • /
    • 2021
  • We present solar event auto detection using deep-learning-based object detection algorithms and DeepSDO event dataset. DeepSDO event dataset is a new detection dataset with bounding boxed as ground-truth for three solar event (coronal holes, sunspots and prominences) features using Solar Dynamics Observatory data. To access the reliability of DeepSDO event dataset, we compared to HEK data. We train two representative object detection models, the Single Shot MultiBox Detector (SSD) and the Faster Region-based Convolutional Neural Network (R-CNN) with DeepSDO event dataset. We compared the performance of the two models for three solar events and this study demonstrates that deep learning-based object detection can successfully detect multiple types of solar events. In addition, we provide DeepSDO event dataset for further achievements event detection in solar physics.

  • PDF

A Three-scale Pedestrian Detection Method based on Refinement Module (Refinement Module 기반 Three-Scale 보행자 검출 기법)

  • Kyungmin Jung;Sooyong Park;Hyun Lee
    • IEMEK Journal of Embedded Systems and Applications
    • /
    • v.18 no.5
    • /
    • pp.259-265
    • /
    • 2023
  • Pedestrian detection is used to effectively detect pedestrians in various situations based on deep learning. Pedestrian detection has difficulty detecting pedestrians due to problems such as camera performance, pedestrian description, height, and occlusion. Even in the same pedestrian, performance in detecting them can differ according to the height of the pedestrian. The height of general pedestrians encompasses various scales, such as those of infants, adolescents, and adults, so when the model is applied to one group, the extraction of data becomes inaccurate. Therefore, this study proposed a pedestrian detection method that fine-tunes the pedestrian area by Refining Layer and Feature Concatenation to consider various heights of pedestrians. Through this, the score and location value for the pedestrian area were finely adjusted. Experiments on four types of test data demonstrate that the proposed model achieves 2-5% higher average precision (AP) compared to Faster R-CNN and DRPN.

Recognition of Flat Type Signboard using Deep Learning (딥러닝을 이용한 판류형 간판의 인식)

  • Kwon, Sang Il;Kim, Eui Myoung
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.37 no.4
    • /
    • pp.219-231
    • /
    • 2019
  • The specifications of signboards are set for each type of signboards, but the shape and size of the signboard actually installed are not uniform. In addition, because the colors of the signboard are not defined, so various colors are applied to the signboard. Methods for recognizing signboards can be thought of as similar methods of recognizing road signs and license plates, but due to the nature of the signboards, there are limitations in that the signboards can not be recognized in a way similar to road signs and license plates. In this study, we proposed a methodology for recognizing plate-type signboards, which are the main targets of illegal and old signboards, and automatically extracting areas of signboards, using the deep learning-based Faster R-CNN algorithm. The process of recognizing flat type signboards through signboard images captured by using smartphone cameras is divided into two sequences. First, the type of signboard was recognized using deep learning to recognize flat type signboards in various types of signboard images, and the result showed an accuracy of about 71%. Next, when the boundary recognition algorithm for the signboards was applied to recognize the boundary area of the flat type signboard, the boundary of flat type signboard was recognized with an accuracy of 85%.