• 제목/요약/키워드: Object-based Classification

검색결과 501건 처리시간 0.029초

CycleGAN을 활용한 항공영상 학습 데이터 셋 보완 기법에 관한 연구 (A Study on the Complementary Method of Aerial Image Learning Dataset Using Cycle Generative Adversarial Network)

  • 최형욱;이승현;김형훈;서용철
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.499-509
    • /
    • 2020
  • 본 연구에서는 최근 영상판독 분야에서 활발히 연구되고, 활용성이 발전하고 있는 인공지능 기반 객체분류 학습 데이터 구축에 관한 내용을 다룬다. 영상판독분야에서 인공지능을 활용하여 정확도 높은 객체를 인식, 추출하기 위해서는 알고리즘에 적용할 많은 양의 학습데이터가 필수적으로 요구된다. 하지만, 현재 공동활용 가능한 데이터 셋이 부족할 뿐만 아니라 데이터 생성을 위해서는 많은 시간과 인력 및 고비용을 필요로 하는 것이 현실이다. 따라서 본 연구에서는 소량의 초기 항공영상 학습데이터를 GAN (Generative Adversarial Network) 기반의 생성기 신경망을 활용하여 오버샘플 영상 학습데이터를 구축하고, 품질을 평가함으로써 추가적 학습 데이터 셋으로 활용하기 위한 실험을 진행하였다. GAN을 이용하여 오버샘플 학습데이터를 생성하는 기법은 딥러닝 성능에 매우 중요한 영향을 미치는 학습데이터의 양을 획기적으로 보완할 수 있으므로 초기 데이터가 부족한 경우에 효과적으로 활용될 수 있을 것으로 기대한다.

반도체 자동화를 위한 빈피킹 로봇의 비전 기반 캘리브레이션 방법에 관한 연구 (A Study on Vision-based Calibration Method for Bin Picking Robots for Semiconductor Automation)

  • 구교문;김기현;김효영;심재홍
    • 반도체디스플레이기술학회지
    • /
    • 제22권1호
    • /
    • pp.72-77
    • /
    • 2023
  • In many manufacturing settings, including the semiconductor industry, products are completed by producing and assembling various components. Sorting out from randomly mixed parts and classification operations takes a lot of time and labor. Recently, many efforts have been made to select and assemble correct parts from mixed parts using robots. Automating the sorting and classification of randomly mixed components is difficult since various objects and the positions and attitudes of robots and cameras in 3D space need to be known. Previously, only objects in specific positions were grasped by robots or people sorting items directly. To enable robots to pick up random objects in 3D space, bin picking technology is required. To realize bin picking technology, it is essential to understand the coordinate system information between the robot, the grasping target object, and the camera. Calibration work to understand the coordinate system information between them is necessary to grasp the object recognized by the camera. It is difficult to restore the depth value of 2D images when 3D restoration is performed, which is necessary for bin picking technology. In this paper, we propose to use depth information of RGB-D camera for Z value in rotation and movement conversion used in calibration. Proceed with camera calibration for accurate coordinate system conversion of objects in 2D images, and proceed with calibration of robot and camera. We proved the effectiveness of the proposed method through accuracy evaluations for camera calibration and calibration between robots and cameras.

  • PDF

불법 주정차 단속을 위한 딥러닝 기반 이미지 인식 모델 (A Deep Learning-Based Image Recognition Model for Illegal Parking Enforcement)

  • 조민규;김민준;김재환;김진욱;황병선;이승우;선준호;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.59-64
    • /
    • 2024
  • 최근 다양한 산업 분야에서 드론과 인공지능 기술이 융합된 연구 사례가 진행되고 있다. 본 논문에서는 딥러닝 기반 객체 인식과 객체 판별 알고리즘을 이용하여 불법 주정차 차량 인식 모델을 제안한다. 객체 인식 알고리즘은 YOLOv8를 사용하였으며, 객체 판별 알고리즘은 ResNet18을 사용하였다. 제안된 모델은 일반 도로 상황에서 수집한 이미지 데이터를 이용하여 모델 학습을 수행하였고, 학습된 모델은 이미지 기반 불법 주정차를 판별하는데 높은 정확도를 보였다. 이를 통해 제안된 모델은 다양한 이미지로부터 불법 주정차 차량을 식별하기 위한 일반화 성능을 갖추고 있음을 확인하였다.

ONNX 기반 런타임 성능 분석: YOLO와 ResNet (ONNX-based Runtime Performance Analysis: YOLO and ResNet)

  • 김정현;이다은;최수빈;전경구
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.89-100
    • /
    • 2024
  • 컴퓨터 비전 분야에서 You Look Only Once(YOLO)와 ResNet 등의 모델은 실시간 성능과 높은 정확도로 인해 널리 사용되고 있다. 그러나 실제 환경에 이러한 모델들을 적용하려면 런타임 호환성, 메모리 사용량, 컴퓨팅 리소스 및 실시간 조건 등의 요소를 고려해야 한다. 본 연구에서는 세 가지 심층 모델 런타임 ONNX Runtime, TensorRT 및 OpenCV DNN의 특성을 비교하고, 2가지 모델에 대한 성능을 분석한다. 이러한 분석을 통해 현장 적용을 위한 런타임 선택에 기준을 제공해 주는 것이 논문의 목표이다. 실험에서는 차량 번호판 인식 및 분류 업무에 대해 소요 시간, 메모리 사용량, 정확도 평가 지표를 기반으로 런타임들을 비교한다. 실험 결과, ONNX Runtime은 복잡한 객체 탐지 성능이 우수하며, OpenCV DNN은 제한된 메모리 환경에 적합하고, TensorRT는 복잡한 모델의 실행 속도가 우수하다는 것을 보여준다.

메모리 참조 공간 연관성을 이용한 효율적인 쉬어-왑 분해 볼륨렌더링 (Efficient Shear-warp Volume Rendering using Spacial Locality of Memory Access)

  • 계희원;신영길
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권3_4호
    • /
    • pp.187-194
    • /
    • 2004
  • 쉬어-왑 분해 볼륨렌더링은 좋은 화질과 빠른 속도를 보이지만 대화형 분류 환경에서 메모리 참조 효율이 떨어지는 문제점이 있다. 본 논문에서는 대화형 분류 환경에서 효율적인 렌더링을 수행하기 위해 객체와 이미지에 대한 메모리 참조 공간 연관성을 갖는 알고리즘을 제안한다. 이를 위하여 쉬어-왑 분해에 회전을 추가한 확장 모델을 제안하여 객체와 이미지 모두에서 스캔라인 단위로 렌더링을 가능하게 한다. 또한 제안 모델이 가지고 있는 전후향 합성 혼란, 홀 발생, 계산 증가의 문제에 대한 원인을 제시하고 해결 방법을 보인다. 본 제안 모델은 렌더링 시 효율적 메모리 참조로 우수한 성능을 나타낸다.

Analyze weeds classification with visual explanation based on Convolutional Neural Networks

  • Vo, Hoang-Trong;Yu, Gwang-Hyun;Nguyen, Huy-Toan;Lee, Ju-Hwan;Dang, Thanh-Vu;Kim, Jin-Young
    • 스마트미디어저널
    • /
    • 제8권3호
    • /
    • pp.31-40
    • /
    • 2019
  • To understand how a Convolutional Neural Network (CNN) model captures the features of a pattern to determine which class it belongs to, in this paper, we use Gradient-weighted Class Activation Mapping (Grad-CAM) to visualize and analyze how well a CNN model behave on the CNU weeds dataset. We apply this technique to Resnet model and figure out which features this model captures to determine a specific class, what makes the model get a correct/wrong classification, and how those wrong label images can cause a negative effect to a CNN model during the training process. In the experiment, Grad-CAM highlights the important regions of weeds, depending on the patterns learned by Resnet, such as the lobe and limb on 미국가막사리, or the entire leaf surface on 단풍잎돼지풀. Besides, Grad-CAM points out a CNN model can localize the object even though it is trained only for the classification problem.

금속 표면의 결함 검출을 위한 영역 기반 CNN 기법 비교 (Comparison of Region-based CNN Methods for Defects Detection on Metal Surface)

  • 이민기;서기성
    • 전기학회논문지
    • /
    • 제67권7호
    • /
    • pp.865-870
    • /
    • 2018
  • A machine vision based industrial inspection includes defects detection and classification. Fast inspection is a fundamental problem for many applications of real-time vision systems. It requires little computation time and localizing defects robustly with high accuracy. Deep learning technique have been known not to be suitable for real-time applications. Recently a couple of fast region-based CNN algorithms for object detection are introduced, such as Faster R-CNN, and YOLOv2. We apply these methods for an industrial inspection problem. Three CNN based detection algorithms, VOV based CNN, Faster R-CNN, and YOLOv2, are experimented for defect detection on metal surface. The results for inspection time and various performance indices are compared and analysed.

백본 네트워크에 따른 사람 속성 검출 모델의 성능 변화 분석 (Analyzing DNN Model Performance Depending on Backbone Network )

  • 박천수
    • 반도체디스플레이기술학회지
    • /
    • 제22권2호
    • /
    • pp.128-132
    • /
    • 2023
  • Recently, with the development of deep learning technology, research on pedestrian attribute recognition technology using deep neural networks has been actively conducted. Existing pedestrian attribute recognition techniques can be obtained in such a way as global-based, regional-area-based, visual attention-based, sequential prediction-based, and newly designed loss function-based, depending on how pedestrian attributes are detected. It is known that the performance of these pedestrian attribute recognition technologies varies greatly depending on the type of backbone network that constitutes the deep neural networks model. Therefore, in this paper, several backbone networks are applied to the baseline pedestrian attribute recognition model and the performance changes of the model are analyzed. In this paper, the analysis is conducted using Resnet34, Resnet50, Resnet101, Swin-tiny, and Swinv2-tiny, which are representative backbone networks used in the fields of image classification, object detection, etc. Furthermore, this paper analyzes the change in time complexity when inferencing each backbone network using a CPU and a GPU.

  • PDF

외래잡초 분류 : 합성곱 신경망 기반 계층적 구조 (Exotic Weeds Classification : Hierarchical Approach with Convolutional Neural Network)

  • 유광현;이재원;보호앙트롱;당탄부;후이트완녁;이주환;신도성;김진영
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.81-92
    • /
    • 2019
  • 잡초는 농작물에 막대한 피해를 주는 주요한 개체이다. 잡초를 효과적으로 제거하기 위해서는 정확한 분류를 하고 제초제를 사용하여야 한다. 컴퓨팅 기술의 발전으로, 영상 기반의 기계학습 방법들이 이 분야에서 연구되고 있고, 특히 합성곱 신경망 기반의 모델들이 공공데이터에서 좋은 성능을 보이고 있다. 하지만 실제 응용단계에서는 많은 파라미터 수와 연산량 때문에 GPU와 같은 좋은 하드웨어 조건에서만 잘 작동된다. 본 논문은 계층적 구조 기반의 딥러닝 모델을 제안한다. 실험 결과, 제안된 모델은 적은 파라미터 수로 21개의 외래 잡초 종을 최대 97.2612%의 정확도로 성공적으로 분류하였다. 이를 통해 적은 수의 파라미터를 사용하는 제안된 모델은 네트워크 기반의 분류 서비스에서 적용될 수 있을 것으로 기대된다.

딥러닝 알고리즘과 2D Lidar 센서를 이용한 이미지 분류 (Image Classification using Deep Learning Algorithm and 2D Lidar Sensor)

  • 이준호;장혁준
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1302-1308
    • /
    • 2019
  • 본 논문은 CNN (Convolutional Neural Network)와 2D Lidar 센서에서 획득한 위치 데이터를 이용하여 이미지를 분류하는 방법을 제시한다. Lidar 센서는 데이터 정확도, 형상 왜곡 및 광 변화에 대한 강인성 측면에서의 이점으로 인해 무인 장치에 널리 사용되어 왔다. CNN 알고리즘은 하나 이상의 컨볼루션 및 풀링 레이어로 구성되며 이미지 분류에 만족스러운 성능을 보여 왔다. 본 논문에서는 학습 방법에 따라 다른 유형의 CNN 아키텍처들인 Gradient Descent (GD) 및 Levenberg-arquardt (LM)를 구현하였다. LM 방법에는 학습 파라메터를 업데이트하는 요소 중 하나인 Hessian 행렬 근사 빈도에 따라 두 가지 유형이 있다. LM 알고리즘의 시뮬레이션 결과는 GD 알고리즘보다 이미지 데이터의 분류 성능이 우수하였다. 또한 Hessian 행렬 근사가 더 빈번한 LM 알고리즘은 다른 유형의 LM 알고리즘보다 작은 오류를 보여주었다.