• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.031초

열화상 이미지를 이용한 배전 설비 검출 및 진단 (Detection and Diagnosis of Power Distribution Supply Facilities Using Thermal Images)

  • 김주식;최규남;이형근;강성우
    • 대한안전경영과학회지
    • /
    • 제22권1호
    • /
    • pp.1-8
    • /
    • 2020
  • Maintenance of power distribution facilities is a significant subject in the power supplies. Fault caused by deterioration in power distribution facilities may damage the entire power distribution system. However, current methods of diagnosing power distribution facilities have been manually diagnosed by the human inspector, resulting in continuous pole accidents. In order to improve the existing diagnostic methods, a thermal image analysis model is proposed in this work. Using a thermal image technique in diagnosis field is emerging in the various engineering field due to its non-contact, safe, and highly reliable energy detection technology. Deep learning object detection algorithms are trained with thermal images of a power distribution facility in order to automatically analyze its irregular energy status, hereby efficiently preventing fault of the system. The detected object is diagnosed through a thermal intensity area analysis. The proposed model in this work resulted 82% of accuracy of detecting an actual distribution system by analyzing more than 16,000 images of its thermal images.

피부 병변 분할을 위한 어텐션 기반 딥러닝 프레임워크 (Attention-based deep learning framework for skin lesion segmentation)

  • 아프난 가푸어;이범식
    • 스마트미디어저널
    • /
    • 제13권3호
    • /
    • pp.53-61
    • /
    • 2024
  • 본 논문은 기존 방법보다 우수한 성능을 달성하는 피부 병변 분할을 위한 새로운 M자 모양 인코더-디코더 아키텍처를 제안한다. 제안된 아키텍처는 왼쪽과 오른쪽 다리를 활용하여 다중 스케일 특징 추출을 가능하게 하고, 스킵 연결 내에서 어텐션 메커니즘을 통합하여 피부 병변 분할 성능을 더욱 향상시킨다. 입력 영상은 네 가지 다른 패치로 분할되어 입력되며 인코더-디코더 프레임워크 내에서 피부 병변 분할 성능의 향상된 처리를 가능하게 한다. 제안하는 방법에서 어텐션 메커니즘을 통해 입력 영상의 특징에 더 많은 초점을 맞추어 더욱 정교한 영상 분할 결과를 도출하는 것이다. 실험 결과는 제안된 방법의 효과를 강조하며, 기존 방법과 비교하여 우수한 정확도, 정밀도 및 Jaccard 지수를 보여준다.

차분 영상을 이용한 객체 추적 방법 (Object Tracking Method using Difference Images)

  • 조진환;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.165-168
    • /
    • 2021
  • 최근 딥러닝 환경의 확산으로 인하여 데이터셋 생성의 중요성이 높아지고 있다. 본 논문에서는 효율적인 데이터셋 생성을 위하여 객체의 회전 영상을 촬영하고 해당 영상에서의 객체 추적을 수행하는 방법을 설계하고 구현하고자 한다. 본 논문에서 구현하는 방법은 객체의 여러 각도를 촬영하기 위하여 객체를 회전시켜 영상 데이터를 획득하고 해당 영상에서의 배경 제거 및 차분 영상 처리 기법을 통하여 객체를 검출하고 추적하여 라벨링을 수행하여 사용자가 현재 프레임에서의 객체 추적 결과를 모니터링할 수 있도록 화면으로 보여주며, 추후 데이터셋으로 활용하기 위하여 이미지 내에서의 객체 위치 데이터를 반환하도록 구현하였다.

  • PDF

SSResUnet 모델을 이용한 위성 영상 토지피복분류 (Land Cover Classification of Satellite Image using SSResUnet Model)

  • 강주형;김민성;김성진;곽수영
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.456-463
    • /
    • 2023
  • 본 논문에서는 사용자의 개입없이 고해상도 위성 영상을 활용하여 정밀한 토지피복분류를 위해 U-Net 네트워크 모델에 SPADE 구조를 결합한 SSResUNet 모델을 제안한다. 제안하는 네트워크는 위성 영상의 공간적 특성을 보존하여 복잡도가 높은 환경에서도 강인한 분류모델이라는 장점이 있다. 다목적실용위성 3A 영상을 통해 학습한 결과 기존 U-Net, U-Net++ 대비 뛰어난 결과를 보였으며 평균 IoU 76.10, Dice 86.22의 성능을 도출하였다.

Classification of Diabetic Retinopathy using Mask R-CNN and Random Forest Method

  • Jung, Younghoon;Kim, Daewon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 논문에서는 딥러닝 기법의 하나인 Mask R-CNN과 랜덤포레스트 분류기를 이용해 당뇨병성 망막병증의 병리학적인 특징을 검출하고 분석하여 자동 진단하는 시스템을 연구하였다. 당뇨병성 망막병증은 특수장비로 촬영한 안저영상을 통해 진단할 수 있는데 밝기, 색조 및 명암은 장치에 따라 다를 수 있으며 안과 전문의의 의료적 판단을 도울 인공지능을 이용한 자동진단 시스템 연구와 개발이 가능하다. 이 시스템은 미세혈관류와 망막출혈을 Mask R-CNN 기법으로 검출하고, 후처리 과정을 거쳐 랜덤포레스트 분류기를 이용하여 안구의 정상과 비정상 상태를 진단한다. Mask R-CNN 알고리즘의 검출 성능 향상을 위해 이미지 증강 작업을 실시하여 학습을 진행하였으며 검출 정확도 측정을 위한 평가지표로는 다이스 유사계수와 Mean Accuracy를 사용하였다. 비교군으로는 Faster R-CNN 기법을 사용하였고 본 연구를 통한 검출 성능은 평균 90%의 다이스 계수를 통한 정확도를 나타내었으며 Mean Accuracy의 경우 91% 정확도의 검출 성능을 보였다. 검출된 병리증상을 토대로 랜덤포레스트 분류기를 학습하여 당뇨병성 망막 병증을 진단한 경우 99%의 정확도를 보였다.

버섯 전후면과 꼭지부 상태의 자동 인식 (Automatic Recognition of the Front/Back Sides and Stalk States for Mushrooms(Lentinus Edodes L.))

  • 황헌;이충호
    • Journal of Biosystems Engineering
    • /
    • 제19권2호
    • /
    • pp.124-137
    • /
    • 1994
  • Visual features of a mushroom(Lentinus Edodes, L.) are critical in grading and sorting as most agricultural products are. Because of its complex and various visual features, grading and sorting of mushrooms have been done manually by the human expert. To realize the automatic handling and grading of mushrooms in real time, the computer vision system should be utilized and the efficient and robust processing of the camera captured visual information be provided. Since visual features of a mushroom are distributed over the front and back sides, recognizing sides and states of the stalk including the stalk orientation from the captured image is a prime process in the automatic task processing. In this paper, the efficient and robust recognition process identifying the front and back side and the state of the stalk was developed and its performance was compared with other recognition trials. First, recognition was tried based on the rule set up with some experimental heuristics using the quantitative features such as geometry and texture extracted from the segmented mushroom image. And the neural net based learning recognition was done without extracting quantitative features. For network inputs the segmented binary image obtained from the combined type automatic thresholding was tested first. And then the gray valued raw camera image was directly utilized. The state of the stalk seriously affects the measured size of the mushroom cap. When its effect is serious, the stalk should be excluded in mushroom cap sizing. In this paper, the stalk removal process followed by the boundary regeneration of the cap image was also presented. The neural net based gray valued raw image processing showed the successful results for our recognition task. The developed technology through this research may open the new way of the quality inspection and sorting especially for the agricultural products whose visual features are fuzzy and not uniquely defined.

  • PDF

Multi-classification Sensitive Image Detection Method Based on Lightweight Convolutional Neural Network

  • Yueheng Mao;Bin Song;Zhiyong Zhang;Wenhou Yang;Yu Lan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권5호
    • /
    • pp.1433-1449
    • /
    • 2023
  • In recent years, the rapid development of social networks has led to a rapid increase in the amount of information available on the Internet, which contains a large amount of sensitive information related to pornography, politics, and terrorism. In the aspect of sensitive image detection, the existing machine learning algorithms are confronted with problems such as large model size, long training time, and slow detection speed when auditing and supervising. In order to detect sensitive images more accurately and quickly, this paper proposes a multiclassification sensitive image detection method based on lightweight Convolutional Neural Network. On the basis of the EfficientNet model, this method combines the Ghost Module idea of the GhostNet model and adds the SE channel attention mechanism in the Ghost Module for feature extraction training. The experimental results on the sensitive image data set constructed in this paper show that the accuracy of the proposed method in sensitive information detection is 94.46% higher than that of the similar methods. Then, the model is pruned through an ablation experiment, and the activation function is replaced by Hard-Swish, which reduces the parameters of the original model by 54.67%. Under the condition of ensuring accuracy, the detection time of a single image is reduced from 8.88ms to 6.37ms. The results of the experiment demonstrate that the method put forward has successfully enhanced the precision of identifying multi-class sensitive images, significantly decreased the number of parameters in the model, and achieved higher accuracy than comparable algorithms while using a more lightweight model design.

X-ray 영상에서 VHS와 콥 각도 자동 추출을 위한 흉추 분할 기법 (A Thoracic Spine Segmentation Technique for Automatic Extraction of VHS and Cobb Angle from X-ray Images)

  • 이예은;한승화;이동규;김호준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권1호
    • /
    • pp.51-58
    • /
    • 2023
  • 본 논문에서는 X-ray 영상에서 의료 진단지표를 자동으로 추출하기 위한 조직분할 기법을 제안한다. 척추질환이나 심장질환에 대한 진단지표로서, 흉추-심장 비율이나 콥 각도 등의 지표를 산출하기 위해서는 흉부 X-ray 영상으로부터 흉추, 용골 및 심장의 영역을 정확하게 분할하는 과정이 필요하다. 본 연구에서는 이를 위하여 계층별로 영상의 고해상도의 표현과 저해상도의 특징지도로 변환되는 구조가 병렬적으로 연결되는 형태의 심층신경망 모델을 채택하였다. 이러한 구조는 영상에서 세부 조직의 상대적인 위치정보가 분할 과정에 효과적으로 반영될 수 있게 한다. 또한 픽셀 정보와 객체 정보가 다단계의 과정으로 상호 작용되는 OCR 모듈과, 네트워크의 각 채널이 서로 다른 가중치 값으로 반영되도록 하는 채널 어텐션 모듈을 결합하여 학습 성능을 개선할 수 있음을 보인다. 부수적으로 X-ray 영상에서 피사체의 위치 변화, 형태의 변형 및 크기 변이 등에도 강인한 성능을 제공하기 위하여 학습데이터를 증강하는 방법을 제시하였다. 총 145개의 인체 흉부 X-ray 영상과, 총 118개의 동물 X-ray 영상을 사용한 실험을 통하여 제안된 이론의 타당성을 평가하였다.

Defect Diagnosis and Classification of Machine Parts Based on Deep Learning

  • Kim, Hyun-Tae;Lee, Sang-Hyeop;Wesonga, Sheilla;Park, Jang-Sik
    • 한국산업융합학회 논문집
    • /
    • 제25권2_1호
    • /
    • pp.177-184
    • /
    • 2022
  • The automatic defect sorting function of machinery parts is being introduced to the automation of the manufacturing process. In the final stage of automation of the manufacturing process, it is necessary to apply computer vision rather than human visual judgment to determine whether there is a defect. In this paper, we introduce a deep learning method to improve the classification performance of typical mechanical parts, such as welding parts, galvanized round plugs, and electro galvanized nuts, based on the results of experiments. In the case of poor welding, the method to further increase the depth of layer of the basic deep learning model was effective, and in the case of a circular plug, the surrounding data outside the defective target area affected it, so it could be solved through an appropriate pre-processing technique. Finally, in the case of a nut plated with zinc, since it receives data from multiple cameras due to its three-dimensional structure, it is greatly affected by lighting and has a problem in that it also affects the background image. To solve this problem, methods such as two-dimensional connectivity were applied in the object segmentation preprocessing process. Although the experiments suggested that the proposed methods are effective, most of the provided good/defective images data sets are relatively small, which may cause a learning balance problem of the deep learning model, so we plan to secure more data in the future.

슈퍼 픽셀기반 무인항공 영상 영역분할 및 분류 (Super-Pixel-Based Segmentation and Classification for UAV Image)

  • 김인규;황승준;나종필;박승제;백중환
    • 한국항행학회논문지
    • /
    • 제18권2호
    • /
    • pp.151-157
    • /
    • 2014
  • 최근 무인항공기는 군사용뿐만 아니라 민간용으로도 많이 사용되고 있다. 무인항공기는 미리 입력된 좌표에 따라 GPS 정보를 이용하여 자동비행한다. 그러나 재밍이나 외부 교란에 의해 GPS 신호를 수신할 수 없으면 자동비행이 불가능 해진다. 이러한 문제를 해결하기 위한 한 방법으로, 본 연구에서는 무인기에 탑재된 카메라로부터 촬영된 영상으로부터 실시간으로 특정 영역을 검출하고 인식하는 알고리즘을 제안한다. 실시간 분류와 기계 학습에 사용할 특징을 추출하기 위한 전처리 과정으로 군집화 알고리즘인 그래프 기반 분할 알고리즘을 사용하여 슈퍼 픽셀화 하였다. 다양한 컬러모델 및 혼합 컬러 모델을 비교 분석하여 가장 이상적인 혼합 모델을 선정하고, 분류 알고리즘으로는 적은 트레이닝 데이터로도 뛰어난 분류 성능을 낼 수 있는 서포트 벡터 머신을 사용하였다. 무인항공 영상으로부터 18개의 컬러와 텍스처 특징 벡터를 추출하고 학습 및 예측과정을 통해 하천, 비닐하우스, 논 등 3 종류의 영역을 실시간으로 분류하였다.