• 제목/요약/키워드: Deep learning Convergence image processing

검색결과 91건 처리시간 0.035초

A deep and multiscale network for pavement crack detection based on function-specific modules

  • Guolong Wang;Kelvin C.P. Wang;Allen A. Zhang;Guangwei Yang
    • Smart Structures and Systems
    • /
    • 제32권3호
    • /
    • pp.135-151
    • /
    • 2023
  • Using 3D asphalt pavement surface data, a deep and multiscale network named CrackNet-M is proposed in this paper for pixel-level crack detection for improvements in both accuracy and robustness. The CrackNet-M consists of four function-specific architectural modules: a central branch net (CBN), a crack map enhancement (CME) module, three pooling feature pyramids (PFP), and an output layer. The CBN maintains crack boundaries using no pooling reductions throughout all convolutional layers. The CME applies a pooling layer to enhance potential thin cracks for better continuity, consuming no data loss and attenuation when working jointly with CBN. The PFP modules implement direct down-sampling and pyramidal up-sampling with multiscale contexts specifically for the detection of thick cracks and exclusion of non-crack patterns. Finally, the output layer is optimized with a skip layer supervision technique proposed to further improve the network performance. Compared with traditional supervisions, the skip layer supervision brings about not only significant performance gains with respect to both accuracy and robustness but a faster convergence rate. CrackNet-M was trained on a total of 2,500 pixel-wise annotated 3D pavement images and finely scaled with another 200 images with full considerations on accuracy and efficiency. CrackNet-M can potentially achieve crack detection in real-time with a processing speed of 40 ms/image. The experimental results on 500 testing images demonstrate that CrackNet-M can effectively detect both thick and thin cracks from various pavement surfaces with a high level of Precision (94.28%), Recall (93.89%), and F-measure (94.04%). In addition, the proposed CrackNet-M compares favorably to other well-developed networks with respect to the detection of thin cracks as well as the removal of shoulder drop-offs.

Computer Vision-Based Measurement Method for Wire Harness Defect Classification

  • Yun Jung Hong;Geon Lee;Jiyoung Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.77-84
    • /
    • 2024
  • 본 논문에서는 컴퓨터 비전을 사용하여 6가지 측정값(눌린 단자의 길이, 단자 끝의 치수(폭), 눌린부분(와이어 부분, 코어 부분)의 폭)을 계산하여 와이어 하네스의 결함을 정확하고 빠르게 탐지할 것을 제안한다. 두 가지 유형의 데이터에서 Harris 코너 검출을 활용하여 물체의 위치를 탐지하고 측정 영역별 특징과 배경과 물체 사이의 음영 차이를 활용하여 각 샘플의 기울기를 반영하는 측정값을 추출하기 위한 기준점을 생성한다. 이후 유클리드 거리 방법과 보정 계수를 사용하여 예측값을 계산하는 방법을 통해 와이어의 위치 변화에 관계 없이 측정값을 예측할 수 있다. 각 측정 유형별로 99.1%, 98.7%, 92.6%, 92.5%, 99.9%, 99.7% 정확도를 달성하였으며, 모든 측정값에서 평균 97%의 정확도로 우수한 결과를 얻었다. 해당 검사 방법은 기존 검사 방법인 육안 검사의 문제점을 보완하고, 작은 양의 데이터만을 이용하여 우수한 결과를 도출 가능하다. 또한 이미지 처리만 이용하기 때문에 딥러닝 방법보다 더 적은 데이터와 비용으로 적용 가능할 것으로 기대된다.

항로표지 기반의 부착생물 정보 생성에 관한 연구 (A Study on the Generation of Fouling Organism Information Based Aids to Navigation)

  • 이신걸;송재욱;유윤재;정민
    • 해양환경안전학회지
    • /
    • 제29권5호
    • /
    • pp.456-461
    • /
    • 2023
  • 우리나라 해양생태계의 현황을 조사 및 분석하여 해양을 지속하게 이용할 수 있도록 하며 해양생태를 보전하고 관리할 수 있도록 국가 해양생태계 종합조사를 해양수산부의 위탁을 받아 해양환경공단에서 진행하고 있다. 국가 해양생태계 종합조사는 주요 조사정점을 설정하여 한반도 주변 해역의 생태계 변화를 조사하고 있지만, 정점이 연안을 중심으로 설정되어 근해역 등 조사범위 확대가 필요한 실정이다. 한편 해양수산부 항로표지과에서는 항로표지 인양점검 시 부착생물의 사진을 촬영하여 제공함으로써 국가 해양생태계 종합 조사를 지원하고 있지만, 해양환경공단과 협의하여 지정된 등부표에 한해서 부착생물 사진을 제공한다. 이에 항로표지를 국가 해양생태계 종합조사의 정점으로 활용할 수 있도록, 항로표지 및 등부표 인양점검 시 딥러닝 기반의 영상처리 알고리즘을 활용하여 부착생물의 정보를 생성하는 연구를 진행했다. 항로표지를 국가 해양생태계 종합조사의 정점으로 활용한다면 항로표지의 활용 가치를 제고하고 우리나라 근해의 이상 해황 및 생태계 변화를 분석할 수 있는 기초자료로 활용할 수 있다.

교량 구조물 손상탐지를 위한 Open Set Recognition 기반 다중손상 인식 모델 개발 (Development of Open Set Recognition-based Multiple Damage Recognition Model for Bridge Structure Damage Detection)

  • 김영남;조준상;김준경;김문현;김진평
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.117-126
    • /
    • 2022
  • 현재 국내 교량 구조물은 지속적으로 증가 및 대형화되고 있으며 그에 따라 공용된 지 30년 이상 된 노후 교량도 꾸준히 늘어나고 있다. 교량 노후화 문제는 국내뿐 아니라 전 세계적으로도 심각한 사회 문제로 다루어지고 있으며, 기존 인력 위주의 점검 방식은 그 한계점을 드러내고 있다. 최근 들어 딥러닝 기반의 영상처리 알고리즘을 활용한 각종 교량 손상탐지 연구가 이루어지고 있지만 교량 손상 데이터 세트의 한계로 인하여 주로 균열 1종에 국한된 교량 손상탐지 연구가 대부분이고, 이 또한 Close set 분류모델 기반 탐지방식으로서 실제 교량 촬영 영상에 적용했을 시 배경이나 기타 객체 등 학습되지 않은 클래스의 입력 이미지들로 인하여 심각한 오인식 문제가 발생할 수 있다. 본 연구에서는 균열 포함 5종의 교량 손상을 정의 및 데이터 세트를 구축해서 딥러닝 모델로 학습시키고, OpenMax 알고리즘을 적용한 Open set 인식 기반 교량 다중손상 인식 모델을 개발했다. 그리고 학습되지 않은 이미지들을 포함하고 있는 Open set에 대한 분류 및 인식 성능평가를 수행한 후 그 결과를 분석했다.

YOLO 네트워크를 활용한 전이학습 기반 객체 탐지 알고리즘 (Transfer Learning-based Object Detection Algorithm Using YOLO Network)

  • 이동구;선영규;김수현;심이삭;이계산;송명남;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.219-223
    • /
    • 2020
  • 딥 러닝 기반 객체 탐지 및 영상처리 분야에서 모델의 인식률과 정확도를 보장하기 위해 다량의 데이터 확보는 필수적이다. 본 논문에서는 학습데이터가 적은 경우에도 인공지능 모델의 높은 성능을 도출하기 위해 전이학습 기반 객체탐지 알고리즘을 제안한다. 본 논문에서는 객체탐지를 위해 사전 학습된 Resnet-50 네트워크와 YOLO(You Only Look Once) 네트워크를 결합한 전이학습 네트워크를 구성하였다. 구성된 전이학습 네트워크는 Leeds Sports Pose 데이터셋의 일부를 활용하여 이미지에서 가장 넓은 영역을 차지하고 있는 사람을 탐지하는 네트워크로 학습을 진행하였다. 실험결과는 탐지율 84%, 탐지 정확도 97%를 기록하였다.

Lightweight Single Image Super-Resolution Convolution Neural Network in Portable Device

  • Wang, Jin;Wu, Yiming;He, Shiming;Sharma, Pradip Kumar;Yu, Xiaofeng;Alfarraj, Osama;Tolba, Amr
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.4065-4083
    • /
    • 2021
  • Super-resolution can improve the clarity of low-resolution (LR) images, which can increase the accuracy of high-level compute vision tasks. Portable devices have low computing power and storage performance. Large-scale neural network super-resolution methods are not suitable for portable devices. In order to save the computational cost and the number of parameters, Lightweight image processing method can improve the processing speed of portable devices. Therefore, we propose the Enhanced Information Multiple Distillation Network (EIMDN) to adapt lower delay and cost. The EIMDN takes feedback mechanism as the framework and obtains low level features through high level features. Further, we replace the feature extraction convolution operation in Information Multiple Distillation Block (IMDB), with Ghost module, and propose the Enhanced Information Multiple Distillation Block (EIMDB) to reduce the amount of calculation and the number of parameters. Finally, coordinate attention (CA) is used at the end of IMDB and EIMDB to enhance the important information extraction from Spaces and channels. Experimental results show that our proposed can achieve convergence faster with fewer parameters and computation, compared with other lightweight super-resolution methods. Under the condition of higher peak signal-to-noise ratio (PSNR) and higher structural similarity (SSIM), the performance of network reconstruction image texture and target contour is significantly improved.

이동 객체 검출을 통한 승객 인원 개수에 대한 연구 (A study on counting number of passengers by moving object detection)

  • 유상현
    • 인터넷정보학회논문지
    • /
    • 제21권2호
    • /
    • pp.9-18
    • /
    • 2020
  • 영상 처리 기법을 이용한 영상 인식 분야는 버스 승차 및 하차 시에 승객을 움직이는 객체로 검출하고 개수하는 방법이 연구되고 있다. 이러한 기술 중에는 인공지능 기법의 하나인 딥러닝 기법이 사용되고 있다. 또 다른 방법으로 스테레오 비전 카메라를 이용하여 객체를 검출하는 방법도 사용되고 있다. 그러나 이러한 방법들은 객체를 검출할 때 사용되는 장비의 연산량이 많이 들어 고가의 하드웨어 장비가 필요하다. 그러나 대중교통 중 하나인 버스 승객을 검출하기 위해 상대적으로 연산량이 적은 기법을 이용하여 다양한 장비에 맞는 영상 처리 기술이 필요하다. 이에 본 논문에서는 다양한 장비에 맞는 이동 객체 검출 기법 중 배경 제거를 통한 객체의 윤곽선을 검출하여 대중교통 중의 하나인 버스에 탑승객의 수를 효율적으로 획득 할 수 있는 기법을 제안한다. 실험 결과 스테레오 비전을 장착한 장비보다 더 저사양의 장비에서 약 70%의 정확도로 승객을 개수하였다.

Design of visitor counting system using edge computing method

  • Kim, Jung-Jun;Kim, Min-Gyu;Kim, Ju-Hyun;Lee, Man-Gi;Kim, Da-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.75-82
    • /
    • 2022
  • 우리 주위에 다양한 전시관, 쇼핑몰, 테마파크 등이 있으며 실제 전시하고 있는 전시물, 콘텐츠에 대한 관심도, 흥미도에 대한 분석은 설문 정도로만 이루어지고 있다. 이러한 설문은 주로 피설문자의 주관적인 기억에 의존하고 있어서 잘못된 통계 결과를 얻을 수 있는 문제가 있다. 따라서 방문객의 동선 추적과 수를 카운팅 하여 흥미가 떨어지는 전시 공간 파악이 가능하며 이를 통해 교체가 필요한 전시물에 대해 정량적 자료로 사용이 가능하다. 본 논문에서는 딥러닝 기반의 인공지능 알고리즘을 이용하여 방문객을 인식하고, 인식된 방문객에 아이디를 할당하여 이를 지속적으로 추적하는 방식으로 동선을 파악한다. 이때 방문객이 카운팅 라인을 통과하게 되면 그 수를 카운팅 하고, 데이터는 서버에 전송하여 통합 관리할 수 있도록 시스템을 설계하였다.

YOLO 기반 개체 검출과 Node.js 서버를 이용한 반려견 행동 분류 시스템 구현 (Implementation of a Classification System for Dog Behaviors using YOLI-based Object Detection and a Node.js Server)

  • 조용화;이혁재;김영훈
    • 융합신호처리학회논문지
    • /
    • 제21권1호
    • /
    • pp.29-37
    • /
    • 2020
  • 본 논문은 실시간 영상 분석을 통해서 반려견에 대한 객체를 추출해 내고, 추출된 이미지로부터 반려견 행동을 분류하는 방법을 구현한다. 반려견 객체 탐지를 위해서 Darknet YOLO를 사용하였으며, 추출된 이미지로부터 행동 패턴 분류는 구글에서 제공하고 있는 Teachable Machine을 이용하였다. 학습된 Teachable Machine은 구글 드라이브에 저장되어 node.js 서버 상에서 ml5.js로 구현하여 사용할 수 있다. 분류된 행동 패턴 결과는 사용자의 스마트 폰 또는 PC로 실시간 전송되며, 언제 어디서든 확인 가능할 수 있게 node.js 서버에서 socket.io 모듈을 사용해서 상호반응 웹 서버를 구현하였다.

보행자 및 차량 검지를 위한 레이더 영상 융복합 시스템 연구 (A Study on Radar Video Fusion Systems for Pedestrian and Vehicle Detection)

  • 조성윤;윤여환
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.197-205
    • /
    • 2024
  • 자율주행 자동차 개발 및 상용화에 있어서 주행안전도 확보가 가장 중요한 시점에서 이를 위해 전방 및 주행차량 주변에 존재하는 다양한 정적/동적 차량의 인식과 검출 성능을 고도화 및 최적화하기 위한 AI, 빅데이터 기반 알고리즘개발 등이 연구되고 있다. 하지만 레이더와 카메라의 고유한 장점을 활용하여 동일한 차량으로 인식하기 위한 연구 사례들이 많이 있지만, 딥러닝 영상 처리 기술을 이용하지 않거나, 레이더의 성능상의 문제로 짧은 거리만 동일한 표적으로 감지하고 있다. 따라서 레이더 장비와 카메라 장비에서 수집할 수 있는 데이터셋을 구성하고, 데이터셋의 오차를 계산하여 동일한 표적으로 인식하는 융합 기반 차량 인식 방법이 필요하다. 본 논문에서는 레이더와 CCTV(영상) 설치 위치에 따라 동일한 객체로 판단하기에 데이터 오차가 발생하기 때문에 설치한 위치에 따라 위치 정보를 연동할 수 있는 기술 개발을 목표로 한다.