• 제목/요약/키워드: Deep Learning based System

검색결과 1,207건 처리시간 0.033초

자동화 균열 탐지 시스템을 위한 딥러닝 모델에 관한 연구 (Deep Learning Models for Autonomous Crack Detection System)

  • 지홍근;김지나;황시정;김도건;박은일;김영석;류승기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.161-168
    • /
    • 2021
  • 균열은 건물, 교량, 도로, 수송관 등의 기반시설의 안전성에 영향을 주는 요소이다. 본 연구에서는 검사 비용과 시간을 줄일 수 있는 자동화된 균열 탐지 시스템을 다룬다. 환경과 표면에 강건한 시스템을 구성하기 위해서, 본 연구에서는 여러 사전 연구에서 사용된 다양한 표면의 균열 데이터 셋을 수집하여 통합 데이터 셋을 구축하였다. 이후, 컴퓨터 비전 분야에 높은 성능을 발휘하는 VGG, ResNet, WideResNet, ResNeXt, DenseNet, EfficientNet 딥러닝 모델을 적용하였다. 통합 데이터 셋은 훈련 집합(80%)과 테스트 집합(20%)으로 나누어 모델 성능을 검증하기 위해서 사용했다. 실험 결과, DenseNet121 모델이 높은 마라미터 효율성을 가지면서도 테스트 집합에 대해 96.20%의 정확도를 달성하여 가장 높은 성능을 보여주었다. 딥러닝 모델의 균열 검출 성능 검증을 통해, DenseNet121를 활용하여 컴퓨팅 자원이 적은 소형 디바이스에서도 높은 균열 검출 성능을 보이는 탐지 시스템을 구축이 가능함을 확인했다.

UAV를 활용한 실시간 교통량 분석을 위한 딥러닝 기법의 적용 (Application of Deep Learning Method for Real-Time Traffic Analysis using UAV)

  • 박홍련;변성훈;이한성
    • 한국측량학회지
    • /
    • 제38권4호
    • /
    • pp.353-361
    • /
    • 2020
  • 급격한 도시화로 인해 출퇴근 시간의 차량 정체, 상시 정체지역 발생 등 다양한 교통문제들이 발생하고 있다. 이러한 교통문제들을 해결하기 위해서는 신속·정확한 교통량 예측 및 분석이 필요하다. ITS (Intelligent Transportation System)는 최신 ICT (Information and Communications Technology) 기술들을 활용하여 최적의 교통관리를 수행하는 시스템이며, 다양한 기법을 통해 신속·정확한 교통량을 분석하기 위한 많은 연구가 수행 되었다. 본 연구에서는 높은 정확도로 실시간 교통량 분석을 위해 UAV (Unmanned Aerial Vehicle) 동영상을 활용한 딥러닝(deep learning) 기반의 차량탐지기법을 제안하고자 한다. 이를 위해, UAV를 활용하여 다양한 차량이 통행하는 교차로에서 학습 및 검증에 필요한 정사 동영상 촬영을 수행하였으며, 승용차(sedan), 트럭(truck), 버스(bus)로 분류하여 차량을 학습시켰다. 딥러닝 알고리즘은 대표적인 객체탐지 알고리즘 중의 하나인 YOLOv3 (You Only Look Once V3)를 이용하였으며, 실험결과 전체 차량 검출율은 90.21%이며, 정확도와 재현율은 각각 95.10%와 85.79%이다. 본 연구를 통하여, 드론을 이용한 영상으로부터 차량 탐지를 통한 실시간 교통량 분석이 가능함을 확인하였다.

다중 도메인 비전 시스템 기반 제조 환경 안전 모니터링을 위한 동적 3D 작업자 자세 정합 기법 (Dynamic 3D Worker Pose Registration for Safety Monitoring in Manufacturing Environment based on Multi-domain Vision System)

  • 최지동;김민영;김병학
    • 대한임베디드공학회논문지
    • /
    • 제18권6호
    • /
    • pp.303-310
    • /
    • 2023
  • A single vision system limits the ability to accurately understand the spatial constraints and interactions between robots and dynamic workers caused by gantry robots and collaborative robots during production manufacturing. In this paper, we propose a 3D pose registration method for dynamic workers based on a multi-domain vision system for safety monitoring in manufacturing environments. This method uses OpenPose, a deep learning-based posture estimation model, to estimate the worker's dynamic two-dimensional posture in real-time and reconstruct it into three-dimensional coordinates. The 3D coordinates of the reconstructed multi-domain vision system were aligned using the ICP algorithm and then registered to a single 3D coordinate system. The proposed method showed effective performance in a manufacturing process environment with an average registration error of 0.0664 m and an average frame rate of 14.597 per second.

Feasibility of fully automated classification of whole slide images based on deep learning

  • Cho, Kyung-Ok;Lee, Sung Hak;Jang, Hyun-Jong
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제24권1호
    • /
    • pp.89-99
    • /
    • 2020
  • Although microscopic analysis of tissue slides has been the basis for disease diagnosis for decades, intra- and inter-observer variabilities remain issues to be resolved. The recent introduction of digital scanners has allowed for using deep learning in the analysis of tissue images because many whole slide images (WSIs) are accessible to researchers. In the present study, we investigated the possibility of a deep learning-based, fully automated, computer-aided diagnosis system with WSIs from a stomach adenocarcinoma dataset. Three different convolutional neural network architectures were tested to determine the better architecture for tissue classifier. Each network was trained to classify small tissue patches into normal or tumor. Based on the patch-level classification, tumor probability heatmaps can be overlaid on tissue images. We observed three different tissue patterns, including clear normal, clear tumor and ambiguous cases. We suggest that longer inspection time can be assigned to ambiguous cases compared to clear normal cases, increasing the accuracy and efficiency of histopathologic diagnosis by pre-evaluating the status of the WSIs. When the classifier was tested with completely different WSI dataset, the performance was not optimal because of the different tissue preparation quality. By including a small amount of data from the new dataset for training, the performance for the new dataset was much enhanced. These results indicated that WSI dataset should include tissues prepared from many different preparation conditions to construct a generalized tissue classifier. Thus, multi-national/multi-center dataset should be built for the application of deep learning in the real world medical practice.

무인기 탑재 다중 센서 기반 국지 산불 감시 및 상황 대응 플랫폼 설계 및 구현 (Design and Implementation of Local Forest Fire Monitoring and Situational Response Platform Using UAV with Multi-Sensor)

  • 신원재;이용태
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.626-632
    • /
    • 2017
  • 최근의 해마다 발생하는 자연재해를 살펴보면 사망, 실종과 같은 심각한 인명 피해와 더불어 수억 원에 달하는 재산피해가 동반된다. 이를 극복하기 위해 사회적, 경제적 손실을 최소화할 수 있는 ICT 기반의 자연재난 감시 및 대응 기술 개발에 대한 관심도가 높아지고 있다. 제안하는 플랫폼은 무인기에 탑재된 다중 센서 데이터의 실시간 처리 분석을 통해 국지적 산불 재난의 감지 및 상황대응을 지원하고, 통합경보 시스템과 연동하여 대국민 재난 정보 전달 서비스를 제공하는 서비스이다. 본 논문에서는 재난 영상의 획득, 분석, 대응을 수행하는 재난 감시 및 대응 플랫폼의 세부 기능들에 대해서 소개하고, 재난 인지에 핵심요소 기술인 Deep Learning 기반의 산불 영상 분석 기술을 제안한다. 제안하는 Deep Learning 기반 재난 영상 분석은 과거로부터 반복적으로 발생하는 재난이 촬영된 영상 정보를 사전에 미리 학습함으로써, 새롭게 획득한 재난 영상에 대한 재난 발생 여부를 판단한다. 제안하는 산불 영상 분석 알고리즘에 대한 실험 결과를 확인하여 제안하는 기법의 성능을 검증한다.

시맨틱 갭을 줄이기 위한 딥러닝과 행위 온톨로지의 결합 기반 이미지 검색 (Image retrieval based on a combination of deep learning and behavior ontology for reducing semantic gap)

  • 이승;정혜욱
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권11호
    • /
    • pp.1133-1144
    • /
    • 2019
  • 최근 스마트 기기의 발전으로 인터넷상에 존재하는 이미지 데이터의 양이 급속하게 증가하는 상황에서 효과적인 이미지 검색을 위한 다양한 방법들이 연구되고 있다. 기존의 이미지 검색 방법들은 이미지에 존재하는 물체들을 단순하게 검출하여 각 물체들의 라벨 정보에 근거한 검색을 수행하기 때문에 사용자가 원하는 이미지와 검색 결과로 얻은 이미지 간에 의미적 차이인 시맨틱 갭(Semantic Gap)이 발생된다. 이미지 검색에서 발생하는 시맨틱 갭을 줄이기 위해, 본 논문에서는 딥러닝 기반의 다중 객체 분류 모듈과 사람의 행위를 분류하는 모듈을 연결하고, 이 모듈들에 행위 온톨로지를 결합하였다. 즉, 딥러닝과 행위 온톨로지의 결합을 기반으로 객체들 간의 연관성을 고려한 이미지 검색 시스템을 제안한다. 이미지에 포함된 동적인 행위를 고려하기 위해 Walking과 Running 데이터를 이용하여 실험한 결과를 분석하였다. 제안한 방법은 향후 이미지 검색 결과의 정확도를 높일 수 있는 영상의 자동 주석 생성 연구에 확장하여 적용할 수 있다.

나카가미 페이딩 채널에서 딥러닝 기반 송신 전력 제어 기법을 이용하는 무선통신 시스템에 대한 성능 분석 (Performance Analysis of Wireless Communication Systems Using Deep Learning Based Transmit Power Control in Nakagami Fading Channels)

  • 김동현;김동연;이인호
    • 한국정보통신학회논문지
    • /
    • 제24권6호
    • /
    • pp.744-750
    • /
    • 2020
  • 본 논문에서는 무선통신 시스템의 주파수 효율과 에너지 효율을 개선하기 위하여 딥러닝 기반의 송신 전력 제어 기법을 제안한다. 무선통신 시스템에서 다수의 송수신기의 위치는 균일 분포를 따르고 송수신기 간 채널은 나카가미 페이딩 채널을 가정하여 제안하는 송신 전력 제어 기법에 대한 주파수 효율과 에너지 효율의 성능을 분석한다. 제안하는 송신 전력 제어 기법은 딥러닝 기반의 학습에서 주파수 효율과 에너지 효율을 개선하기 위하여 배치 정규화 기법을 이용한다. 시뮬레이션을 통해 송수신기의 위치 범위를 제한하는 지형적 크기와 나카가미 페이딩 지수에 대하여 제안하는 송신 전력 제어 기법과 기존의 송신 전력 제어 기법의 주파수 효율과 에너지 효율의 성능 결과를 비교한다. 성능 결과의 비교를 통해 제안하는 기법이 기존의 기법보다 우수한 성능을 제공함을 입증한다.

딥러닝 학습을 이용한 한글 글꼴 자동 제작 시스템에서 글자 쌍의 매핑 기준 평가 (Evaluation of Criteria for Mapping Characters Using an Automated Hangul Font Generation System based on Deep Learning)

  • 전자연;지영서;박동연;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권7호
    • /
    • pp.850-861
    • /
    • 2020
  • Hangul is a language that is composed of initial, medial, and final syllables. It has 11,172 characters. For this reason, the current method of designing all the characters by hand is very expensive and time-consuming. In order to solve the problem, this paper proposes an automatic Hangul font generation system and evaluates the standards for mapping Hangul characters to produce an effective automated Hangul font generation system. The system was implemented using character generation engine based on deep learning CycleGAN. In order to evaluate the criteria when mapping characters in pairs, each criterion was designed based on Hangul structure and character shape, and the quality of the generated characters was evaluated. As a result of the evaluation, the standards designed based on the Hangul structure did not affect the quality of the automated Hangul font generation system. On the other hand, when tried with similar characters, the standards made based on the shape of Hangul characters produced better quality characters than when tried with less similar characters. As a result, it is better to generate automated Hangul font by designing a learning method based on mapping characters in pairs that have similar character shapes.

딥러닝을 이용한 가전제품 분류 시스템 구현 (Realization of home appliance classification system using deep learning)

  • 손창우;이상배
    • 한국정보통신학회논문지
    • /
    • 제21권9호
    • /
    • pp.1718-1724
    • /
    • 2017
  • 최근 IoT기반으로 가전제품을 실시간 모니터링을 하는 스마트 플러그가 활성화 되고 있다. 이를 통해 상시 실시간 에너지 소비 모니터링을 통한 소비자의 에너지 절약 유도를 하고, 소비자 설정 기반의 알람 기능을 통해 소비전력을 절감하는 효과를 보고 있다. 본 논문에서는 이러한 실시간 모니터링을 위해 벽 전원 콘센트에서 나오는 교류 전류를 측정한다. 이때, 가전제품마다의 전류 패턴을 분류하고 어떤 제품이 동작하는지 판단을 위해 딥러닝(Deep learning)으로 실험하였다. 전류 패턴의 학습으로 제품의 종류에 따른 인식 성능을 검증하기 위하여, 교차 검증 방법과 붓스트랩(Bootstrap) 검증 방법을 이용하였다. 또한 Cost function과 학습 성공률(Accuracy)이 Train 데이터와 Test 데이터가 동일함을 확인하였다.

Automatic Categorization of Islamic Jurisprudential Legal Questions using Hierarchical Deep Learning Text Classifier

  • AlSabban, Wesam H.;Alotaibi, Saud S.;Farag, Abdullah Tarek;Rakha, Omar Essam;Al Sallab, Ahmad A.;Alotaibi, Majid
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.281-291
    • /
    • 2021
  • The Islamic jurisprudential legal system represents an essential component of the Islamic religion, that governs many aspects of Muslims' daily lives. This creates many questions that require interpretations by qualified specialists, or Muftis according to the main sources of legislation in Islam. The Islamic jurisprudence is usually classified into branches, according to which the questions can be categorized and classified. Such categorization has many applications in automated question-answering systems, and in manual systems in routing the questions to a specialized Mufti to answer specific topics. In this work we tackle the problem of automatic categorisation of Islamic jurisprudential legal questions using deep learning techniques. In this paper, we build a hierarchical deep learning model that first extracts the question text features at two levels: word and sentence representation, followed by a text classifier that acts upon the question representation. To evaluate our model, we build and release the largest publicly available dataset of Islamic questions and answers, along with their topics, for 52 topic categories. We evaluate different state-of-the art deep learning models, both for word and sentence embeddings, comparing recurrent and transformer-based techniques, and performing extensive ablation studies to show the effect of each model choice. Our hierarchical model is based on pre-trained models, taking advantage of the recent advancement of transfer learning techniques, focused on Arabic language.