• Title/Summary/Keyword: Deep Learning based System

검색결과 1,234건 처리시간 0.028초

글꼴 유사도 판단을 위한 Faster R-CNN 기반 한글 글꼴 획 요소 자동 추출 (Automatic Extraction of Hangul Stroke Element Using Faster R-CNN for Font Similarity)

  • 전자연;박동연;임서영;지영서;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.953-964
    • /
    • 2020
  • Ever since media contents took over the world, the importance of typography has increased, and the influence of fonts has be n recognized. Nevertheless, the current Hangul font system is very poor and is provided passively, so it is practically impossible to understand and utilize all the shape characteristics of more than six thousand Hangul fonts. In this paper, the characteristics of Hangul font shapes were selected based on the Hangul structure of similar fonts. The stroke element detection training was performed by fine tuning Faster R-CNN Inception v2, one of the deep learning object detection models. We also propose a system that automatically extracts the stroke element characteristics from characters by introducing an automatic extraction algorithm. In comparison to the previous research which showed poor accuracy while using SVM(Support Vector Machine) and Sliding Window Algorithm, the proposed system in this paper has shown the result of 10 % accuracy to properly detect and extract stroke elements from various fonts. In conclusion, if the stroke element characteristics based on the Hangul structural information extracted through the system are used for similar classification, problems such as copyright will be solved in an era when typography's competitiveness becomes stronger, and an automated process will be provided to users for more convenience.

A Robust Real-Time License Plate Recognition System Using Anchor-Free Method and Convolutional Neural Network

  • Kim, Dae-Hoon;Kim, Do-Hyeon;Lee, Dong-Hoon;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.19-26
    • /
    • 2022
  • 최근 지능형 교통 체계의 발전에 따라 자동차 번호판 인식 시스템이 다양한 분야에서 활용되고 있다. 주행 중인 자동차의 번호판을 인식하기 위해서는 실시간성이 보장되어야 하며, 영상이 왜곡되어 뚜렷하지 않거나 번호판의 크기가 작은 저해상도 영상에서도 높은 인식률이 유지되어야 한다. 본 논문에서는 자유 앵커 방식 기반의 객체 탐지 알고리즘과 합성곱 신경망(CNN) 기반의 문자 인식 알고리즘을 이용하여 처리 속도를 향상한 실시간 자동차 번호판 인식 시스템을 제안한다. 더불어 공간 변형 네트워크를 이용하여 저해상도 및 왜곡된 영상에서의 인식률을 높였다. 제안하는 시스템의 인식률은 93.769%, 이미지 당 처리 속도는 약 0.006초로 기존 자동차 번호판 인식 시스템보다 빠른 속도로 자동차 번호판을 인식하며, 다양한 환경 및 품질의 영상에 대해 높은 인식률을 유지하는 것을 확인할 수 있다.

SOME/IP 에서의 시퀀셜 모델 기반 침입탐지 시스템 (Intrusion Detection System Based on Sequential Model in SOME/IP)

  • 강연재;피대권;김해린;이상호;김휘강
    • 정보보호학회논문지
    • /
    • 제32권6호
    • /
    • pp.1171-1181
    • /
    • 2022
  • 전방충돌 방지 보조 또는 지능형 주행 제어 기능 등이 현대의 자동차에 탑재됨에 따라 차에서 교환되는 데이터 양이 급증하고 있다. 따라서, 기존의 CAN 통신으로는 전송속도의 한계가 있어 넓은 대역폭과 양방향 통신을 지원하는 오토모티브 이더넷, 특히 SOME/IP가 널리 채택되고 있다. SOME/IP는 다양한 자동차 운영체제와 호환되는 표준 프로토콜로 차내 구성 요소간의 연결성을 높여준다. 하지만 SOME/IP 자체에는 암호화나 인증이 구현되어 있지 않아 악의적인 패킷 주입, 프로토콜 위반과 같은 공격에 취약한 문제가 있다. 본 논문에서는, 이러한 공격들을 효과적으로 탐지하기 위해 SOME/IP에서 딥러닝 기반의 침입탐지 시스템을 제안하였다. 제안된 침입탐지시스템의 성능을 6가지 공격 패턴을 활용하여 테스트 하였고 정확도 94%, 6가지 공격의 평균 F1-score은 0.94로 높은 성능을 달성할 수 있었다.

Correlation Extraction from KOSHA to enable the Development of Computer Vision based Risks Recognition System

  • Khan, Numan;Kim, Youjin;Lee, Doyeop;Tran, Si Van-Tien;Park, Chansik
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.87-95
    • /
    • 2020
  • Generally, occupational safety and particularly construction safety is an intricate phenomenon. Industry professionals have devoted vital attention to enforcing Occupational Safety and Health (OHS) from the last three decades to enhance safety management in construction. Despite the efforts of the safety professionals and government agencies, current safety management still relies on manual inspections which are infrequent, time-consuming and prone to error. Extensive research has been carried out to deal with high fatality rates confronting by the construction industry. Sensor systems, visualization-based technologies, and tracking techniques have been deployed by researchers in the last decade. Recently in the construction industry, computer vision has attracted significant attention worldwide. However, the literature revealed the narrow scope of the computer vision technology for safety management, hence, broad scope research for safety monitoring is desired to attain a complete automatic job site monitoring. With this regard, the development of a broader scope computer vision-based risk recognition system for correlation detection between the construction entities is inevitable. For this purpose, a detailed analysis has been conducted and related rules which depict the correlations (positive and negative) between the construction entities were extracted. Deep learning supported Mask R-CNN algorithm is applied to train the model. As proof of concept, a prototype is developed based on real scenarios. The proposed approach is expected to enhance the effectiveness of safety inspection and reduce the encountered burden on safety managers. It is anticipated that this approach may enable a reduction in injuries and fatalities by implementing the exact relevant safety rules and will contribute to enhance the overall safety management and monitoring performance.

  • PDF

U-Net을 이용한 무인항공기 비정상 비행 탐지 기법 연구 (Abnormal Flight Detection Technique of UAV based on U-Net)

  • 송명재;최은주;김병수;문용호
    • 항공우주시스템공학회지
    • /
    • 제18권3호
    • /
    • pp.41-47
    • /
    • 2024
  • 최근에 무인항공기의 실용화 및 사업화가 추진됨에 따라 무인항공기의 안전성 확보에 관한 관심이 증가하고 있다. 무인항공기의 사고는 재산 및 인명 피해를 발생시키기 때문에 사고를 예방할 수 있는 기술의 개발은 중요하다. 이러한 이유로 AutoEncoder 모델을 이용한 비정상 비행 상태 탐지 기법이 개발되었다. 그러나 기존 탐지 기법은 성능과 실시간 처리 측면에서 한계를 지닌다. 본 논문에서는 U-Net 기반 비정상 비행 탐지 기법을 제안한다. 제안하는 기법에서는 U-Net 모델에서 얻어지는 재구성 오차에 대한 마할라노비스 거리 증가량에 기반하여 비정상 비행이 탐지된다. 모의실험을 통해 제안 탐지 기법이 기존 탐지 기법에 비해 탐지 성능이 우수하며 온보드 환경에서 실시간으로 구동될 수 있음을 알 수 있다.

빅데이터와 AI를 활용한 의료영상 정보 시스템 발전 방향에 대한 연구 (A Study on the Development Direction of Medical Image Information System Using Big Data and AI)

  • 유세종;한성수;전미향;한만석
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권9호
    • /
    • pp.317-322
    • /
    • 2022
  • 정보기술의 급격한 발달은 의료 환경에서도 많은 변화를 가져오고 있다. 특히 빅데이터와 인공지능(AI)을 활용한 의료영상 정보 시스템의 빠른 변화를 견인하고 있다. 전자의무기록(EMR)과 의료영상저장전송시스템(PACS)으로 구성된 처방전달시스템(OCS)은 의료 환경을 아날로그에서 디지털로 빠르게 바꾸어 놓았다. PACS는 여러 솔루션과 결합하여 호환, 보안, 효율성, 자동화 등 새로운 발전 방향을 보여주고 있다. 그 중, 영상의 질적 개선을 할 수 있는 빅데이터를 활용한 인공지능(AI)과의 결합이 활발히 진행되고 있다. 특히 딥러닝 기술을 활용하여 의료 영상 판독을 보조할 수 있는 시스템인 AI PACS가 대학과 산업체의 협력으로 개발되어 병원에서 활용되고 있다. 이처럼 의료 환경에서 의료영상 정보 시스템의 빠른 변화에 맞추어 의료시장의 구조적인 변화와 이에 대처할 수 있는 의료정책의 변화도 필요하다. 한편, 의료영상정보는 디지털 의료영상 전송 장치에서 생성되는 DICOM 방식을 기본으로 하고, 생성하는 방법의 차이에 따라 Volume 영상, 단면 영상인 2차원적 영상으로 구분된다. 또한, 최근 많은 의료기관에서는 스마트 병원 서비스를 내세우며 차세대 통합 의료정보시스템의 도입을 서두르고 있다. 차세대 통합 의료정보시스템은 EMR을 바탕으로 전자동의서, AI와 빅데이터를 활용한 정밀의료, 외부기관 등을 통합한 솔루션으로 구축하며, 이를 바탕으로 환자 정보 DB 구축과 데이터의 표준화를 통한 의료 빅데이터 기반의 의학 연구를 목적으로 한다. 우리나라의 의료영상 정보 시스템은 앞선 IT 기술력과 정부의 정책에 힘입어 세계적인 수준에 있으며, 특히 PACS 관련 프로그램은 의료 영상정보 기술에서 세계로 수출을 하고 있는 한 분야이다. 본 연구에서는 빅데이터를 활용한 의료영상 정보 시스템의 분석과 함께 의료영상 정보 시스템이 국내에 도입되게 된 역사적 배경을 바탕으로 현재의 흐름을 파악하고 나아가 미래의 발전 방향을 예측하였다. 향후, 20여 년 동안 축적된 DICOM 빅데이터를 기반으로 AI, 딥러닝 알고리즘을 활용하여 영상 판독률을 높일 수 있는 연구를 진행하고자 한다.

딥러닝 기반의 보행자 탐지 및 경보 시스템 연구 (A Study on Deep Learning-based Pedestrian Detection and Alarm System)

  • 김정환;신용현
    • 한국ITS학회 논문지
    • /
    • 제18권4호
    • /
    • pp.58-70
    • /
    • 2019
  • 보행자 교통사고의 경우 사고 발생 시 사망사고로 연결되는 위험성이 있다. 국내 지능형 교통시스템(ITS)은 질 좋은 교통 인프라를 구축하고 있음에도 불구하고, 거의 교통정보 수집에만 이용되고 있어, 위험상황 발생 시 지능적인 위험 요소 분류가 이루어지지 않고 있다. 본 연구에서 제안하는 시스템의 주요 구성 요소인 CNN 기반의 보행자 탐지 분류 모델의 경우 제한적인 환경에서 설치 운영되는 것을 가정하여 임베디드 시스템 기반으로 구현되었다. 기존 YOLO의 인공신경망 모델을 개선하여 My-Tiny-Model3라는 새로운 모델을 생성하였고, 20,000번의 반복 학습 기준으로 평균 정확도 86.29%와 21.1 fps의 실시간 탐지 속도 결과를 보였다. 그리고, 이러한 탐지 시스템을 기반으로 하여 ITS 체계와 연계 가능한 시스템 구현 및 프로토콜 연동 시나리오를 구성하였다. 본 연구를 통해 기존 ITS 체계와 연동하는 보행자 사고 방지 시스템을 구현한다면, 새로운 인프라 구축비용을 절감하고 보행자 교통사고 발생률을 줄이는 데 도움이 될 것이다. 또한, 기존의 시스템 감시인력 소요에 따른 비용 또한 줄일 수 있을 것으로 기대된다.

터널 콘크리트 라이닝 균열 분석을 위한 의미론적 분할 모델 학습 (Training a semantic segmentation model for cracks in the concrete lining of tunnel)

  • 함상우;배수현;김휘영;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.549-558
    • /
    • 2021
  • 터널과 지하시설물을 비롯한 콘크리트 토목구조물을 안전하게 관리하려면 균열 발생 여부를 정기적인 점검을 통해 알아내야 한다. 터널의 콘크리트 라이닝 표면에 발생한 균열의 위치와 형태를 검사하는 일은 주로 고소작업차를 투입하여 이루어진다. 이러한 작업은 차로를 통제한 채 이루어지므로 교통 체증을 일으키며, 점검 종사자가 위험한 환경에 노출되며, 매번 같은 종사자가 같은 터널의 같은 부위를 조사하기 어려우므로 검사 결과의 일관성이 저해된다. 본 연구는 기존 터널 영상 취득 시스템을 대상으로 딥러닝 기술을 적용해 터널 내 콘크리트 라이닝의 균열을 자동으로 탐지하는 방법을 다음과 같이 제시한다. 구체적으로는 의미론적 분할(semantic segmentation)을 수행하는 딥러닝 모델을 공개 데이터셋으로 학습시키고, 터널 영상 취득 시스템으로 취득한 데이터셋을 딥러닝 모델에 입력했을 때 성능을 알아본다. 첫 번째, 공개 데이터셋을 전부 학습시켰을 경우, 두 번째, 공개 데이터셋 중 기존 터널 영상 취득 시스템 데이터셋과 관련성이 높은 데이터셋만 선택하여 학습시켰을 경우, 마지막으로 관련성이 높은 데이터셋과 균열이 없는 영상(negative example)을 선택하여 학습시켰을 경우에 대하여 성능을 비교하여 효율적인 모델 학습 방안을 모색한다. 그 결과 공개 데이터셋에서 관련성이 높은 영상과 균열이 없는 영상을 골라 학습시켰을 경우의 성능이 가장 좋았다. 향후 딥러닝 알고리즘을 터널 영상 취득 시스템에 적용할 때 효율적인 모델 학습 방안을 수립하는데 기여할 것으로 기대한다.

밀폐공간 내 감염병 위험도 모니터링을 위한 열화상 온도 스크리닝 시스템 설계 및 구현에 대한 연구 (A Study on the Design and Implementation of a Thermal Imaging Temperature Screening System for Monitoring the Risk of Infectious Diseases in Enclosed Indoor Spaces)

  • 정재영;김유진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권2호
    • /
    • pp.85-92
    • /
    • 2023
  • 코로나바이러스감염증-19와 같은 호흡기 감염병은 주로 밀집/밀폐/밀접 공간인 실내에서 일어난다. 호흡기 감염병 이상징후의 존재 여부는 발열, 기침, 재채기 및 호흡곤란 등의 초기 증상을 통해 판단되고 있으며, 이러한 초기 증상에 대한 상시 모니터링이 요구된다. 열화상 온도 스크리닝 시스템은 개인의 피부 온도 상승의 징후가 있는지 초기에 선별하는 빠르고 쉬운 비접촉 스크리닝 방법을 제공하지만, 측정 타겟, 주변 온도 등의 측정 환경과 피 측정대상과의 측정 거리에 따른 오차로 인해 정확한 온도측정이 어렵다. 그리고 국제표준 IEC 80601-2-59 에서는 내안각(Inner Canthus) 인접한 영역에 대한 안면 열화상 촬영을 권고하고 있다. 본 논문에서는 가시광 카메라 모듈과 열화상 카메라 모듈에 대해서 이미지 일치화 보정을 수행하였으며, 흑체(Blackbody)를 이용해 측정 환경에 대한 열화상 카메라 모듈 온도를 보정하였다. 표준에서 권고하는 측정 타겟을 인식하기 위해 딥러닝 기반 객체 인식 알고리즘과 내안각 인식 모델을 개발하였으며, 100명의 실험자군에 대한 데이터셋을 적용하여 인식 모델 정확도를 도출하였다. 또한 라이다 모듈을 이용한 객체 거리 측정과 선형회귀 보정 모듈을 통해 측정 거리에 따른 오차를 보정하였다. 제안한 모델의 성능 측정을 위해 모터 스테이지, 열화상 온도 스크리닝 시스템, 흑체로 구성된 실험환경을 구축하였으며, 1m에서 3.5m 사이 가변 거리에 따른 온도측정 결과 0.28℃ 이내의 오차 정확도를 확인하였다.

Generative Adversarial Network-Based Image Conversion Among Different Computed Tomography Protocols and Vendors: Effects on Accuracy and Variability in Quantifying Regional Disease Patterns of Interstitial Lung Disease

  • Hye Jeon Hwang;Hyunjong Kim;Joon Beom Seo;Jong Chul Ye;Gyutaek Oh;Sang Min Lee;Ryoungwoo Jang;Jihye Yun;Namkug Kim;Hee Jun Park;Ho Yun Lee;Soon Ho Yoon;Kyung Eun Shin;Jae Wook Lee;Woocheol Kwon;Joo Sung Sun;Seulgi You;Myung Hee Chung;Bo Mi Gil;Jae-Kwang Lim;Youkyung Lee;Su Jin Hong;Yo Won Choi
    • Korean Journal of Radiology
    • /
    • 제24권8호
    • /
    • pp.807-820
    • /
    • 2023
  • Objective: To assess whether computed tomography (CT) conversion across different scan parameters and manufacturers using a routable generative adversarial network (RouteGAN) can improve the accuracy and variability in quantifying interstitial lung disease (ILD) using a deep learning-based automated software. Materials and Methods: This study included patients with ILD who underwent thin-section CT. Unmatched CT images obtained using scanners from four manufacturers (vendors A-D), standard- or low-radiation doses, and sharp or medium kernels were classified into groups 1-7 according to acquisition conditions. CT images in groups 2-7 were converted into the target CT style (Group 1: vendor A, standard dose, and sharp kernel) using a RouteGAN. ILD was quantified on original and converted CT images using a deep learning-based software (Aview, Coreline Soft). The accuracy of quantification was analyzed using the dice similarity coefficient (DSC) and pixel-wise overlap accuracy metrics against manual quantification by a radiologist. Five radiologists evaluated quantification accuracy using a 10-point visual scoring system. Results: Three hundred and fifty CT slices from 150 patients (mean age: 67.6 ± 10.7 years; 56 females) were included. The overlap accuracies for quantifying total abnormalities in groups 2-7 improved after CT conversion (original vs. converted: 0.63 vs. 0.68 for DSC, 0.66 vs. 0.70 for pixel-wise recall, and 0.68 vs. 0.73 for pixel-wise precision; P < 0.002 for all). The DSCs of fibrosis score, honeycombing, and reticulation significantly increased after CT conversion (0.32 vs. 0.64, 0.19 vs. 0.47, and 0.23 vs. 0.54, P < 0.002 for all), whereas those of ground-glass opacity, consolidation, and emphysema did not change significantly or decreased slightly. The radiologists' scores were significantly higher (P < 0.001) and less variable on converted CT. Conclusion: CT conversion using a RouteGAN can improve the accuracy and variability of CT images obtained using different scan parameters and manufacturers in deep learning-based quantification of ILD.