• 제목/요약/키워드: Deep Learning

검색결과 5,631건 처리시간 0.031초

물리기반 분포형 수문 모형과 딥러닝 기반 LSTM 모형을 활용한 충주댐 및 소양강댐 유역의 미래 수자원 전망 (Prospect of future water resources in the basins of Chungju Dam and Soyang-gang Dam using a physics-based distributed hydrological model and a deep-learning-based LSTM model)

  • 김용찬;김영란;황성환;김동균
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1115-1124
    • /
    • 2022
  • 본 연구는 충주댐과 소양강댐 유역을 대상으로 분포형 수문모형인 Variable Infiltration Capacity (VIC) 모형 기반의 댐 유입량 예측 모형과 딥러닝 모형의 일종인 LSTM 기반의 댐 방류량 예측 모형으로 구성된 통합 모델링 프레임워크를 구성하여 미래 기후변화가 수자원에 미치는 영향을 평가하였다. 기후모델에 따른 미래 기후자료의 불확실성을 고려하여 4개의 CMIP6 GCM 모델의 기후자료를 미래기간(2021-2100)에 대한 VIC 모형의 기상자료로 입력하였다. 미래기후자료를 적용한 결과, 미래가 진행됨에 따라 기간별 평균 유입량이 증가하였으며, 먼 미래(2070-2100)에는 관측기간(1986-2020)에 비해 유입량이 최대 22% 증가하였다. 갈수량 분석 결과, 임의의 4일~50일에 대한 댐 방류량의 최소값은 관측치에 비해 현저히 낮은 것으로 나타났다. 이는 가뭄이 과거에 관측된 것보다 더 장기간에 걸쳐 발생할 수 있음을 나타내며, 수도권 시민들이 미래의 가뭄으로 인해 심각한 물 부족을 겪을 수 있다는 것을 의미한다. 또한, 단기 및 중기 미래에 비하여 장기미래에 저수량의 변화가 급격하게 이루어졌으며 이는 수자원 관리의 어려움이 증대될 수 있음을 시사한다.

위조번호판 부착 차량 출입 방지를 위한 인공지능 기반의 주차관제시스템 개선 방안 (A study on the improvement of artificial intelligence-based Parking control system to prevent vehicle access with fake license plates)

  • 장성민;이정우;박종혁
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.57-74
    • /
    • 2022
  • 최근 인공지능 주차관제시스템은 딥러닝을 활용해 차량 번호판에 대한 인식률을 높이고 있지만 위조번호판 부착 차량을 판별하지 못한다는 문제점이 있다. 이러한 보안상의 문제점이 있음에도 불구하고 현재까지 여러 기관에서 기존의 시스템을 그대로 사용하고 있는 상황이다. 실례로 위조번호판을 이용한 실험에서 정부의 주요 기관을 대상으로 진입에 성공한 사례도 있다. 본 논문에서는 이러한 위조번호판을 부착한 차량의 출입을 방지하기 위해서 기존 인공지능 주차관제시스템의 개선 방안을 제시한다. 이를 위해 제안하는 방법은 기존 시스템이 차량의 번호판의 일치여부를 통과기준으로 사용하듯이 이미지에서 특징이 되는 특징점의 정보를 추출해내는 ORB 알고리즘을 활용하여 추출한 차량 앞면 특징점들의 매칭 정도를 통과기준으로 사용하는 방법이다. 또한 내부에 차량이 존재하는지 여부를 확인하는 절차를 제안 시스템에 포함시켜 위조번호판을 부착한 동일 차종 차량의 진입도 방지하였다. 실험 결과, 위조번호판을 부착한 차량들의 진입을 막아내며 기존시스템에 비해 위조번호판을 막아내는 개선된 성능을 보였다. 이러한 결과를 통해 기존 인공지능 주차관제시스템의 체계를 유지하면서 본 논문에서 제안하는 방법들을 기존의 주차관제시스템에 적용하여 위조번호판을 부착한 차량의 출입을 방지할 수 있음을 확인할 수 있었다.

태양객체 정보 및 태양광 특성을 이용하여 사용자 위치의 자외선 지수를 산출하는 DNN 모델 (DNN Model for Calculation of UV Index at The Location of User Using Solar Object Information and Sunlight Characteristics)

  • 가덕현;오승택;임재현
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.29-35
    • /
    • 2022
  • 자외선은 노출 정도에 따라 인체에 유익 또는 유해한 영향을 미치므로 개인별 적정 노출을 위해서는 정확한 자외선(UV) 정보가 필요하다. 국내의 경우 기상청에서 생활기상정보의 한 요소로 자외선 정보를 제공하고 있으나 지역별 자외선 지수(UVI, Ultraviolet Index)로 사용자 위치의 정확한 UVI를 제공하지는 못하고 있다. 일부에서는 정확한 UVI의 취득을 위해 직접 계측기를 운용하지만 비용이나 편의성에 문제가 있고, 태양의 복사량과 운량 등 주변 환경요소를 통해 자외선 양을 추정하는 연구도 소개되었으나 개인별 서비스 방법을 제시하지는 못하였다. 이에 본 논문에서는 각 개인별 위치에서의 정확한 UVI 제공을 위한 태양객체 정보와 태양광 특성을 이용한 UVI 산출 딥러닝 모델을 제안한다. 기 수집한 하늘이미지 및 태양광 특성을 분석하여 태양의 위치 및 크기, 조도 등 UVI와 상관도가 높은 요소들을 선정한 후 DNN 모델을 위한 데이터 셋을 구성한다. 이후 하늘이미지로부터 Mask R-CNN을 통해 추출한 태양객체 정보와 태양광 특성을 입력하여 UVI를 산출하는 DNN 모델을 구현한다. 국내 UVI 권고기준을 고려, UVI 8이상과 미만인 날에 대한 성능평가에서는 기준장비 대비 MAE 0.26의 범위 내 정확한 UVI의 산출이 가능하였다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

BIM 모델 내 공간의 시멘틱 무결성 검증을 위한 그래프 기반 딥러닝 모델 구축에 관한 연구 (Development of Graph based Deep Learning methods for Enhancing the Semantic Integrity of Spaces in BIM Models)

  • 이원복;김시현;유영수;구본상
    • 한국건설관리학회논문집
    • /
    • 제23권3호
    • /
    • pp.45-55
    • /
    • 2022
  • BIM의 도입에 따라 공간이 개별 객체로 인식되면서 객체화된 공간의 속성정보는 법규검토, 에너지 분석, 피난 경로 분석 등을 위한 기반 데이터로 사용 가능하기에 BIM의 활용성을 넓힐 수 있는 발판을 마련하였다. 그러나 BIM 모델 내 개별 공간 속성의 오기입이나 누락이 없는 시멘틱 무결성(semantic integrity)이 보장되어야 하는데, 다수의 참여자에 의한 수작업으로 진행되는 BIM 모델링 과정 특성 상 설계 오류가 빈번히 발생한다는 문제점이 존재한다. 이를 해결하기 위해 BIM 모델의 공간 정합성 검증을 위한 연구가 다수 진행되었으나, 적용 범위가 한정적이거나 분류 정확도가 낮은 한계점이 존재하였다. 본 연구에서는 공간의 기하정보 뿐 아니라 BIM 모델 내 공간과 부재 간 연결 관계를 Graph Convolutional Networks (GCN) 학습과정에 활용하여 향상된 성능의 공간 자동 분류모델을 구축하고자 하였다. 구축된 GCN 기반 모델의 성능을 공간의 기하정보만으로 학습된 기계학습 모델인 Multi-Layer Perceptron (MLP)과 비교하여 공간 분류 시 연결 관계 적용의 효용성을 검증하고자 하였다. 이를 통해 관계정보 활용 시 약 8% 내외 수준으로 공간 분류 성능이 향상되는 것으로 확인되었다.

전산화단층영상 기반 뇌출혈 검출을 위한 YOLOv5s 성능 평가 (Performance Evaluation of YOLOv5s for Brain Hemorrhage Detection Using Computed Tomography Images)

  • 김성민;이승완
    • 한국방사선학회논문지
    • /
    • 제16권1호
    • /
    • pp.25-34
    • /
    • 2022
  • 뇌 전산화단층촬영은 비침습성, 3차원 영상 제공, 저방사선량 등의 장점 때문에 뇌출혈과 같은 질병 진단을 위해 시행된다. 하지만 뇌 전산화단층영상 판독을 위한 전문의의 인력 공급 부족 및 막대한 업무량으로 인해 수많은 판독 오류 및 오진이 발생하고 있다. 이와 같은 문제를 해결하기 위해 객체 검출을 위한 다양한 인공지능 기술이 개발되고 있다. 본 연구에서는 뇌 전산화단층영상으로부터 뇌출혈 검출을 위한 딥러닝 기반 YOLOv5s 모델의 적용 가능성을 확인하였다. 또한 YOLOv5s 모델 학습 시 초매개변수를 변화시켜 학습된 모델의 성능을 평가하였다. YOLOv5s 모델은 backbone, neck 및 output 모듈로 구성하였고, 입력 CT 영상 내 뇌출혈로 의심되는 부위를 검출하여 출력할 수 있도록 하였다. YOLOv5s 모델 학습 시 활성화함수, 최적화함수, 손실함수 및 학습 횟수를 변화시켰고, 학습된 모델의 뇌출혈 검출 정확도 및 학습 시간을 측정하였다. 연구결과 학습된 YOLOv5s 모델은 뇌출혈로 의심되는 부위에 대한 경계 박스 및 해당 경계박스에 대한 정확도를 출력할 수 있음을 확인하였다. Mish 활성화함수, stochastic gradient descent 최적화함수 및 completed intersection over union 손실함수 적용 시 YOLOv5s 모델의 뇌출혈 검출 정확도 향상 및 학습 시간이 단축되는 결과를 확인하였다. 또한 YOLOv5s 모델의 뇌출혈 검출 정확도 및 학습 시간은 학습 횟수에 비례하여 증가하는 결과를 확인하였다. 따라서 YOLOv5s 모델은 뇌 전산화단층영상을 이용한 뇌출혈 검출을 위해 활용할 수 있으며, 최적의 초매개변수 적용을 통해 성능을 향상 시킬 수 있다.

콘포머 기반 FastSpeech2를 이용한 한국어 음식 주문 문장 음성합성기 (A Korean menu-ordering sentence text-to-speech system using conformer-based FastSpeech2)

  • 최예린;장재후;구명완
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.359-366
    • /
    • 2022
  • 본 논문에서는 콘포머 기반 FastSpeech2를 이용한 한국어 메뉴 음성합성기를 제안한다. 콘포머는 본래 음성 인식 분야에서 제안된 것으로, 합성곱 신경망과 트랜스포머를 결합하여 광역과 지역 정보를 모두 잘 추출할 수 있도록 한 구조다. 이를 위해 순방향 신경망을 반으로 나누어 제일 처음과 마지막에 위치시켜 멀티 헤드 셀프 어텐션 모듈과 합성곱 신경망을 감싸는 마카론 구조를 구성했다. 본 연구에서는 한국어 음성인식에서 좋은 성능이 확인된 콘포머 구조를 한국어 음성합성에 도입하였다. 기존 음성합성 모델과의 비교를 위하여 트랜스포머 기반의 FastSpeech2와 콘포머 기반의 FastSpeech2를 학습하였다. 이때 데이터셋은 음소 분포를 고려한 자체 제작 데이터셋을 이용하였다. 특히 일반대화 뿐만 아니라, 음식 주문 문장 특화 코퍼스를 제작하고 이를 음성합성 훈련에 사용하였다. 이를 통해 외래어 발음에 대한 기존 음성합성 시스템의 문제점을 보완하였다. ParallelWave GAN을 이용하여 합성음을 생성하고 평가한 결과, 콘포머 기반의 FastSpeech2가 월등한 성능인 MOS 4.04을 달성했다. 본 연구를 통해 한국어 음성합성 모델에서, 동일한 구조를 트랜스포머에서 콘포머로 변경하였을 때 성능이 개선됨을 확인하였다.

인공지능과 증강현실 기술을 이용한 모래성 놀이 가이드 애플리케이션 설계 및 구현 (Design and Implementation of Sandcastle Play Guide Application using Artificial Intelligence and Augmented Reality)

  • 류지승;장승우;문유정;이정진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권3호
    • /
    • pp.79-89
    • /
    • 2022
  • 최근 스마트폰이 널리 보급되고 모바일 기기의 그래픽스 처리 성능이 발전함에 따라 아이들의 물리적인 활동을 돕는 다양한 모바일 애플리케이션들이 연구되고 있다. 본 논문에서는 인공지능과 증강현실 기술을 활용해 모래성 쌓기 놀이를 안내하는 모바일 애플리케이션 SandUp을 제안한다. 모래성을 쌓는 과정에서 아이는 모바일 증강현실 기술을 활용해 제시된 목표 모래성을 현실 세계에 증강하여 살펴볼 수 있다. 또한, SandUp은 모래성의 완성을 돕기 위해 단계적으로 필요한 모래 모양과 Task를 알려주고, 모바일 폰의 카메라와 딥러닝 인식모델을 이용해 실시간으로 현재 진행 상황을 인식하고 시각적, 청각적 피드백을 제공한다. 우리는 Flutter와 TensorFlow Lite를 이용해 SandUp 앱의 프로토타입을 구현하였다. 제안하는 SandUp 앱의 사용성과 효과를 평가하기 위해 성인을 대상으로 설문조사를 수행하고 앱이 목표로 한 4-7세 아이들을 모집하여 실험을 진행했다. 실험 결과와 학부모의 피드백을 분석하여 앱의 발전 가능성 및 개선점을 도출하고 향후 연구 방향을 제시한다.

샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구 (Training of a Siamese Network to Build a Tracker without Using Tracking Labels)

  • 강정규;송유승;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.274-286
    • /
    • 2022
  • 이동객체 추적은 컴퓨터 비전 분야에서 오랜 시간 동안 연구가 진행되어 온 분야로 자율주행이나 운전 보조 시스템 등의 시스템에서 아주 중요한 역할을 수행하고 있다. 이동객체 추적 기술은 일반적으로 객체를 검출하는 검출기와 검출된 객체를 추적하는 추적기의 결합으로 이루어져 있다. 검출기는 다양한 데이터셋이 공개되어 사용되고 있기 때문에 쉽게 좋은 모델을 학습할 수 있지만, 추적기의 경우 상대적으로 공개된 데이터셋도 적고 직접 데이터셋을 구성하는 것도 검출기 데이터셋에 비해 굉장히 오랜 시간을 소요한다. 이에 검출기를 따로 개발하고, 별도의 추적기를 학습 기반이 아닌 방식을 활용하여 개발하는 경우가 많은데 이런 경우 두 개의 시스템이 차례로 작동하게 되어 전체 시스템의 속도를 느리게 하고 앞단의 검출기의 성능이 변할 때마다 별도로 추적기 또한 조정해줘야 한다는 단점이 있다. 이에 본 연구는 검출용 데이터셋만을 사용하여 검출과 추적을 동시에 수행하는 모델을 구성하는 방법을 제안한다. 데이터 증강 기술과 샴 네트워크를 사용하여 단일 이미지에서 객체를 검출 및 추적하는 방법을 연구하였다. 공개 데이터셋에 실험을 진행하여 학습 결과 높은 속도로 작동하는 이동객체 검출 및 추적기를 학습할 수 있음을 검증하였다.