• 제목/요약/키워드: 딥러닝 융합연구

검색결과 434건 처리시간 0.025초

댐 방류 의사결정지원을 위한 딥러닝 기법의 적용성 평가 (Application of deep learning method for decision making support of dam release operation)

  • 정성호;레수안히엔;김연수;최현구;이기하
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1095-1105
    • /
    • 2021
  • 기후변화에 따른 집중호우, 태풍 등의 발생빈도의 증가로 인하여 댐 운영의 고도화가 요구되고 있다. 일반적으로 댐 운영의 경우 강우예측, 강우-유출, 홍수추적 등 다양한 수리수문학적 요소들을 반영하여 수행되나 기 계획된 특정 규칙에 기반한 댐 운영 모형의 경우, 때때로 개별 모듈들의 불확실성과 복합적인 인자들로 인하여 댐의 방류량을 능동적으로 제어하는데 제약이 있을 수 있다. 본 연구는 남강댐 직하류 홍수피해 예방을 위하여 댐의 방류량 결정 등 효율적인 댐 운영을 지원하기 위해 딥러닝 기반 LSTM (Long Short-Term Memory) 모형을 구축하고, 선행시간별 댐직하류 수위예측 정확도를 분석하는 것을 목적으로 한다. LSTM 모형의 입력자료는 댐 운영에 사용되는 기초자료 및 하류 장대동 수위관측소의 수위 자료를 시 단위로 2009년부터 2021년 7월까지 수집하였다. 2009년부터 2018년 자료는 모형의 학습과 검증 및 2019년부터 2021년 7월 자료는 선행시간을 7개(1 h, 3 h, 6 h, 9 h, 12 h, 18 h, 24 h)로 구분하여 관측 수위와 예측 수위를 비교·분석하였다. 그 결과, 선행시간 1시간의 예측결과는 평균적으로 MAE가 0.01 m, RMSE가 0.015 m, NSE가 0.99 로 관측 수위에 매우 근접한 예측 결과를 나타내었다. 또한, 선행시간이 길어질수록 예측 정확도는 근소하게 감소하였지만, 관측 수위의 시간적 패턴을 유사하게 안정적으로 예측하는 것으로 분석되었다. 따라서 수리수문학적 비선형의 복잡한 자료간의 특징을 자동으로 추출하여 예측 자료를 생산하는 LSTM 모형은 댐 방류량 의사결정에 있어 활용이 가능할 것으로 판단된다.

졸음운전 감지 및 방지 시스템 연구 (Study for Drowsy Driving Detection & Prevention System)

  • 안병태
    • 융합정보논문지
    • /
    • 제8권3호
    • /
    • pp.193-198
    • /
    • 2018
  • 최근, 자동차 교통사고의 인명 피해가 급속히 증가하고 있으며 경상보다는 중상 및 사망이 많은 대형사고가 증가하고 있다. 대형사고의 70% 이상은 졸음운전으로 발생한다. 따라서, 본 논문에서는 교통사고의 대형 참사를 방지하기 위한 졸음운전 방지 시스템을 연구하였다. 본 논문에서는 졸음운전 감지 시스템을 위한 실시간 눈 깜빡임 인식 방법과 이산화탄소 증가에 따른 졸음 인식을 감지하도록 제안한다. 졸음운전 감지 시스템은 기존의 영상 검출과 딥러닝을 적용하였고 이산화탄소 증가 감지는 사물인터넷 기반으로 개발하였다. 이러한 두 가지 기법을 동시에 이용한 졸음운전 방지 시스템은 기존의 제품에 비해 정확성이 향상되었다.

청각 장애인을 위한 수어 영상-자연어 번역 서비스 및 모바일 어플리케이션 구현 (Developing a mobile application serving sign-language to text translation for the deaf)

  • 조수민;조성연;신소연;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1012-1015
    • /
    • 2021
  • Covid-19 로 인한 마스크 착용이 청각장애인들의 소통을 더 어렵게 하는 바, 제 3 자의 도움 없이 쌍방향 소통을 가능하게 하는 서비스의 필요성이 커지고 있다. 이에 본 논문은 소통의 어려움을 겪는 청각장애인과 비청각장애인을 위한 쌍방향 소통 서비스에 대한 연구와 개발 과정, 기대 효과를 담는다. 서비스는 GRU-CNN 하이브리드 아키텍처를 사용하여 데이터셋을 영상 공간 정보와 시간 정보를 포함한 프레임으로 분할하는 영상 분류 기법과 같은 딥 러닝 알고리즘을 통해 수어 영상을 분류한다. 해당 연구는 "눈속말" 모바일 어플리케이션으로 제작 중이며 음성을 인식하여 수어영상과 텍스트로 번역결과를 제공하는 청각장애인 버전과 카메라를 통해 들어온 수어 영상을 텍스트로 변환하여 음성과 함께 제공하는 비청각장애인 버전 두 가지로 나누어 구현한다. 청각장애인과 비장애인의 쌍방향 소통을 위한 서비스는 청각장애인이 사회로 나아가기 위한 가장 기본적인 관문으로서의 역할을 할 것이며 사회 참여를 돕고 소통이라는 장벽을 넘어서는 발돋움이 될 것이라 예측된다.

의미적 표현을 통한 교통사고 검출에 관한 연구 (A Study on Traffic Accident Detection by Semantic Representation)

  • 김인첩;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.507-509
    • /
    • 2023
  • 최근 딥러닝은 도로 CCTV 동영상의 교통사고 검출에 널리 사용되지만 일인칭 동영상의 교통사고 검출은 분명히 어렵다. 일인칭 동영상은 역동적이고 시야가 제한되어 있기 때문이다. 본 논문에서는 일인칭 동영상을 분석하여 교통사고를 검출하는 방법을 제시한다. 이 방법은 교통 표현 특성을 분석하는 것 외에도 의미를 이해하고 교통 장면을 인코딩한다. 프레임의 표현 특징은 각 프레임 상의 물체의 특징과 물체의 위치 관계의 공간적 숨겨진 특진을 학습함으로써 얻어진다. 그 후에 프레임 표현 특징과 교통 장면의 특징이 연결되어 GRU 실행기에 공급된다. 여러 GRU 실행기는 분석한 후 사고가 발생했는지 확인된다. 이 방법은 높은 역학과 제한된 시야 문제를 효과적으로 해결한다.

적대적 생성 신경망을 활용한 비지도 학습 기반의 대기 자료 이상 탐지 알고리즘 연구 (A Study on Atmospheric Data Anomaly Detection Algorithm based on Unsupervised Learning Using Adversarial Generative Neural Network)

  • 양호준;이선우;이문형;김종구;최정무;신유미;이석채;권장우;박지훈;정동희;신혜정
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.260-269
    • /
    • 2022
  • 본 논문에서는 기존에 전문가에 의해서 이루어지던 국가 대기오염 측정망 데이터들의 이상 탐지 작업을 인공지능을 통해 자동화하고자 심층 신경망을 이용한 이상 탐지 모델을 제안하였다. 환경과학원에서 제공받은 기상자료 데이터의 결측치 및 이상치를 분석하여 학습데이터를 생성하였으며 비지도 학습 방식의 BeatGAN 모델에 기반하여 커널 구조 변경과 합성곱 필터층 및 전치 합성곱 필터층의 추가를 통해 새로운 모델을 제안하여 이상 탐지 성능을 높이고자 하였다. 또한 제안하는 모델의 생성적 특징을 활용하여 새로운 데이터를 생성하고 이를 학습에 사용하는 재학습 알고리즘을 구현 및 적용하여 기존 BeatGAN 모델뿐 아니라 다른 비지도 학습 모델인 Iforest, One Class SVM과 비교하였을 때 제안모델의 성능이 가장 높았음을 확인할 수 있었다. 본 연구를 통해 실제 산업현장에서 센서의 이상, 점검 등의 여러 요인으로 인해 학습 데이터가 부족한 상황에서 추가적인 비용없이 과적합을 피하며 제안하는 모델의 이상탐지 성능을 올릴 수 있는 방법을 제시할 수 있었다.

다종 위성영상을 활용한 재난대응 방안 연구 (Study on Disaster Response Strategies Using Multi-Sensors Satellite Imagery)

  • 박종수;이달근;이준우;천은지;정하규
    • 대한원격탐사학회지
    • /
    • 제39권5_2호
    • /
    • pp.755-770
    • /
    • 2023
  • 최근 심각한 기후변화, 기상이상 현상 등으로 인해 자연재난의 발생빈도 및 규모가 증가하고 있다. 대형화 재난 발생 시 시간·경제적 제약으로 인해 인공위성, 드론 등 원격탐사 기반의 재난관리의 필요성이 대두되고 있다. 본 연구에서는 재난 발생 시 활용가능한 국내·외 위성들과 최근 우주산업 활성화에 따라 운용 중 및 개발 중인 차세대중형위성, 초소형위성의 현황과 대량의 위성영상들의 활용 기술 동향에 대해 정리하였다. 분석 기술로는 딥러닝의 근간인 인공지능 기술을 접목한 연구들이 있으며, 사용자 중심의 분석 준비 데이터(analysis ready data)를 활용할 수 있는 주요 플랫폼을 소개하였다. 또한 최근 발생된 대형재난인 홍수, 산사태, 가뭄, 산불을 중심으로 위성영상을 활용하여 피해분석을 함으로써 재난관리에 어떻게 활용될 수 있는지에 대해 확인하였다. 마지막으로 개발될 위성을 고려하여 재난 관리 단계별 활용방안에 대해 제시하였다. 본 연구를 통해 위성개발 및 운영현황, 최신 위성영상 분석기술 동향과 다종 위성영상을 활용한 재난대응 방안에 대해 제시되었다. 재난 진행단계에서는 예방과 대비 보다는 대응과 복구에 대한 위성영상의 활용도가 높은 것을 확인할 수 있었다. 향후 다종의 영상이 수급되었을 때 효과적인 재난관리를 위해 인공지능, 딥러닝 등 최신기술 융합 방안과 적용 가능성에 대한 연구를 수행할 예정이다.

한국어 TTS 시스템에서 딥러닝 기반 최첨단 보코더 기술 성능 비교 (Performance Comparison of State-of-the-Art Vocoder Technology Based on Deep Learning in a Korean TTS System)

  • 권철홍
    • 문화기술의 융합
    • /
    • 제6권2호
    • /
    • pp.509-514
    • /
    • 2020
  • 기존의 TTS 시스템은 텍스트 전처리, 구문 분석, 발음표기 변환, 경계 분석, 운율 조절, 음향 모델에 의한 음향 특징 생성, 합성음 생성 등 여러 모듈로 구성되어 있다. 그러나 딥러닝 기반 TTS 시스템은 텍스트에서 스펙트로그램을 생성하는 Text2Mel 과정과 스펙트로그램에서 음성신호을 합성하는 보코더로 구성된다. 본 논문에서는 최적의 한국어 TTS 시스템 구성을 위해 Tex2Mel 과정에는 Tacotron2를 적용하고, 보코더로는 WaveNet, WaveRNN, WaveGlow를 소개하고 이를 구현하여 성능을 비교 검증한다. 실험 결과, WaveNet은 MOS가 가장 높으며 학습 모델 크기가 수백 MB이고 합성시간이 실시간의 50배 정도라는 결과가 나왔다. WaveRNN은 WaveNet과 유사한 MOS 성능을 보여주며 모델 크기가 수십 MB 단위이고 실시간 처리는 어렵다는 결과가 도출됐다. WaveGlow는 실시간 처리가 가능한 방법이며 모델 크기가 수 GB이고 MOS가 세 방식 중에서 가장 떨어진다는 결과를 보여주었다. 본 논문에서는 이러한 연구 결과로부터 TTS 시스템을 적용하는 분야의 하드웨어 환경에 맞춰 적합한 방식을 선정할 수 있는 참고 기준을 제시한다.

다수 가전기기 유효전력의 스팩토그램 분석 및 LSTM기반의 전력 분해 알고리즘 (Spectogram analysis of active power of appliances and LSTM-based Energy Disaggregation)

  • 김임규;김현철;김승윤;신상용
    • 한국융합학회논문지
    • /
    • 제12권2호
    • /
    • pp.21-28
    • /
    • 2021
  • 본 연구에서는 가전기기 5종에 대해 실제 측정 전력 데이터를 이용하여 딥러닝 기반의 NILM 기법을 제안하고 그 효용성을 검증 하고자 한다. 약 3주간 중앙 전력 측정 장치 및 5종 가전기기(냉장고, 인덕션, TV, 세탁기, 공기청정기)의 유효전력을 개별 측정하였다. 실측 데이터의 전처리 방법을 소개하고 Spectogram 분석을 통해 가전 기기별 특징을 분석하였다. 가전기기별 특징을 학습 데이터셋으로 구성하였다. 중앙 전력 측정 기기와 가전기기 5종에서 측정된 모든 전력 데이터를 시계열 매핑하여 시계열 데이터 분석에 우수한 RNN 계열의 LSTM 신경망을 이용해 학습을 수행하였다. 메인 중앙 전력 측정 장치의 전력 데이터만으로도 5종 전력 신호를 분해해낼 수 있는 알고리즘을 제안하였다.

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

딥러닝을 활용한 전시 정원 디자인 유사성 인지 모형 연구 (Development of Deep Recognition of Similarity in Show Garden Design Based on Deep Learning)

  • 조우윤;권진욱
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.96-109
    • /
    • 2024
  • 본 연구는 딥러닝 모델 중 VGG-16 및 ResNet50 모델을 활용하여 전시 정원의 유사성 평가 방법을 제시하는 것에 목적이 있다. VGG-16과 ResNet50 모델을 기반으로 전시 정원 유사성 판단을 위한 모형을 개발하였고, 이를 DRG(deep recognition of similarity in show garden design)모형이라 한다. 평가를 위한 방법으로 GAP와 피어슨 상관계수를 활용한 알고리즘을 사용하여 모형을 구축하고 1순위(Top1), 3순위(Top3), 5순위(Top5)에서 원본 이미지와 유사한 이미지를 도출하는 총 개수 비교로 유사성의 정확도를 분석하였다. DRG 모형에 활용된 이미지 데이터는 국외 쇼몽가든페스티벌 전시 정원 총 278개 작품과 국내 정원박람회인 서울정원박람회 27개 작품 및 코리아가든쇼 전시정원 이미지 17개 작품이다. DRG모형을 활용하여 동일 집단과 타 집단간의 이미지 분석을 진행하였고, 이를 기반으로 전시 정원 유사성의 가이드라인을 제시하였다. 첫째, 전체 이미지 유사성 분석은 ResNet50 모델을 기반으로 하여 데이터 증강 기법을 적용하는 것이 유사성 도출에 적합하였다. 둘째, 내부 구조와 외곽형태에 중점을 둔 이미지 분석에서는 형태에 집중하기 위한 일정한 크기의 필터(16cm × 16cm)를 적용하여 이미지를 생성하고 VGG-16 모델을 적용하여 유사성을 비교하는 방법이 효과적임을 알 수 있었다. 이때, 이미지 크기는 448 × 448 픽셀이 효과적이며, 유채색의 원본 이미지를 기본으로 설정함을 제안하였다. 이러한 연구 결과를 토대로 전시 정원 유사성 판단에 대한 정량적 방법을 제안하고, 향후 다양한 분야와의 융합 연구를 통해 정원 문화의 지속적인 발전에 기여할 것으로 기대한다.