• Title/Summary/Keyword: Machine Learning

Search Result 5,285, Processing Time 0.041 seconds

Analysis of water surface spectral characteristics for Chlorophyll-a estimation in Baekje weir upstream reach and Namyang lake using Drone and Sentinel-2 (백제보 상류하천구간과 남양 간척담수호내의 Chlorophyll-a 산정을 위한 Drone 및 Sentinel-2 수체분광특성 분석)

  • Jang, Wonjin;Kim, Jinuk;Lee, Yonggwan;Park, Yongeun;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.27-27
    • /
    • 2022
  • 본 연구는 본 연구에서는 내륙에 위치한 하천(백제보)과 호소(남양호)를 대상으로 수체반사도를 활용하여 유역특성에 따른 반사도의 변화를 확인하고 Chlorophyll-a(Chl-a)의 농도를 추정하고자 하였다. 각 유역별 특성분석을 위해 제원자료, 토지피복도 및 11개(수소이온농도, 용존산소, BOD, COD, 부유물질, 총질소, 총인, 수온, 전기전도도 및 Chlorophyll-a)의 수질인자 자료를 구축하였다. 백제보는 2016-2017년 유인항공기에 탑재된 초분광센서를 이용하여 반사도를 측정하였고, 남양호는 2020-2021년 초분광센서가 탑재된 Drone과 Sentinel-2 MSI영상으로부터 반사도를 측정하였으며 두 유역 모두 촬영 범위에 대하여 현장샘플링을 실시하였다. 유역특성, 수질인자간 상관성 및 밴드별 상관성 분석을 실시하였다. 수질인자 간 상관성 분석 결과 Chl-a와 광학적 특징이 있는 SS, TOC가 상관성이 높게 나타났으며, 반사도의 경우 Chl-a가 고농도일수록 Near-Infrared, Blue 파장과 상관성이 높게 나타났다. 해당 분석결과를 기반으로 각 유역에 대해 Chl-a Machine-learning 기법과 원격탐사자료를 이용하여 Chl-a의 농도를 산정하였으며 백제보, 남양호 각각 결정계수(R2) 0.80, 0.88의 성능을 보였다. 추후 고해상도 광학위성영상을 통해 유역특성을 고려한 광범위한 지역 규모의 Chl-a의 시공간적 분석이 가능할 것으로 판단된다.

  • PDF

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Dam Inflow Prediction and Evaluation Using Hybrid Auto-sklearn Ensemble Model (하이브리드 Auto-sklearn 앙상블 모델을 이용한 댐 유입량 예측 및 평가)

  • Lee, Seoro;Bae, Joo Hyun;Lee, Gwanjae;Yang, Dongseok;Hong, Jiyeong;Kim, Jonggun;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.307-307
    • /
    • 2022
  • 최근 기후변화와 댐 상류 토지이용 변화 등과 같은 다양한 원인에 의해 댐 유입량의 변동성이 증가하면서 댐 관리 및 운영조작 의사 결정에 어려움이 발생하고 있다. 따라서 이러한 댐 유입량의 변동 특성을 반영하여 댐 유입량을 정확하고 효율적으로 예측할 수 있는 방안이 필요한 실정이다. 머신러닝 기술이 발전하면서 Auto-ML(Automated Machine Learning)이 다양한 분야에서 활용되고 있다. Auto-ML은 데이터 전처리, 최적 알고리즘 선택, 하이퍼파라미터 튜닝, 모델 학습 및 평가 등의 모든 과정을 자동화하는 기술이다. 그러나 아직까지 수문 분야에서 댐 유입량을 예측하기 위한 모델을 개발하는데 있어서 Auto-ML을 활용한 사례는 부족하고, 특히 댐 유입량의 예측 정확성을 확보하기 위해 High-inflow and low-inflow 의 변동 특성을 고려한 하이브리드 결합 방식을 통해 Auto-ML 기반 앙상블 모델을 개발하고 평가한 연구는 없다. 본 연구에서는 Auto-ML의 패키지 중 Auto-sklearn을 통해 홍수기, 비홍수기 유입량 변동 특성을 반영한 하이브리드 앙상블 댐 유입량 예측 모델을 개발하였다. 소양강댐을 대상으로 적용한 결과, 하이브리드 Auto-sklearn 앙상블 모델의 댐 유입량 예측 성능은 R2 0.868, RMSE 66.23 m3/s, MAE 16.45 m3/s로 단일 Auto-sklearn을 통해 구축 된 앙상블 모델보다 전반적으로 우수한 것으로 나타났다. 특히 FDC (Flow Duration Curve)의 저수기, 갈수기 구간에서 두 모델의 유입량 예측 경향은 큰 차이를 보였으며, 하이브리드 Auto-sklearn 모델의 예측 값이 관측 값과 더욱 유사한 것으로 나타났다. 이는 홍수기, 비홍수기 구간에 대한 앙상블 모델이 독립적으로 구축되는 과정에서 각 모델에 대한 하이퍼파라미터가 최적화되었기 때문이라 판단된다. 향후 본 연구의 방법론은 보다 정확한 댐 유입량 예측 자료를 생성하기 위한 방안 수립뿐만 아니라 다양한 분야의 불균형한 데이터셋을 이용한 앙상블 모델을 구축하는데도 유용하게 활용될 수 있을 것으로 사료된다.

  • PDF

Classification of hysteretic loop feature for runoff generation through a unsupervised machine learning algorithm (비지도 기계학습을 통한 유출 발생 내 이력 현상 구분)

  • Lee, Eunhyung;Jeon, Hangtak;Kim, Dahong;Friday, Bassey Bassey;Kim, Sanghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.360-360
    • /
    • 2022
  • 토양수분과 유출 간 관계를 정량화하는 것은 수문 기작 및 유출 발생 과정의 이해를 위한 중요한 정보를 제공한다. 특히, 유출과정의 특성화는 수문 사상에 따른 불포화대 내 토양수 및 토사 손실 제어와 산사태 및 비점오염원 발생 예측을 위해 필수적이다. 유출과정과 관련된 비선형성과 복잡성을 확인하기 위해 토양수분과 유출 사이의 이력 거동이 조사되었다. 특히, 수문 과정 내 이력 현상 구체화를 위해 정성적인 시각적 분류 및 정량적 평가를 위한 이력 지수들이 개발되었다. 정성적인 시각적 분류는 시간에 따라 시계 및 반시계방향으로 다중 루프 형상을 나누는 방식으로 진행되었고, 정량적 평가의 경우 이력 고리(Hysteretic loop) 내 상승 고리(Rising limb)와 하강 고리(Falling limb)의 차이를 기준으로 한 지수로 이력 현상을 특성화하였다. 이전에 제안된 방법론들은 연구자의 판단이 들어가기 때문에 보편적이지 않고 이력 현상을 개발된 지수에 맞춤에 따라 자료 손실이 나타나는 한계가 존재한다. 자료의 손실 없이 불포화대 내 발생 가능한 대표 이력 현상을 자동으로 추출하기 위해 적합한 비지도 학습기반 기계학습 방법론의 제안이 필요하다. 우리 연구에서는 국내 산지 사면에서 강우 사상 동안 다중 깊이(10, 30, 60cm)로 56개의 토양수분 측정지점에서 확보된 토양수분 시계열 자료와 산지 사면 내 위어를 통해 확보된 유출 시계열 자료를 사용하였다. 먼저, 기존에 분류 방법을 기반으로 계절 및 공간특성에 따라 지배적으로 발생하는 토양수분-유출 간 이력 현상을 특성화하였다. 다음으로, 토양수분-유출 간 이력 패턴을 자료 손실 없이 형상화하여 자동으로 데이터베이스화하는 알고리즘을 개발하였다. 마지막으로, 비지도 학습방법을 이용하여 데이터베이스화된 실제 발현 이력 현상 내 확률분포를 최대한 가깝게 추정하는 은닉층을 반복적인 재구성 학습을 통해 구현함으로써 대표 이력 현상 패턴을 추출하였다.

  • PDF

A Study on the Hydrological Quantitative Precipitation Forecast(HQPF) based on Machine Learning for Rainfall Impact Forecasting (호우 영향예보를 위한 머신러닝 기반의 수문학적 정량강우예측(HQPF) 연구)

  • Choo, Kyung-Su;Shin, Yoon-Hu;Kim, Sung-Min;Jee, Yongkeun;Lee, Young-Mi;Kang, Dong-Ho;Kim, Byung-Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.63-63
    • /
    • 2022
  • 기상 예보자료는 발생 가능한 재난의 예방 및 대비 차원에서 매우 중요한 자료로 활용되고 있다. 우리나라 기상청에서는 동네예보를 통해 5km 공간해상도의 1시간 간격 초단기예보와, 6시간 간격 정량강우예보(Quantitative Precipitation Forecast, QPF)의 단기예보 정보를 제공하고 있다. 그러나 이와 같은 예보자료는 강우량의 시·공간변화가 큰 집중호우와 같은 기상자료를 활용한 수문학적인 해석에는 한계가 있다. 예보자료를 수문학에 활용하기 위한 시·공간적 해상도 개선뿐만 아니라 방대한 기상 및 기후 자료의 예측성능을 개선하기 위한 다양한 연구가 진행되고 있다. 본 연구에서는 기상청이 제공하는 지역 앙상블 예측 시스템(Local ENsemble prediction System, LENS)와 종관기상관측시스템(ASOS) 및 방재기상관측시스템(AWS) 관측 데이터 및 동네예보에 기계학습 방법을 적용하여 수문학적 정량적 강수량 예측(Hydrological Quantitative Precipitation Forecast, HQPF) 정보를 생산하였다. 전처리 과정을 통해 모든 데이터의 시간해상도와 공간해상도를 동일한 해상도로 변환하였으며, 예측 변수의 인자 분석을 통해 기계학습의 예측 변수를 도출하였다. 기계학습 방법으로는 처리속도와 확장성을 고려하여 XGBoost(eXtreme Gradient Boosting) 방식을 적용하였으며, 집중호우에서의 예측정확도를 높이기 위해 확률매칭(PM) 방식을 적용하였다. 생산된 HQPF의 성능을 평가하기 위해 2020년에 발생한 14건의 호우 사상을 대상으로 태풍형과 비태풍형으로 구분하여 검증을 수행하였다.

  • PDF

Effective Speaker Recognition Technology Using Noise (잡음을 활용한 효과적인 화자 인식 기술)

  • Ko, Suwan;Kang, Minji;Bang, Sehee;Jung, Wontae;Lee, Kyungroul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.259-262
    • /
    • 2022
  • 정보화 시대 스마트폰이 대중화되고 실시간 인터넷 사용이 가능해짐에 따라, 본인을 식별하기 위한 사용자 인증이 필수적으로 요구된다. 대표적인 사용자 인증 기술로는 아이디와 비밀번호를 이용한 비밀번호 인증이 있지만, 키보드로부터 입력받는 이러한 인증 정보는 시각 장애인이나 손 사용이 불편한 사람, 고령층과 같은 사람들이 많은 서비스로부터 요구되는 아이디와 비밀번호를 기억하고 입력하기에는 불편함이 따를 뿐만 아니라, 키로거와 같은 공격에 노출되는 문제점이 존재한다. 이러한 문제점을 해결하기 위하여, 자신의 신체의 특징을 활용하는 생체 인증이 대두되고 있으며, 그중 목소리로 사용자를 인증한다면, 효과적으로 비밀번호 인증의 한계점을 극복할 수 있다. 이러한 화자 인식 기술은 KT의 기가 지니와 같은 음성 인식 기술에서 활용되고 있지만, 목소리는 위조 및 변조가 비교적 쉽기에 지문이나 홍채 등을 활용하는 인증 방식보다 정확도가 낮고 음성 인식 오류 또한 높다는 한계점이 존재한다. 상기 목소리를 활용한 사용자 인증 기술인 화자 인식 기술을 활용하기 위하여, 사용자 목소리를 학습시켰으며, 목소리의 주파수를 추출하는 MFCC 알고리즘을 이용해 테스트 목소리와 정확도를 측정하였다. 그리고 악의적인 공격자가 사용자 목소리를 흉내 내는 경우나 사용자 목소리를 마이크로 녹음하는 등의 방법으로 획득하였을 경우에는 높은 확률로 인증의 우회가 가능한 것을 검증하였다. 이에 따라, 더욱 효과적으로 화자 인식의 정확도를 향상시키기 위하여, 본 논문에서는 목소리에 잡음을 섞는 방법으로 화자를 인식하는 방안을 제안한다. 제안하는 방안은 잡음이 정확도에 매우 민감하게 반영되기 때문에, 기존의 인증 우회 방법을 무력화하고, 더욱 효과적으로 목소리를 활용한 화자 인식 기술을 제공할 것으로 사료된다.

  • PDF

EDNN based prediction of strength and durability properties of HPC using fibres & copper slag

  • Gupta, Mohit;Raj, Ritu;Sahu, Anil Kumar
    • Advances in concrete construction
    • /
    • v.14 no.3
    • /
    • pp.185-194
    • /
    • 2022
  • For producing cement and concrete, the construction field has been encouraged by the usage of industrial soil waste (or) secondary materials since it decreases the utilization of natural resources. Simultaneously, for ensuring the quality, the analyses of the strength along with durability properties of that sort of cement and concrete are required. The prediction of strength along with other properties of High-Performance Concrete (HPC) by optimization and machine learning algorithms are focused by already available research methods. However, an error and accuracy issue are possessed. Therefore, the Enhanced Deep Neural Network (EDNN) based strength along with durability prediction of HPC was utilized by this research method. Initially, the data is gathered in the proposed work. Then, the data's pre-processing is done by the elimination of missing data along with normalization. Next, from the pre-processed data, the features are extracted. Hence, the data input to the EDNN algorithm which predicts the strength along with durability properties of the specific mixing input designs. Using the Switched Multi-Objective Jellyfish Optimization (SMOJO) algorithm, the weight value is initialized in the EDNN. The Gaussian radial function is utilized as the activation function. The proposed EDNN's performance is examined with the already available algorithms in the experimental analysis. Based on the RMSE, MAE, MAPE, and R2 metrics, the performance of the proposed EDNN is compared to the existing DNN, CNN, ANN, and SVM methods. Further, according to the metrices, the proposed EDNN performs better. Moreover, the effectiveness of proposed EDNN is examined based on the accuracy, precision, recall, and F-Measure metrics. With the already-existing algorithms i.e., JO, GWO, PSO, and GA, the fitness for the proposed SMOJO algorithm is also examined. The proposed SMOJO algorithm achieves a higher fitness value than the already available algorithm.

Ship Type Prediction using Random Forest with Limited Ship Information (제한적 선박 정보와 무작위의 숲 분류기를 이용한 선종 예측)

  • Ho-Kun Jeon;Jae Rim Han
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.106-107
    • /
    • 2022
  • The ship type identification of the surrounding ship is important information for navigators and VTS officers since they can estimate the maneuverability and near-future route of the ships. However, it is more than frequent that the information is not provided due to transmission trouble and seafarers' unfamiliarity with AIS. Thus, this study suggests predicting ship types through the Random Forest classifier after preparing a training and test dataset that contains ship features and types. The AIS data for Ulsan coast in 2018 was used for this study. The method may provide the effect that many navigators and VTS officers discuss and share the experience of predicting ship types.

  • PDF

Application and Comparison of Data Mining Technique to Prevent Metal-Bush Omission (메탈부쉬 누락예방을 위한 데이터마이닝 기법의 적용 및 비교)

  • Sang-Hyun Ko;Dongju Lee
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.46 no.3
    • /
    • pp.139-147
    • /
    • 2023
  • The metal bush assembling process is a process of inserting and compressing a metal bush that serves to reduce the occurrence of noise and stable compression in the rotating section. In the metal bush assembly process, the head diameter defect and placement defect of the metal bush occur due to metal bush omission, non-pressing, and poor press-fitting. Among these causes of defects, it is intended to prevent defects due to omission of the metal bush by using signals from sensors attached to the facility. In particular, a metal bush omission is predicted through various data mining techniques using left load cell value, right load cell value, current, and voltage as independent variables. In the case of metal bush omission defect, it is difficult to get defect data, resulting in data imbalance. Data imbalance refers to a case where there is a large difference in the number of data belonging to each class, which can be a problem when performing classification prediction. In order to solve the problem caused by data imbalance, oversampling and composite sampling techniques were applied in this study. In addition, simulated annealing was applied for optimization of parameters related to sampling and hyper-parameters of data mining techniques used for bush omission prediction. In this study, the metal bush omission was predicted using the actual data of M manufacturing company, and the classification performance was examined. All applied techniques showed excellent results, and in particular, the proposed methods, the method of mixing Random Forest and SA, and the method of mixing MLP and SA, showed better results.

Comparison of RANS, URANS, SAS and IDDES for the prediction of train crosswind characteristics

  • Xiao-Shuai Huo;Tang-Hong Liu;Zheng-Wei Chen;Wen-Hui Li;Hong-Rui Gao;Bin Xu
    • Wind and Structures
    • /
    • v.37 no.4
    • /
    • pp.303-314
    • /
    • 2023
  • In this study, two steady RANS turbulence models (SST k-ω and Realizable k-ε) and four unsteady turbulence models (URANS SST k-ω and Realizable k-ε, SST-SAS, and SST-IDDES) are evaluated with respect to their capacity to predict crosswind characteristics on high-speed trains (HSTs). All of the numerical simulations are compared with the wind tunnel values and LES results to ensure the accuracy of each turbulence model. Specifically, the surface pressure distributions, time-averaged aerodynamic coefficients, flow fields, and computational cost are studied to determine the suitability of different models. Results suggest that the predictions of the pressure distributions and aerodynamic forces obtained from the steady and transient RANS models are almost the same. In particular, both SAS and IDDES exhibits similar predictions with wind tunnel test and LES, therefore, the SAS model is considered an attractive alternative for IDDES or LES in the crosswind study of trains. In addition, if the computational cost needs to be significantly reduced, the RANS SST k-ω model is shown to provide relatively reasonable results for the surface pressures and aerodynamic forces. As a result, the RANS SST k-ω model might be the most appropriate option for the expensive aerodynamic optimizations of trains using machine learning (ML) techniques because it balances solution accuracy and resource consumption.