• 제목/요약/키워드: 머신러닝 앙상블

검색결과 71건 처리시간 0.039초

다중 위성 강수자료를 이용한 머신러닝 기반 최적 위성 강수자료 생성 (Generation of the bias-corrected satellite precipitation based on machine learning using multiple satellite precipitation products)

  • 정성호;응웬반지앙;김영훈;이기하
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.40-40
    • /
    • 2021
  • 수재해 방지를 위한 수문해석 모형에서 정량적인 강수자료의 역할은 매우 중요하다. 최근에는 기후변화로 인한 국지성 집중호우 등 돌발 강수의 빈도가 증가하고 있어 지상에 설치된 우량계보다 시·공간적 변동성을 반영할 수 있는 격자형 위성 강수자료의 활용성이 커지고 있다. 하지만 위성강수자료는 관측 시에 대기의 상태 또는 위성별 관측 센서, 공간적 스케일 차이 등에 의해 실제 내린 강수와의 편의가 존재한다. 이를 해결하기 위해 지점 강수자료를 이용한 통계적, 지형정보학적 상세화 기법이 적용되고 있으나, 대부분의 연구에서 강수자료의 양적 보정만을 목적으로 수행되었다. 본 연구에서는 머신러닝 기반의 랜덤포레스트(random forest) 모델을 사용하여 다중위성 강수자료(CHIRPSv2, CMORPH, GSMaP, TRMMv7)와 기상청에서 제공하는 AWS, ASOS 지점 강수를 사용하여 최적 위성강수자료를 생성 후 각 위성강수자료와 비교·분석하였다. 2003년에서 2017년까지의 각 위성강수자료를 수집하여 같은 공간 스케일로 전처리한 뒤 모델에 입력하였으며 AWS 강수자료는 훈련, ASOS 강수자료는 검증에 이용되었다. 그 결과, 생성된 최적 위성강수자료는 각 위성강수자료보다 지점강수와의 편의가 줄고 높은 상관관계를 나타내고 있다. 이는 앞으로 사용될 위성강수자료의 시·공간적 보정 및 단기예측에 활용할 수 있으며, 특히 원격탐사자료의 의존도가 높은 미계측 대유역 수문해석에 정량적인 강수자료를 제공할 수 있을 것으로 판단된다.

  • PDF

데이터 불균형 개선에 따른 탁도 예측 앙상블 머신러닝 모형의 성능 특성 (Performance Characteristics of an Ensemble Machine Learning Model for Turbidity Prediction With Improved Data Imbalance)

  • 양현석;박정수
    • Ecology and Resilient Infrastructure
    • /
    • 제10권4호
    • /
    • pp.107-115
    • /
    • 2023
  • 고 탁도의 원수는 정수장 운영 및 수 생태 환경에 부정적인 영향을 줄 수 있어 관리가 필요한 수질 인자이며, 하천의 탁도 예측을 통해 고 탁도의 원수의 효율적 관리를 수행하기 위해 관련분야에 대한 연구가 지속되고 있다. 본 연구에서는 대표적인 앙상블 머신러닝 알고리즘 중 하나인 LightGBM (light gradient boosting machine)을 이용하여 탁도를 예측하는 다중 분류 모형을 구축하였다. 모형의 구축을 위해 입력자료를 탁도값에 따라 탁도가 낮은 경우부터 높은 경우까지 4개의 class로 구분하였으며, class 1 - 4에 속하는 자료수는 각각 945개, 763개, 95개, 25개로 분류되었다. 구축한 모형의 class 1 - 4에 대한 정밀도 (Precision) 각각 0.85, 0.71, 0.26, 0.30 재현율 (Recall)은 각각 0.82, 0.76, 0.19, 0.60로 데이터 수가 적은 소수 class에서 상대적으로 모형이 성능이 낮은 경향을 보였다. 데이터 불균형을 해소하기 위해 over-sampling알고리즘 중 SMOTE를 적용한 결과 개선된 모형의 class 1 - 4에 대한 정밀도 및 재현율은 각각 0.88, 0.71, 0.26, 0.25 및 0.79, 0.76, 0.38, 0.60으로 데이터 불균형 해소를 통해 모형의 재현율이 크게 개선되는 것을 확인할 수 있었다. 또한 데이터 구성비율이 모형성능에 미치는 영향에 대한 확인을 위하여 입력자료의 구성비를 다양하게 하고 각각의 자료로 구축된 모형의 결과를 비교하여 입력자료 구성비에 따른 모형성능의 차이를 분석하였으며, 모형 입력자료의 구성비의 적정한 산정을 통해 모형의 성능을 향상시킬 수 있음을 확인하였다.

머신러닝을 활용한 자동차 시트용 폴리우레탄 발포공정의 불량 예측 모델 개발 (A Development of Defeat Prediction Model Using Machine Learning in Polyurethane Foaming Process for Automotive Seat)

  • 최낙훈;오종석;안종록;김기선
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.36-42
    • /
    • 2021
  • 최근 4차 산업혁명으로 인해 제조업계에서는 제조업의 인공지능을 접목시켜 효율성을 극대화하는 스마트 팩토리 붐이 일어나고 있다. 특히 자동차 부품 제조 및 생산에 널리 적용되어 불량을 낮추는 연구들이 활발히 진행되고 있다. 이에 본 연구에서는 머신러닝을 통한 불량예측을 시트 폼 발포공정에 접목시켜 발포공정의 효율성을 극대화하는 연구를 진행하였다. 자동차 시트폼 에서 주로 사용되는 폴리우레탄 폼(polyurethane foam)은 폴리올(polyol, 이하 POL)과 이소시아네이트(isocyanate, 이하 ISO)를 혼합 및 발포하는 공정으로 제조되며, 각 원료의 혼합비율과 온도의 변화에 따라 제품의 특성이 변화한다. 이에 본 연구에서는 발포공정에서 수집되는 인자별 데이터값을 머신러닝에 적용하여 불량을 예측하고자 한다. 머신러닝에 사용되는 알고리즘으로는 의사결정트리, kNN, 앙상블 알고리즘을 사용하였으며 학습은 5,147개의 데이터를 사용하였으며, 학습된 결과를 1,000개의 검증용 데이터에 적용한 결과, 세 알고리즘 중 앙상블 알고리즘에서 최대 98.5 %의 정확도를 확인할 수 있었다. 이러한 결과를 통해 발포공정에서 실시간으로 수집되는 데이터를 통해 현재 생산되는 부품의 불량 여부를 확인할 수 있으며, 나아가 각 인자를 조절하여 불량률을 개선할 수 있음을 짐작할 수 있다고 사료된다.

마이터 어택과 머신러닝을 이용한 UNSW-NB15 데이터셋 기반 유해 트래픽 분류 (Malicious Traffic Classification Using Mitre ATT&CK and Machine Learning Based on UNSW-NB15 Dataset)

  • 윤동현;구자환;원동호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 본 연구는 현 보안 관제 시스템이 직면한 실시간 트래픽 탐지 문제를 해결하기 위해 사이버 위협 프레임워크인 마이터 어택과 머신러닝을 이용하여 유해 네트워크 트래픽을 분류하는 방안을 제안하였다. 마이터 어택 프레임워크에 네트워크 트래픽 데이터셋인 UNSW-NB15를 적용하여 라벨을 변환 후 희소 클래스 처리를 통해 최종 데이터셋을 생성하였다. 생성된 최종 데이터셋을 사용하여 부스팅 기반의 앙상블 모델을 학습시킨 후 이러한 앙상블 모델들이 다양한 성능 측정 지표로 어떻게 네트워크 트래픽을 분류하는지 평가하였다. 그 결과 F-1 스코어를 기준으로 평가하였을 때 희소 클래스 미처리한 XGBoost가 멀티 클래스 트래픽 환경에서 가장 우수함을 보였다. 학습하기 어려운 소수의 공격클래스까지 포함하여 마이터 어택라벨 변환 및 오버샘플링처리를 통한 머신러닝은 기존 연구 대비 차별점을 가지고 있으나, 기존 데이터셋과 마이터 어택 라벨 간의 변환 시 완벽하게 일치할 수 없는 점과 지나친 희소 클래스 존재로 인한 한계가 있음을 인지하였다. 그럼에도 불구하고 B-SMOTE를 적용한 Catboost는 0.9526의 분류 정확도를 달성하였고 이는 정상/비정상 네트워크 트래픽을 자동으로 탐지할 수 있을 것으로 보인다.

머신러닝을 이용한 이동통신 데이터 기반 교통량 추정 모형 개발 (A Study on the Development of Traffic Volume Estimation Model Based on Mobile Communication Data Using Machine Learning)

  • 오동섭;윤소식;이철기;조용성
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.1-13
    • /
    • 2023
  • 본 연구는 이동통신 로그 데이터를 통해 산출된 교통량 정보를 활용하여 기존 검지기에 준하는 교통량 정보를 추정하기 위해, 머신러닝의 앙상블 기법을 기반으로 하는 최적의 이동통신 기반 교통량 추정 모형을 개발하는 것이다. 이동통신 데이터를 통해 계측된 교통량 등의 정보와 VDS 실측 데이터를 활용하여 머신러닝 모형들을 통해 비교·분석한 결과, LightGBM 모형이 교통량 추정의 최적모형으로 선정되었다. 국도 1, 3, 6호선 검지영역 96개소를 대상으로 교통량 추정 모형의 성능을 평가한 결과, 전체 검지영역의 경우 MAPE 8.49로 교통량 추정 정확도가 91.51%로 분석되었다. VDS가 설치되지 않은 구간의 경우 교통량 추정 정확도는 92.6%로, VDS 설치가 어려운 구간에서도 LightGBM 교통량 추정 모형이 적용 가능하였다.

머신러닝 기반 고속도로 내 수소충전소 최적입지 선정 연구 (A Study on the Optimal Location Selection for Hydrogen Refueling Stations on a Highway using Machine Learning)

  • 조재혁;김성수
    • 지적과 국토정보
    • /
    • 제51권2호
    • /
    • pp.83-106
    • /
    • 2021
  • 대기오염, 지구온난화 문제 등 환경 문제의 심각성이 대두되면서 청정 연료의 관심이 커지고 있다. 그 중 수소는 기존 화석연료와는 달리 연소 시 부산물로 수분만이 발생하는 대표적인 친환경 에너지원으로 현재 다양한 분야에서 주목을 받고 있다. 물류 분야에서도 수소를 활용한 물류 네트워크를 구축하기 위해 다양한 정책적 노력이 활발히 이루어지고 있다. 이러한 수소 물류 네트워크의 구축에 있어 수소충전소의 입지 결정은 매우 중요한 문제이다. 최근 개발된 수소추진(수소연료전지) 화물차에 수소를 공급하는 충전소는 수소 기반 물류체계가 본격적으로 자리 잡는 데 있어 필수 불가결한 요소이다. 이러한 수소충전소의 최적 입지를 결정하는 선행연구는 대부분 수리적 모형에 기반한 최적화 기법만을 사용하여 수소충전소의 최적 입지를 결정하고자 하였다. 본 연구에서는 기존 연구의 동향과는 차별화하여 최적화 기법의 중요한 투입 변수 중 하나인 충전소 후보지에 대한 공간적 특성을 검토하는 방법으로 머신러닝 모형들을 활용하고 그 적용가능성을 확인하였다. 머신러닝은 다양한 분야에서 우수한 성과를 증명한 기법이지만 수소충전소의 최적 입지를 결정하는 연구 분야에서는 아직 적용된 바가 없다. 이를 위해 본 연구에서는 개별공시지가, 수소공급지와의 거리 등 전국 고속도로 휴게소와 고속도로의 무작위 지점들의 위치와 관련된 변수들을 독립변수로 선정하여 단일 머신러닝 모형과 앙상블 모형을 적용하고 그 성과를 비교하였다. 분석 결과, 랜덤포레스트(Random Forest) 모형이 가장 우수한 성과를 보였으며, 다른 모형들 또한 우수한 분류 성능을 보여 최적 입지 문제에 대해 공간적 특성을 예비적으로 검토하는 방법론으로써 머신러닝의 적용 가능성을 확인할 수 있었다. 따라서 머신러닝 모형은 수소충전소의 최적 입지 결정 분야에서 향후 최적화 기법을 적용한 연구의 예비적 검토 방법론으로 널리 활용할 수 있을 것으로 기대된다.

하이브리드 Auto-sklearn 앙상블 모델을 이용한 댐 유입량 예측 및 평가 (Dam Inflow Prediction and Evaluation Using Hybrid Auto-sklearn Ensemble Model)

  • 이서로;배주현;이관재;양동석;홍지영;김종건;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.307-307
    • /
    • 2022
  • 최근 기후변화와 댐 상류 토지이용 변화 등과 같은 다양한 원인에 의해 댐 유입량의 변동성이 증가하면서 댐 관리 및 운영조작 의사 결정에 어려움이 발생하고 있다. 따라서 이러한 댐 유입량의 변동 특성을 반영하여 댐 유입량을 정확하고 효율적으로 예측할 수 있는 방안이 필요한 실정이다. 머신러닝 기술이 발전하면서 Auto-ML(Automated Machine Learning)이 다양한 분야에서 활용되고 있다. Auto-ML은 데이터 전처리, 최적 알고리즘 선택, 하이퍼파라미터 튜닝, 모델 학습 및 평가 등의 모든 과정을 자동화하는 기술이다. 그러나 아직까지 수문 분야에서 댐 유입량을 예측하기 위한 모델을 개발하는데 있어서 Auto-ML을 활용한 사례는 부족하고, 특히 댐 유입량의 예측 정확성을 확보하기 위해 High-inflow and low-inflow 의 변동 특성을 고려한 하이브리드 결합 방식을 통해 Auto-ML 기반 앙상블 모델을 개발하고 평가한 연구는 없다. 본 연구에서는 Auto-ML의 패키지 중 Auto-sklearn을 통해 홍수기, 비홍수기 유입량 변동 특성을 반영한 하이브리드 앙상블 댐 유입량 예측 모델을 개발하였다. 소양강댐을 대상으로 적용한 결과, 하이브리드 Auto-sklearn 앙상블 모델의 댐 유입량 예측 성능은 R2 0.868, RMSE 66.23 m3/s, MAE 16.45 m3/s로 단일 Auto-sklearn을 통해 구축 된 앙상블 모델보다 전반적으로 우수한 것으로 나타났다. 특히 FDC (Flow Duration Curve)의 저수기, 갈수기 구간에서 두 모델의 유입량 예측 경향은 큰 차이를 보였으며, 하이브리드 Auto-sklearn 모델의 예측 값이 관측 값과 더욱 유사한 것으로 나타났다. 이는 홍수기, 비홍수기 구간에 대한 앙상블 모델이 독립적으로 구축되는 과정에서 각 모델에 대한 하이퍼파라미터가 최적화되었기 때문이라 판단된다. 향후 본 연구의 방법론은 보다 정확한 댐 유입량 예측 자료를 생성하기 위한 방안 수립뿐만 아니라 다양한 분야의 불균형한 데이터셋을 이용한 앙상블 모델을 구축하는데도 유용하게 활용될 수 있을 것으로 사료된다.

  • PDF

Multi-Time Window Feature Extraction Technique for Anger Detection in Gait Data

  • Beom Kwon;Taegeun Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.41-51
    • /
    • 2023
  • 본 논문에서는 보행자의 걸음걸이로부터 분노 감정 검출을 위한 다중 시간 윈도 특징 추출 기술을 제안한다. 기존의 걸음걸이 기반 감정인식 기술에서는 보행자의 보폭, 한 보폭에 걸리는 시간, 보행 속력, 목과 흉부의 전방 기울기 각도(Forward Tilt Angle)를 계산하고, 전체 구간에 대해서 최솟값, 평균값, 최댓값을 계산해서 이를 특징으로 활용하였다. 하지만 이때 각 특징은 보행 전체 구간에 걸쳐 항상 균일하게 변화가 발생하는 것이 아니라, 때로는 지역적으로 변화가 발생한다. 이에 본 연구에서는 장기부터 중기 그리고 단기까지 즉, 전역적인 특징과 지역적인 특징을 모두 추출할 수 있는 다중 시간 윈도 특징 추출(Multi-Time Window Feature Extraction) 기술을 제안한다. 또한, 제안하는 특징 추출 기술을 통해 각 구간에서 추출된 특징들을 효과적으로 학습할 수 있는 앙상블 모델을 제안한다. 제안하는 앙상블 모델(Ensemble Model)은 복수의 분류기로 구성되며, 각 분류기는 서로 다른 다중 시간 윈도에서 추출된 특징으로 학습된다. 제안하는 특징 추출 기술과 앙상블 모델의 효과를 검증하기 위해 일반인에게 공개된 3차원 걸음걸이 데이터 세트를 사용하여 시험 평가를 수행했다. 그 결과, 4가지 성능 평가지표에 대해서 제안하는 앙상블 모델이 기존의 특징 추출 기술로 학습된 머신러닝(Machine Learning) 모델들과 비교하여 최고의 성능을 달성하는 것을 입증하였다.

머신러닝 기법과 TBM 시공정보를 활용한 토압식 쉴드TBM 굴진율 예측 연구 (A Study on Prediction of EPB shield TBM Advance Rate using Machine Learning Technique and TBM Construction Information)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제30권6호
    • /
    • pp.540-550
    • /
    • 2020
  • 최근 AI 기술의 발전과 정립으로 자동화 분야에서 머신러닝 기법의 활용이 활발하게 이루어지고 있다. 머신러닝 기법의 활용에 있어 중요한 점은 데이터 특성에 따라 적합한 알고리즘이 존재한다는 점이며, 머신러닝 기법 적용을 위한 데이터세트의 분석이 필요하다. 본 연구에서는 다양한 머신러닝 기법을 기반으로 하천 하부의 토사지반을 통과하는 토압식 쉴드TBM 터널 구간의 지반정보와 굴진정보를 사용하여 토압식 쉴드TBM의 굴진율을 예측하였다. 선형회귀모델에서 모델의 통계적인 유의성과 다중공선성에서는 문제가 없었으나 결정계수가 0.76으로 나타났고 앙상블 모델과 서포트 벡터 머신에서는 0.88이상의 예측성능을 보여, 분석한 데이터세트에서 토압식 쉴드TBM 굴진성능예측에 적합한 모델은 서포트 벡터 머신임을 알 수 있었다. 현재 도출된 결과로 볼 때, 토압식 쉴드TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 굴진성능 예측 모델의 적합성은 높다고 판단된다. 추가적으로 지반조건의 다양성과 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

기후변화 및 기후변동성을 고려한 LSTM 모형 기반 유입량 예측 (LSTM model predictions of inflow considering climate change and climate variability)

  • 권지환;김종호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.348-348
    • /
    • 2022
  • 미래에 대한 기후는 과거와 비교하여 변동성이 더 크고 불확실성 또한 더 크기 때문에 미래의 기후변화를 예측하기 위해서는 기후변화의 절대적인 크기뿐 아니라 불확실한 정도도 함께 고려되어야 한다. 본 연구에서는 CMIP6(Coupled Model Intercomparison Project Phase 6) DB에서 제공된 일 단위 18개의 GCMs(General Circulation Models)의 결과를 분석하였으며 또한 3개의SSP(Shared Socioeconomic Pathway)시나리오와 3개의 미래 구간에 대하여 100개의 앙상블을 각각 생성하였다. 불확실성을 초래하는 원인을 3가지로 구분하고, 각각의 원인에 대한 불확실성의 정도를 앙상블 시나리오에 반영하고자 한다. 현재 기간 및 미래 기간에 대해 100개의 20년 시계열 날씨변수 앙상블을 생성하여 LSTM(Long short-term memory)의 입력자료로 사용하여 댐유입량, 저수위, 방류량을 산정하였다. 댐 유입량 및 방류량의 예측성능을 향상시키기 위해 Input predictor의 종류를 선정하는 방법과 그 변수들의 lag time을 결정하는 방법, 입력자료들을 재구성하는 방법, 하이퍼 매개변수를 효율적으로 최적화하는 방법, 목적함수 설정 방법들을 제시하여 댐 유입량 및 방류량의 예측을 크게 향상시키고자 하였다. 본 연구에서 예측된 미래의 댐유입량 및 방류량 정보는 홍수 또는 가뭄 등 다양한 수자원 관련 문제의 전략을 수립하는 데 있어서 적절한 도움이 될 것이다.

  • PDF