• Title/Summary/Keyword: 회귀분석 모델

Search Result 1,518, Processing Time 0.033 seconds

Flood Risk Forecasting using Logistic Regression for the Han River Basin (로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발)

  • Lee, Seon Mi;Choi, Youngje;Yi, Jaeeung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

A Study on the Development of Anomaly Detection Prediction Model for Deep Learning-Based Drilling Equipment (딥러닝 기반 시추장비 이상 예측 및 진단 모델 개발 연구)

  • Han, Dong-Kwon;Kim, Min-Soo;Kwon, Sun-Il;Choi, Jung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.404-407
    • /
    • 2021
  • 석유개발 현장에서 시추장비의 고장으로 인한 장비교체 및 시추시간 증가는 막대한 비용소모를 발생시킨다. 본 논문은 딥러닝 기반의 시추장비 중 드릴비트의 동력을 구동시키는 디젤엔진의 고장 요소를 분류하고 이 요소에 따른 고장여부를 판별하는 딥러닝 기반의 이상 예측 및 진단 모델을 개발하였다. 또한 제안한 모델의 우수성을 확인하기 위해 로지스틱 회귀분석 분류모델과의 예측성능 비교분석도 수행하였다.

Study on the Optimization of Low Heat-Input Pluse MIG Welding Process for Aluminum Alloy sheets using the response surface methodology(RSM) (반응표면분석법을 이용한 박판 알루미늄 합금의 저입열 Pulse MIG 용접 변수 최적화에 관한 연구)

  • Kim, Kae-Seong;Hwang, Ji-Hye;Choi, Dong-Sun;Lee, Bo-Yong
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2010.04a
    • /
    • pp.624-627
    • /
    • 2010
  • 최근 자동차 업계서는 차량의 온실가스 배출량을 줄이고 연비를 개선시킬 수 있는 방법 중의 하나로 경량화 소재를 사용하여 차체의 중량을 줄이는 연구가 활발히 진행 중에 있다. 특히 알루미늄 합금의 경우 기존 강재에 비해 비중이 낮아 가볍고 부식에 대한 저항성이 높아 많이 사용되어지고 있는 추세이다. 본 연구에서는 먼저, 저입열 용접공정을 적용하여 용접 변수와 토치의 각도에 따른 인장강도 특성을 비교하여 적정 용접 범위를 산정하였으며, 인장강도와 비드형상의 관계를 다중 회귀 분석을 이용하여 비드 예측 회귀 모델을 제시하였다. 또한 호감도 함수를 적용한 반응표면분석법을 이용하여 자동차 생산 현장에서 겹치기 용접 이음부의 강건한 용접 품질을 가질 수 있는 최적용접 공정 조건을 도출할 수 있는 효과적인 방법을 제안하고자 한다.

  • PDF

Prediction of complex disease using Decision Rules (의사결정규칙을 이용한 복합 질환의 예측)

  • Kim, Myoung-Ki;Kim, Seung-Hyun;Wee, Kyu-Bum
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.593-596
    • /
    • 2007
  • 복합 질환과 관련된 임상데이터에 대한 예측 모델을 회귀분석, 신경망, 또는 MDR과 같은 방법을 이용하여 분석할 경우 데이터의 차원 문제(Dimensionality Problem)가 발생할 수 있다. 엔트로피(Entropy)를 이용한 의사결정규칙 방법은 이러한 데이터의 차원 문제를 줄이고 의사결정규칙의 결과를 바로 해석할 수 있다는 점에서 질환 예측 모델을 만드는데 유용하다. 본 논문에서는 천식과 관련된 임상데이터를 사용하여 예측 모델을 구성하고 결과를 분석한다.

  • PDF

지각된 가치와 사회적 영향이 공유경제 이용의도에 미치는 영향: 사회적자본의 조절효과를 중심으로

  • Kim, So-Yeong;Park, Sang-Hyeok
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2019.04a
    • /
    • pp.103-107
    • /
    • 2019
  • 최근 에어비앤비나 우버와 같은 협력적 소비 기반의 비즈니스모델을 가진 공유경제가 성장하고 있다. 본 논문은 공유경제에 대한 개념을 정의하고, 이용의도에 미치는 영향을 분석하였다. 본 논문은 경제적, 기능적, 경험적, 사회적 가치를 포함한 4가지 지각된 가치와 주관적 규범, 이미지, 사회적 임계점을 구성하는 3가지 사회적 영향이 공유경제 이용의도에 미치는 영향을 알아보고 신뢰와 사회적 규범, 네트워크와 사회구조를 포함한 사회적자본의 조절효과에 관심을 두고 있다. 가설을 검증하고자 온라인과 오프라인에서 설문조사를 실시하였고, 지각된 가치와 사회적 영향이 공유경제 이용의도에 미치는 영향을 알아보고자 변수별로 다중회귀분석을 실시하였다. 또한 사회적자본의 조절효과를 알아보기 위하여 위계적인 회귀분석을 실시하였다. 다중회귀분석 결과는 다음과 같다. 지각된 가치 중 경제적, 경험적 가치는 공유경제 이용의도에 영향을 미치는 것으로 나타났다. 위계적인 회귀분석의 결과에서 사회적자본은 지각된 가치와 사회적 영향의 공유경제 이용의도 관계에 있어 조절적인 영향을 미치는 것으로 나타났다. 본 연구는 지각된 가치를 통합적 분석, 기존 공유경제 연구에서 자주 다뤄지지 않았던 사회적 영향과 사회적자본의 요인을 다룬 점에 의미가 있지만, 설문조사 결과의 한계가 있었기에 향후 새로운 연구 방향성을 제시할 수 있다.

  • PDF

A Regression Model for Estimating Solid Wastes of Apartment Construction (아파트 신축공사의 건설폐기물 발생량 예측 회귀모델)

  • Kim Sung-Hoon;Park Sung-Soo;Park Sung-Chul;Um Ik-Jun;Koo Kyo-Jin
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • 2004.11a
    • /
    • pp.329-334
    • /
    • 2004
  • The objective of this study regards the preceding condition of the construction disposal of waste which is appropriate, with occurrence quantity DB anger the occurrence quantity prediction which is accurate the regression model which it sees and with the method which is mote accurate prediction method of existing than to sleep it presents it does. This study acquires apartment results data of public construction and civil construction, and chose factor that exert biggest influence on the waste occurrence amount through question and interview memorial address by regression model variable. And presented regression mode] which uses statistics program named SPSS. Result of this study by regression model through constant results data DB anger existent error big experience than estimate method that corrector estimation is available show.

  • PDF

Predicting the success of CDM Registration for Hydropower Projects using Logistic Regression and CART (로그 회귀분석 및 CART를 활용한 수력사업의 CDM 승인여부 예측 모델에 관한 연구)

  • Park, Jong-Ho;Koo, Bonsang
    • Korean Journal of Construction Engineering and Management
    • /
    • v.16 no.2
    • /
    • pp.65-76
    • /
    • 2015
  • The Clean Development Mechanism (CDM) is the multi-lateral 'cap and trade' system endorsed by the Kyoto Protocol. CDM allows developed (Annex I) countries to buy CER credits from New and Renewable (NE) projects of non-Annex countries, to meet their carbon reduction requirements. This in effect subsidizes and promotes NE projects in developing countries, ultimately reducing global greenhouse gases (GHG). To be registered as a CDM project, the project must prove 'additionality,' which depends on numerous factors including the adopted technology, baseline methodology, emission reductions, and the project's internal rate of return. This makes it difficult to determine ex ante a project's acceptance as a CDM approved project, and entails sunk costs and even project cancellation to its project stakeholders. Focusing on hydro power projects and employing UNFCCC public data, this research developed a prediction model using logistic regression and CART to determine the likelihood of approval as a CDM project. The AUC for the logistic regression and CART model was 0.7674 and 0.7231 respectively, which proves the model's prediction accuracy. More importantly, results indicate that the emission reduction amount, MW per hour, investment/Emission as crucial variables, whereas the baseline methodology and technology types were insignificant. This demonstrates that at least for hydro power projects, the specific technology is not as important as the amount of emission reductions and relatively small scale projects and investment to carbon reduction ratios.

Improvement of Search Method of Genetic Programing for Wind Prediction MOS (풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선)

  • Oh, Seungchul;Seo, Kisung
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

  • PDF

An Analysis Study for Optimal Uptake of Nutrient Solution Based on Multiple Linear Regression Model in Strawberry Hydroponic Environments (딸기 수경 재배 환경에서의 다중 선형 회귀 모델 기반의 양액 적정 흡수량 분석 연구)

  • Lim, Jong-Hyun;Lee, Myeong-Bae;Cho, Hyun-Wook;Shin, Chang-Sun;Park, Chang-Woo;Cho, Yong-Yun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.578-580
    • /
    • 2019
  • 우리 나라의 딸기 수경재배 면적은 2002년 5ha로 시작해서, 2007년에는 84ha, 2012년에는 317ha, 2017년에 1,575ha로 매년 30% 이상 급속하게 성장하고 있다. 이런 경향은 수경재배가 토양재배보다 작업이 용이하여 노동시간이 절약되며, 수량을 더 많이 생산할 수 있기 때문이다. 하지만, 공급양액을 배액으로 흘려버리는 비순환식 수경재배 방식이 증가 하면서 환경오염을 유발시킬 뿐만 아니라 수경재배 운영비용의 증가를 가져오고 있다. 본 논문은 작물 생장에 최적화된 양액공급을 위해 상관관계 분석 및 다중 선형 회귀 모델 기반의 딸기 수경재배 환경에서의 최적 양액 흡수량을 분석하고 추정해 보았다. 분석 결과, 수경재배 환경정보(일사량, 온도, 습도, CO2 등)를 대상으로 일사량 및 온도가 습도 및 CO2에 비해 딸기재배를 위한 양액 흡수량에 더 큰 영향을 주는 것으로 분석되었고, 다중 선형 회귀 모델을 통한 회귀식의 R-Square값은 0.358으로 나타났다.