• Title/Summary/Keyword: 로지스틱모델

Search Result 239, Processing Time 0.026 seconds

Flood Risk Forecasting using Logistic Regression for the Han River Basin (로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발)

  • Lee, Seon Mi;Choi, Youngje;Yi, Jaeeung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF

순서형 대설 예보를 위한 통계 모형 개발

  • Son, Geon-Tae;Lee, Jeong-Hyeong;Ryu, Chan-Su
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.11a
    • /
    • pp.101-105
    • /
    • 2005
  • 호남지역에 대한 대설특보 예보를 위한 통계모형 개발을 수행하였다. 일 신적설량에 따라 세법주(0: 비발생, 1: 대설주의보, 2: 대설경보)로 구분되는 순서형 자료 형태를 지니고 있다. 두가지 통계 모형(다등급 로지스틱 회귀모형, 신경회로망 모형)을 고려하였으며, 수치모델 출력자료를 이용한 역학-통계모형 기법의 하나인 MOS(model output statistics)를 적용하여 축적된 수치모델 예보자료와 관측치의 관계를 통계모형식으로 추정하여 예측모형을 개발하였다. 군집분석을 사용하여 훈련자료와 검증자료를 구분하였으며, 예보치 생성을 위하여 문턱치를 고려하였다.

  • PDF

Anomaly Detection of Video Wall Controller Using Discretized Logistic Mixture Distribution (이산화 된 로지스틱 혼합 분포를 이용한 비디오 월 컨트롤러의 이상 감지)

  • Kim, Sung-jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.552-554
    • /
    • 2021
  • 프리징은 컴퓨터 시스템에서 하나의 프로세스나 시스템 전체가 입력에 대한 응답이 중단되고 제어가 불가능한 상태가 되는 현상이다. 비디오 월 컨트롤러의 제어 시스템도 OS에서 동작하는 애플리케이션이므로 프리징이 발생할 수 있지만, 운영자가 멀티 스크린을 실시간으로 모니터링 하고 있더라도 프리징의 발생을 인지하기 어렵고, 프리징을 인지하였을 때는 이미 제어가 불가능한 상태이므로 비디오 월 컨트롤러를 재부팅 하는 것 외에는 대응할 수 있는 방법이 없다. 따라서 본 논문에서는 비디오 월 컨트롤러의 이상 여부를 감지하여 프리징을 방지할 수 있는 모델을 제안한다. 이상 감지모델은 이산화 된 로지스틱 혼합 분포의 우도 함수를 이용하여 비디오 월 컨트롤러의 이상 여부를 감지한다.

A Modified Logistic Regression Model for Probabilistic Prediction of Debris Flow at the Granitic Rock Area and Its Application; Landslide Prediction Map of Gangreung Area (화강암질암지역 토석류 산사태 예측을 위한 로지스틱 회귀모델의 수정 및 적용 - 강릉지역을 대상으로)

  • Cho, Yong-Chan;Chae, Byung-Gon;Kim, Won-Young;Chang, Tae-Woo
    • Economic and Environmental Geology
    • /
    • v.40 no.1 s.182
    • /
    • pp.115-128
    • /
    • 2007
  • This study proposed a modified logistic regression model for a probabilistic prediction of debris flow on natural terrain at the granitic rock area. The modified model dose not contain any categorical factors that were used in the previous model and secured higher reliability of prediction than that of the previous one. The modified model is composed of lithology, two factors of geomorphology, and three factors of soil property. Verification result shows that the prediction reliability is more than 86%. Using the modified regression model, the landslide prediction maps were established. In case of Sacheon area, the prediction map showed that the landslide occurrence was not well corresponded with the model since, even though the forest-fred area was distributed on the center of the model, no factors were considered for the landslide predictions. On the other hand, the prediction model was well corresponded with landslide occurrence at Jumunjin-Yeongok area. The prediction model developed in this study has very high availability to employ in other granitic areas.

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model (로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구)

  • Jin, Soo-Bong;Lee, Jong-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.20 no.4
    • /
    • pp.482-490
    • /
    • 2017
  • This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.

Prediction Model of CNC Processing Defects Using Machine Learning (머신러닝을 이용한 CNC 가공 불량 발생 예측 모델)

  • Han, Yong Hee
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.2
    • /
    • pp.249-255
    • /
    • 2022
  • This study proposed an analysis framework for real-time prediction of CNC processing defects using machine learning-based models that are recently attracting attention as processing defect prediction methods, and applied it to CNC machines. Analysis shows that the XGBoost, CatBoost, and LightGBM models have the same best accuracy, precision, recall, F1 score, and AUC, of which the LightGBM model took the shortest execution time. This short run time has practical advantages such as reducing actual system deployment costs, reducing the probability of CNC machine damage due to rapid prediction of defects, and increasing overall CNC machine utilization, confirming that the LightGBM model is the most effective machine learning model for CNC machines with only basic sensors installed. In addition, it was confirmed that classification performance was maximized when an ensemble model consisting of LightGBM, ExtraTrees, k-Nearest Neighbors, and logistic regression models was applied in situations where there are no restrictions on execution time and computing power.

Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining (데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델)

  • Heo, Jun;Kim, Jong-U
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2007.11a
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

Reasonability of Logistic Curve on S/W (로지스틱 곡선을 이용한 타당성)

  • Kim, Sun-Il;Che, Gyu-Shik;Jo, In-June
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.1
    • /
    • pp.1-9
    • /
    • 2008
  • The Logistic cone is studied as a most desirable for the software testing effort. Assuming that the error detection rate to the amount of testing effort spent during the testing phase is proportional to the current error content, a software-reliability growth model is formulated by a nonhomogeneous Poisson process. Using this model the method of data analysis for software reliability measurement is developed. After defining a software reliability, This paper discusses the relations between testing time and reliability and between duration following failure fixing and reliability are studied SRGM in several literatures has used the exponential curve, Railleigh curve or Weibull cure as an amount of testing effort during software testing phase. However, it might not be appropriate to represent the consumption curve for testing effort by one of already proposed curves in some software development environments. Therefore, this paper shows that a logistic testing- effort function can be adequately expressed as a software development/testing effort curve and that it gives a good predictive capability based on real failure data.

An empirical study on telemarketing efficiency at life insurance (생명보험사 텔레마케팅 효율성 제고에 관한연구)

  • Koh, Bong-Sung;Lee, Seok-Won;Heo, Jeong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.4
    • /
    • pp.673-684
    • /
    • 2009
  • Lower Prices are offered through sales by telemarketing. This is to serve our customers by the fastest and most appropriate referral product that is most important to attract insurance. Therefore, Considering the time the customer's preferred products and preferred customer for screening and targeting, depending on what is the difference between the premiums. This study of the logistic regression model using datamining techniques, the life insurance companies in outbound telemarketing to support sales of the effect you want to validate. To join existing life insurance companies for the customer response and sales strategy based on the L segment and by age group, family-love insurance, accident insurance, and cancer insurance were in progress for the modeling. Set model based on the progress of the campaign to existing customers marketing methods and how to extract and run the model results has proven the superiority of the model. In addition, over time, depending on the aging model is set to a decline in operating profit to maximize the profits th update the model which was derived.

  • PDF