• 제목/요약/키워드: 로지스틱모델

검색결과 239건 처리시간 0.028초

로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발 (Flood Risk Forecasting using Logistic Regression for the Han River Basin)

  • 이선미;최영제;이재응
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF

순서형 대설 예보를 위한 통계 모형 개발

  • 손건태;이정형;류찬수
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 추계 학술발표회 논문집
    • /
    • pp.101-105
    • /
    • 2005
  • 호남지역에 대한 대설특보 예보를 위한 통계모형 개발을 수행하였다. 일 신적설량에 따라 세법주(0: 비발생, 1: 대설주의보, 2: 대설경보)로 구분되는 순서형 자료 형태를 지니고 있다. 두가지 통계 모형(다등급 로지스틱 회귀모형, 신경회로망 모형)을 고려하였으며, 수치모델 출력자료를 이용한 역학-통계모형 기법의 하나인 MOS(model output statistics)를 적용하여 축적된 수치모델 예보자료와 관측치의 관계를 통계모형식으로 추정하여 예측모형을 개발하였다. 군집분석을 사용하여 훈련자료와 검증자료를 구분하였으며, 예보치 생성을 위하여 문턱치를 고려하였다.

  • PDF

이산화 된 로지스틱 혼합 분포를 이용한 비디오 월 컨트롤러의 이상 감지 (Anomaly Detection of Video Wall Controller Using Discretized Logistic Mixture Distribution)

  • 김성진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.552-554
    • /
    • 2021
  • 프리징은 컴퓨터 시스템에서 하나의 프로세스나 시스템 전체가 입력에 대한 응답이 중단되고 제어가 불가능한 상태가 되는 현상이다. 비디오 월 컨트롤러의 제어 시스템도 OS에서 동작하는 애플리케이션이므로 프리징이 발생할 수 있지만, 운영자가 멀티 스크린을 실시간으로 모니터링 하고 있더라도 프리징의 발생을 인지하기 어렵고, 프리징을 인지하였을 때는 이미 제어가 불가능한 상태이므로 비디오 월 컨트롤러를 재부팅 하는 것 외에는 대응할 수 있는 방법이 없다. 따라서 본 논문에서는 비디오 월 컨트롤러의 이상 여부를 감지하여 프리징을 방지할 수 있는 모델을 제안한다. 이상 감지모델은 이산화 된 로지스틱 혼합 분포의 우도 함수를 이용하여 비디오 월 컨트롤러의 이상 여부를 감지한다.

화강암질암지역 토석류 산사태 예측을 위한 로지스틱 회귀모델의 수정 및 적용 - 강릉지역을 대상으로 (A Modified Logistic Regression Model for Probabilistic Prediction of Debris Flow at the Granitic Rock Area and Its Application; Landslide Prediction Map of Gangreung Area)

  • 조용찬;채병곤;김원영;장태우
    • 자원환경지질
    • /
    • 제40권1호
    • /
    • pp.115-128
    • /
    • 2007
  • 본 연구는 화강암질암 지역의 자연사면에서 발생하는 토석류 산사태의 발생지점을 확률론적 예측하기 위하여 기 개발된 로지스틱 회귀모델을 수정하고자 한다. 기 모델의 단점인 일부 범주형 변수사용을 제거하여 예측률의 신뢰도 및 예측도면 작성시의 정확성을 높인 새로운 예측모델을 제안하고자 한다. 새롭게 개발된 모델은 암상, 지형인자 2개 및 토질인자 3개를 사용하여 통계적으로 86%이상의 예측률을 확보하였다. 본 모델의 적용성을 검증하기 위하여 태풍 '루사'로 인해 산사태가 집중적으로 발생한 강릉지역에 적용하여 산사태 예측도를 작성하였다. 예측결과 사천지역의 경우 본 모델에서 고려하지 못한 산불의 영향으로 산불피해지역에서 근소한 차이를 보여주고 있으나, 주문진-연곡지역의 경우는 예측결과가 실제 산사태 발생위치와 잘 일치하고 있다. 따라서 본 모델은 우리나라의 화강암질암지역에 적용하여 널리 활용될 수 있을것으로 판단된다.

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구 (Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model)

  • 진수봉;이종우
    • 한국철도학회논문집
    • /
    • 제20권4호
    • /
    • pp.482-490
    • /
    • 2017
  • 본 연구는 사고심각도 분류 및 예측을 위한 철도사고조사 통계기법에 관한 연구이다. 그동안의 선형 회귀분석은 사고 심각도 분석에 어려움이 있었으나 로지스틱회귀분석은 이를 보완할 수 있었다. 데이터마이닝 기법인 로지스틱회귀분석을 활용, 서울지하철(5~8호선) 역사 내 전도사고 중 에스컬레이터 전도사고 발생에 영향을 주는 사고예측 모형 변수는 사고자 연령, 음주여부, 사고 당시상황 및 행동, 핸드레일 잡음 여부였다. 분석의 정확도는 76.7%로 설명되었고 분석방법 결과에 따르면 정확도와 유의수준 측에서 로지스틱회귀분석 방법이 도시철도 사상사고 예측모형을 개발하는데 유용한 데이터마이닝 기법으로 판단된다.

머신러닝을 이용한 CNC 가공 불량 발생 예측 모델 (Prediction Model of CNC Processing Defects Using Machine Learning)

  • 한용희
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.249-255
    • /
    • 2022
  • 본 연구는 최근 가공 불량 예측 방법으로 주목받고 있는 머신러닝 기반의 모델을 이용하여 CNC 가공 불량 발생의 실시간 예측을 위한 분석 프레임워크를 제안하고, 해당 프레임워크에 기반하여 XGBoost, CatBoost, LightGBM, 랜덤 포레스트, Extra Trees, SVM, k-최근접 이웃, 로지스틱 회귀 모델을 CNC 설비에 기본 내장된 센서들로부터 추출된 데이터에 적용 및 분석하였다. 분석 결과 XGBoost, CatBoost, LightGBM 모델이 동일하게 가장 우수한 정확도, 정밀도, 재현율, F1 점수, AUC 값을 보였으며, 이 중 LightGBM 모델이 소요 실행 시간이 가장 짧은 것으로 나타났다. 이러한 짧은 소요 실행 시간은 실 시스템 구축 비용 절감, 빠른 불량 예측에 따른 CNC 장비 파손 확률 감소, 전체적인 CNC 활용률 증가 등의 실무적 장점을 가지므로 LightGBM 모델이 기본 센서들만 설치된 CNC 설비에 적용 시 가공 불량 예측에 가장 효과적으로 판단된다. 또한 소요 실행 시간 및 컴퓨팅 파워의 제약이 없는 상황에서는 LightGBM, Extra Trees, k-최근접 이웃, 로지스틱 회귀 모형으로 구성된 앙상블 모델을 적용할 경우 분류 성능이 최대화됨을 확인하였다.

데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델 (Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining)

  • 허준;김종우
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

로지스틱 곡선을 이용한 타당성 (Reasonability of Logistic Curve on S/W)

  • 김선일;최규식;조인준
    • 한국정보통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-9
    • /
    • 2008
  • 소프트웨어의 테스트노력 곡선으로서 현재까지는 로지스틱 곡선이 가장 이상적인 것으로 연구되고 있다. 테스트 단계중에 소요되는 테스트노력의 양에 대한 결함 검출비를 현재의 결함 내용에 비례하는 것으로 가정하여 소프트웨어 신뢰도 성장 모델을 비동차 포아송 프로세스(NHPP)로 공식화하되, 이 모델을 이용하여 소프트웨어 신뢰도 척도에 대한 데이터 분석기법을 개발한다. 모든 소프트웨어 개발 환경에서 지금까지 제시된 여러 곡선 중 하나에 의해서 테스트노력 소요 곡선을 표현하는 것은 적절하지 못하다는 것이 밝혀지고 있다. 그러므로, 본 논문에서는 로지스틱 테스트노력 곡선이 소프트웨어의 개발/테스트 노력곡선으로 적절하게 표현될 수 있다는 것과 실제 데이터를 근거로 하여 적용하여서 예측성이 매우 좋은 능력을 가지고 있다는 것을 보이고자 한다.

생명보험사 텔레마케팅 효율성 제고에 관한연구 (An empirical study on telemarketing efficiency at life insurance)

  • 고봉성;이석원;허정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권4호
    • /
    • pp.673-684
    • /
    • 2009
  • 텔레마케팅의 영업특성상 전화 응대를 한 고객에게 초기 적절한 상품을 추천하여 보험가입을 유치하는 것이 가장 중요하다. 따라서 고객의 선호상품 및 선호시간을 고려한 고객 선별과 타겟팅을 어떻게 진행하느냐에 따라 거수보험료 차이가 발생한다. 본 연구는 데이터마이닝 기법 중 로지스틱회귀모형을 이용하여 생명보험사 아웃바운드 텔레마케팅 영업을 지원하는데 있어서 그 효과를 검증하고자 하였다. 기존의 가입상품에 대한 고객반응정보와 L생명보험사 영업 전략에 따라 연령을 구간화하고 가족사랑보험, 상해보험, 암보험 상품에 대한 모델링을 진행하였다. 설정된 모델을 바탕으로 캠페인 진행시 기존 마케팅 방식과 모델방식으로 고객을 추출하고 실행결과를 통해 모델의 우수성을 입증하였다. 또한 시간이 지남에 따라 설정한 모델이 노후화되고 영업이익이 줄어듦에 따라 지속적으로 영업이익을 극대화 할 수 있도록 모델갱신주기를 도출하였다.

  • PDF