• 제목/요약/키워드: 회귀의사결정나무

검색결과 141건 처리시간 0.027초

An application to Multivariate Zero-Inflated Poisson Regression Model

  • Kim, Kyung-Moo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.177-186
    • /
    • 2003
  • The Zero-Inflated Poisson regression is a model for count data with exess zeros. When the correlated response variables are intrested, we have to extend the univariate zero-inflated regression model to multivariate model. In this paper, we study and simulate the multivariate zero-inflated regression model. A real example was applied to this model. Regression parameters are estimated by using MLE's. We also compare the fitness of multivariate zero-inflated Poisson regression model with the decision tree model.

  • PDF

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

데이터마이닝을 통한 고객관리데이터의 분석 (아파트고객 세분화를 중심으로) (Ananlyzing Customer Management Data by Datamining (Focused on Apartment Customer Classification))

  • 백신정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2004
  • 기업간의 경쟁이 심화되고 정보의 중요성에 대한 인식이 확대되어 가는 상황에서 다량의 데이터로부터 가치 있는 데이터를 추출하는 CRM 데이터 마이닝은 중대한 관심사가 아닐 수 없다. 본 연구는 데이터마이닝의 여러 활용 분야 중 고객세분화를 위해 최근 많이 사용되고 있는 데이터마이닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망 알고리즘 기법들을 비교하며, 이를 실제 아파트 고객의 데이터를 이용하여 검증하고자 한다. 따라서, 아파트 고객 세분화를 위한 데이터마이닝 수행시 기법 선택의 기준과 비교 평가의 기준을 제시하는 데 연구목적 있다.

  • PDF

Support Vector Machines을 이용한 개인신용평가 : 중국 금융기관을 중심으로 (An Application of Support Vector Machines to Personal Credit Scoring: Focusing on Financial Institutions in China)

  • 딩쉬엔저;이영찬
    • 산업융합연구
    • /
    • 제16권4호
    • /
    • pp.33-46
    • /
    • 2018
  • 개인신용평가는 은행이 대출을 승인할 때 수익성 있는 의사결정을 적절히 유도할 수 있는 효과적인 도구이다. 최근 많은 분류 알고리즘 및 모델이 개인신용평가에 사용되고 있다. 개인신용평가 기법은 대체로 통계적 방법과 비 통계적 방법으로 구분된다. 통계적 방법에는 선형회귀분석, 판별분석, 로지스틱 회귀분석, 의사결정나무 등이 포함된다. 비 통계적 방법에는 선형계획법, 신경망, 유전자 알고리즘 및 Support Vector Machines 등이 포함된다. 그러나 신용평가모형 개발을 위해 어떠한 방법이 최선인지에 관해서는 일관된 결론을 내리기는 어렵다. 본 논문에서는 중국 금융기관의 개인 신용 데이터를 사용하여 가장 대표적인 신용평가 기법인 로지스틱 회귀분석, 신경망 그리고 Support Vector Machines의 성능을 비교하고자 한다. 구체적으로, 세 가지 모형을 각각 구축하여 고객을 분류하고 분석 결과를 비교하였다. 분석결과에 따르면, Support Vector Machines이 로지스틱 회귀분석과 신경망보다 더 나은 성능을 가지는 것으로 나타났다.

보행자-차량 충돌사고 특성분석 방법론 비교 연구 (Comparison of Methodologies for Characterizing Pedestrian-Vehicle Collisions)

  • 최새로나;정은비;오철
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.53-66
    • /
    • 2013
  • 최근 운전자의 보행자-차량 충돌사고 감소를 목적으로 한 다양한 연구가 수행되고 있으며, 본 연구에서는 보행자-차량 사고 발생 특성 및 심각도 영향요인 분석을 위하여 다양한 분석방법론을 활용한 보행자 교통사고 분석을 수행하였다. 통계모형과 휴리스틱모형 적용시 각 기법에 따른 결과를 도출함으로써 보행자 사고분석시 분석목적에 적합한 방법론을 제시하는 것을 목적으로 하였다. 이를 위하여 최근 3년간 발생한 경기도 교통사고자료(2008-2010년)를 활용하여 보행자 교통사고의 발생특성을 분석하였다. 또한, 통계모형인 이항 로지스틱 회귀분석, 순서형 프로빗 모형을 이용하여 보행자 교통사고 심각도 증가에 통계적으로 유의한 영향을 미치는 변수를 도출하였으며, 휴리스틱모형인 서포트 벡터 머신, 의사결정나무를 적용하여 교통사고 심각도 분류를 위한 모형을 개발하고 그 결과를 비교분석 하였다. 본 연구의 분석결과는 보행자 교통안전분석의 기초자료로 활용할 수 있으며 향후 국내 보행자-차량 충돌사고 분석시 유용하게 활용될 수 있을 것으로 기대된다.

유사 시계열 데이터 분석에 기반을 둔 교육기관의 전력 사용량 예측 기법 (Power Consumption Forecasting Scheme for Educational Institutions Based on Analysis of Similar Time Series Data)

  • 문지훈;박진웅;한상훈;황인준
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.954-965
    • /
    • 2017
  • 안정적인 전력 공급은 전력 인프라의 유지 보수 및 작동에 매우 중요하며, 이를 위해 정확한 전력 사용량 예측이 요구된다. 대학 캠퍼스는 전력 사용량이 많은 곳이며, 시간과 환경에 따른 전력 사용량 변화폭이 다양하다. 이러한 이유로, 전력계통의 효율적인 운영을 위해서는 전력 사용량을 정확하게 예측할 수 있는 모델이 요구된다. 기존의 시계열 예측 기법은 학습 시점과 예측 시점 간의 차이가 클수록 예측 구간이 넓어짐으로 예측 성능이 크게 떨어진다는 단점이 있다. 본 논문은 이를 보완하려는 방안으로, 먼저 의사결정나무를 이용해 날짜, 요일, 공휴일 여부, 학기 등을 고려하여 시계열 형태가 유사한 전력 데이터를 분류한다. 다음으로 분류된 데이터 셋에 각각의 자기회귀누적이동평균모형을 구성하여, 예측 시점에서 시계열 교차검증을 적용해 대학 캠퍼스의 일간 전력 사용량 예측 기법을 제안한다. 예측의 정확성을 평가하기 위해, 성능 평가 지표를 이용하여 제안한 기법의 타당성을 검증하였다.

초음파를 이용한 한우 육량등급의 조기예측 (Early Prediction of Carcass Yield Grade by Ultrasound in Hanwoo)

  • 이용준;석홍기;김석중;송영한
    • Journal of Animal Science and Technology
    • /
    • 제45권2호
    • /
    • pp.327-334
    • /
    • 2003
  • 본 시험은 초음파를 이용하여 한우의 도체형질을 조기에 예측하기 위하여 거세한우 66두를 대상으로 18, 21 및 24개월령에 도체형질을 측정하고, 중회귀 분석 및 의사결정나무 분석을 이용하여 24개월령 출하시 도체형질을 예측하였다. 그 결과를 요약하면 다음과 같다. 도체육량등급에 따라 군을 분류하고 성장에 따른 도체형질의 변화를 관찰한 결과, 등지방 두께는 전기간에 걸쳐 각 도체육량등급간에 유의적(p<0.05)인 차이를 보이며 A, B, C등급 순으로 얇게 나타났다. 중회귀 분석에 의한 도체육량등급의 예측율은 18, 21 및 24개월령에서 각각 78.8%, 86.4% 및 90.9%를 나타냈으며, 의사결정나무 분석에 의한 도체육량등급 예측율은 각 개월령에 따라 78.8%, 89.4% 및 89.4%를 나타냈다.

영어강의의 효과성에 대한 연구 (Study on the effectiveness of english-medium class)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1137-1144
    • /
    • 2012
  • 요즘 대부분의 대학들이 국제화를 목표로 재학생들의 어학능력 및 국제적 경쟁력 강화와 함께 영어강의의 중요성이 증대되고 있다. 본 연구에서는 강의평가점수를 이용해서 과목특성 변수들과 개인특성 변수들 별로 영어강의와 한국어강의의 효과성을 비교하였다. 또한 로지스틱회귀분석과 의사결정나무분석을 이용하여 어떤 요인들이 영어강의가 한국어강의에 비해서 효과적인지를 주효과와 상호작용효과 측면에서 분석하였다. 분석결과에 따르면 영어강의의 효과성에 영향을 미치는 변수로는 학년, 계열, 강좌규모, 평균평점, 계열, 전형방법 등으로 나타났다. 또한 영어강의 효과성이 특히 높은 그룹은 1학년이면서 인문계열인 경우, 그리고 1학년이면서 자연 및 예체능계열이고 평균평점이 높은 그룹이 높게 나타났다. 그리고 영어강의의 효과성 비율이 특히 낮은 그룹은 2-3학년 학생이면서 강좌규모가 크고 인문계열인 경우로 나타났다.

도로위의 기상요인이 교통사고에 미치는 영향 - 부산지역을 중심으로 - (The effect of road weather factors on traffic accident - Focused on Busan area -)

  • 이경준;정임국;노윤환;윤상경;조영석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.661-668
    • /
    • 2015
  • 교통사고는 인구의 증가와 그에 따른 자동차의 증가로 인하여 매년 증가하고 있다. 그러한 교통사고의 원인은 운전자의 부주의뿐만 아니라 도로상의 기상상황에 의해 영향을 받는다. 특히, 강수량, 시계, 습도, 흐림 정도, 기온 등에 의해 많은 교통사고들이 영향을 받는다. 따라서 본 연구는 다양한 기상 요인의 영향 정도에 따른 교통사고 발생 유무의 분석을 목적으로 하였다. 부산 해운대구의 센텀남대로 및 해운대로의 2013년도 교통사고 발생 자료와 지역별 상세 기상 관측 자료인 AWS 기상자료(시간당 강수량, 강수유무, 기온, 풍속), 시간대, 요일을 활용하여 로지스틱 회귀모형 및 의사결정나무모형을 이용하여 분석하였다. 그 결과 기상 요인 중 강수유무와 기온이 교통사고 발생에 영향을 미치는 요인으로 나타났다. 이러한 결과는 도로위의 기상상태에 따른 교통사고의 발생을 예측하는데 유용하게 사용할 수 있을 것이다.

낙찰률 예측 모형에 관한 연구 (A Study for the Development of a Bid Price Rate Prediction Model)

  • 최보승;강현철;한상태
    • Communications for Statistical Applications and Methods
    • /
    • 제18권1호
    • /
    • pp.23-34
    • /
    • 2011
  • 부동산 경매는 최근 새로운 부동산 투자방법 가운데 하나로 자리잡고있다. 이는 부동산 시장의 성장과 더불어 부동산 경매 시장 또한 증가하고 있는 추세에 기인한다 할 수 있다. 본 연구는 부동산 경매에 참여하는 사람 및 기관들에게 가장 중요한 지표라 할 수 있는 낙찰률의 변화를 설명하고 예측하는 모형을 구축하고자 하였다. 월별 평균 낙찰률을 예측하기 위하여 단순한 지역별, 기간별 평균값을 보완하고 의사결정나무 분석을 이용하여 예측오차를 보정하는 방법을 제안하였고 선형회귀모형을 이용하여 개별 경매 물건별 낙찰률을 예측하기 위한 모형을 구축하였다. 구축된 모형은 전국 아파트 경매 물건에 적용하여 예측 모형을 구현하였으며 그 응용방법으로 예측결과에 대한 등급화를 함께 수행하였다.