• 제목/요약/키워드: Logit Regression Model

검색결과 107건 처리시간 0.022초

의사결정나무를 이용한 화물자동차 투어유형 선택행태 분석 (An Analysis of Choice Behavior for Tour Type of Commercial Vehicle using Decision Tree)

  • 김한수;박동주;김찬성;최창호;김경수
    • 대한교통학회지
    • /
    • 제28권6호
    • /
    • pp.43-54
    • /
    • 2010
  • 최근 화물수요모형에 화물자동차 투어행태를 반영하기 위한 접근방법이 제시되었다. 화물자동차 이동을 투어기반 접근방법으로 모형화 하기 위해서는 화물자동차 투어와 투어유형에 대한 이해가 필요하다. 본 연구는 화물자동차 투어유형을 왕복형 투어와 체인형 투어로 구분하여 이들 투어유형 선택행태를 분석하였다. 투어유형 선택행태를 분석하기 위한 방법으로는 의사결정나무(decision tree)와 로짓모형(logit model)을 이용하였다. 분석결과 화물자동차 투어유형을 분류하는 설명변수로 화물적재율, 평균화물량, 총화물량이 선정되었으며, 의사결정나무와 로짓모형이 유사한 결과를 도출하였다. 또한 소형과 중형 화물자동차의 투어유형을 분류하는 설명변수가 큰 차이를 보이지 않음에 따라 화물자동차 투어를 계획함에 있어 화물을 어떻게 적재할 것인지가 가장 중요한 것으로 나타났다. 의사결정나무와 로짓모형의 예측력을 비교한 결과는 의사결정나무가 로짓모형에 비해 상대적으로 우수한 결과를 보였는데, 이는 화물자동차 투어유형을 분류함에 있어 로짓모형과 같이 설명변수의 선형적 결합에 의한 분류 보다는 의사결정나무와 같이 다수 설명변수들의 규칙조합으로 분류하는 것이 효과적임을 나타낸다.

Estimation for misclassified data with ultra-high levels

  • Kang, Moonsu
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.217-223
    • /
    • 2016
  • Outcome misclassification is widespread in classification problems, but methods to account for it are rarely used. In this paper, the problem of inference with misclassified multinomial logit data with a large number of multinomial parameters is addressed. We have had a significant swell of interest in the development of novel methods to infer misclassified data. One simulation study is shown regarding how seriously misclassification issue occurs if the number of categories increase. Then, using the group lasso regression, we will show how the best model should be fitted for that kind of multinomial regression problems comprehensively.

로짓모형을 이용한 산주의 사유림 경영 규모화 사업 참여 결정요인 분석 (Analysis of Decision Factors on the Participation of Scaling Project for Private Forest Management using a Logit Model)

  • 김기동
    • 한국산림과학회지
    • /
    • 제105권3호
    • /
    • pp.360-365
    • /
    • 2016
  • 본 연구는 사유림 경영 활성화 방안 중 하나인 사유림 경영 규모화 사업의 참여에 영향을 주는 산주 특성을 분석하여 사유림 경영 규모화 사업의 조기 시행과 확대를 위한 기초자료를 제공하는데 목적이 있다. 연구방법은 산주 373명을 대상으로 사유림 경영 규모화 사업의 참여의사 및 개인 특성 등을 설문조사하였으며 이항 로짓 분석(Binary-Logit Analysis)을 적용하여 사유림 경영 규모화 사업 참여에 영향을 주는 요인을 분석하였다. 로짓 분석을 위해 설정한 산주의 특성 즉, 독립변수는 성별, 연령, 학력, 직업, 소득, 거주지, 산지소유목적 그리고 산림조합 조합원 가입유무이다. 분석 결과, 사유림 경영 규모화 사업에 참여하겠다는 산주가 373명 중 267명(71.6%)이었으며 나머지 106명(28.4%)은 참여거부 의사를 나타냈다. 산주의 연령이 낮을수록, 직업은 자영업이 그리고 산지 소유 목적이 산림 경영일 경우 사유림 경영 규모화 사업 참여 확률이 높은 것으로 분석되었다.

데이타마이닝을 이용(利用)한 CRM 사례연구(事例硏究) - A 패션기업(企業)을 중심(中心)으로 - (A CRM Study on the Using of Data Mining - Focusing on the "A" Fashion Company -)

  • 이유순
    • 패션비즈니스
    • /
    • 제6권5호
    • /
    • pp.136-150
    • /
    • 2002
  • In this study, we proposed a method to be standing customers as the supporting system for the improvement of fashion garment industry which was the marginal growth getting into full maturity of market. As for the customer creation method of Fashion garment company is developing a marketing program to be standing customer as customer scoring to estimate a existing customer‘s buying power, and figure out minimum fixed sales of company to use a future purchasing predict. This study was a result of data from total sixty thousands data to be created for the 11 months from september. 2000 to July. 2001. The data is part of which the company leading the Korean fashion garment industry has a lot of a customer purchasing history data. But this study used only 48,845 refined purchased data to discriminate from sixty thousands data and 21,496 customer case with the exception of overlapping purchased data among of those. The software used to handle sixty thousands data was SAS e-miner. As the analysis process is put in to operation the analysis of the purchasing customer’s profile firstly, and the second come into basket analysis to consider the buying associations for Association goods, the third estimate the customer grade of Customer loyalty by 3 ways of logit regression analysis, decision tree, Artificial Neural Network. The result suggested a method to be estimate the customer loyalty as 3 independent variables, 2 coefficients. The 3 independent variables are total purchasing amount, purchasing items per one purchase, payment amount by one purchasing item. The 2 coefficients are royal and normal for customer segmentation. The result was that this model use a logit regression analysis was valid as the method to be estimate the customer loyalty.

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.

인공신경망을 이용한 소비자 선택 예측에 관한 연구 (A study on forecasting of consumers' choice using artificial neural network)

  • 송수섭;이의훈
    • 한국경영과학회지
    • /
    • 제26권4호
    • /
    • pp.55-70
    • /
    • 2001
  • Artificial neural network(ANN) models have been widely used for the classification problems in business such as bankruptcy prediction, credit evaluation, etc. Although the application of ANN to classification of consumers' choice behavior is a promising research area, there have been only a few researches. In general, most of the researches have reported that the classification performance of the ANN models were better than conventional statistical model Because the survey data on consumer behavior may include much noise and missing data, ANN model will be more robust than conventional statistical models welch need various assumptions. The purpose of this paper is to study the potential of the ANN model for forecasting consumers' choice behavior based on survey data. The data was collected by questionnaires to the shoppers of department stores and discount stores. Then the correct classification rates of the ANN models for the training and test sample with that of multiple discriminant analysis(MDA) and logistic regression(Logit) model. The performance of the ANN models were betted than the performance of the MDA and Logit model with respect to correct classification rate. By using input variables identified as significant in the stepwise MDA, the performance of the ANN models were improved.

  • PDF

영화 흥행 결정 요인과 흥행 성과 예측 연구 (A Study for the Development of Motion Picture Box-office Prediction Model)

  • 김연형;홍정한
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.859-869
    • /
    • 2011
  • 영화의 흥행 결정 요인에 대한 학문적 연구와 함께 상업적 시각에서 개별 영화의 흥행 예측에 대한 관심이 증대되고 있다. 본 연구는 2010년 한국에서 개봉된 영화를 대상으로 영화 흥행에 영향을 미치는 요인들과 영화 흥행 성과간의 관계를 분석하였다. 제작 전 투자 의사결정단계에서 영화 장르, 관람등급, 감독, 배우가 통계적으로 유의한 결과를 보였으며, 배급편성의 의사결정단계에서는 배우효과, 스크린수, 배급사파워, 소셜미디어가 통계적으로 유의한 결과를 나타내고 있다. 선택확률개념을 이용한 다항로짓모형을 통해 영화 흥행작의 성과에 영향을 미치는 요인을 검증하였으며, 인공신경망, 판별분석과 비교하여 다항로짓모형의 흥행영화 예측력을 입증하였다.

이원 이항 계수치 자료의 로지스틱 회귀 분석 (A Logistic Regression Analysis of Two-Way Binary Attribute Data)

  • 안해일
    • 산업경영시스템학회지
    • /
    • 제35권3호
    • /
    • pp.118-128
    • /
    • 2012
  • An attempt is given to the problem of analyzing the two-way binary attribute data using the logistic regression model in order to find a sound statistical methodology. It is demonstrated that the analysis of variance (ANOVA) may not be good enough, especially for the case that the proportion is very low or high. The logistic transformation of proportion data could be a help, but not sound in the statistical sense. Meanwhile, the adoption of generalized least squares (GLS) method entails much to estimate the variance-covariance matrix. On the other hand, the logistic regression methodology provides sound statistical means in estimating related confidence intervals and testing the significance of model parameters. Based on simulated data, the efficiencies of estimates are ensured with a view to demonstrate the usefulness of the methodology.

로지스틱 회귀모형에서의 SUPPRESSION (Suppression for Logistic Regression Model)

  • 홍종선;김호일;함주형
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.701-712
    • /
    • 2005
  • 로지스틱 회귀모형에서 suppression의 논의는 선형회귀의 논의보다 많지 않은데 그 이유 중의 하나는 회귀제곱합 또는 결정계수의 정의가 유일하지 않고 다양하기 때문이다. 여러 종류의 결정계수들 중에서 선호되는 두 종류의 결정계수와 Liao와 McGee(2003)가 제안한 두 종류의 수정 결정계수의 정의로부터 회귀제곱합을 유도하여 로지스틱 회귀모형에서의 suppression을 설명하고자 한다. 모의실험을 통하여 자료를 생성하여 어떤 경우에 suppression이 발생하는지를 살펴보고 그 결과를 선형회귀모형에서의 suppression 결과와 비교한다.