• Title/Summary/Keyword: 로지스틱모델

Search Result 243, Processing Time 0.022 seconds

Evaluation and Analysis of Gwangwon-do Landslide Susceptibility Using Logistic Regression (로지스틱 회귀분석 기법을 이용한 강원도 산사태 취약성 평가 및 분석)

  • Yeon, Young-Kwang
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.14 no.4
    • /
    • pp.116-127
    • /
    • 2011
  • This study conducted landslide susceptibility analysis using logistic regression. The performance of prediction model needs to be evaluated considering two aspects such as a goodness of fit and a prediction accuracy. Thus to gain more objective prediction results in this study, the prediction performance of the applied model was evaluated considering two such evaluation aspects. The selected study area is located between Inje-eup and Buk-myeon in the middle of Kwangwon. Landslides in the study area were caused by heavy rain in 2006. Landslide causal factors were extracted from topographic map, forest map and soil map. The evaluation of prediction model was assessed based on the area under the curve of the cumulative gain chart. From the results of experiments, 87.9% in the goodness of fit and 84.8% in the cross validation were evaluated, showing good prediction accuracies and not big difference between the results of the two evaluation methods. The results can be interpreted in terms of the use of environmental factors which are highly related to landslide occurrences and the accuracy of the prediction model.

Value Weighted Regularized Logistic Regression Model (속성값 기반의 정규화된 로지스틱 회귀분석 모델)

  • Lee, Chang-Hwan;Jung, Mina
    • Journal of KIISE
    • /
    • v.43 no.11
    • /
    • pp.1270-1274
    • /
    • 2016
  • Logistic regression is widely used for predicting and estimating the relationship among variables. We propose a new logistic regression model, the value weighted logistic regression, which comprises of a fine-grained weighting method, and assigns adapted weights to each feature value. This gradient approach obtains the optimal weights of feature values. Experiments were conducted on several data sets from the UCI machine learning repository, and the results revealed that the proposed method achieves meaningful improvement in the prediction accuracy.

A Software Reliability Growth Model Based on Gompertz Growth Curve (Gompertz 성장곡선 기반 소프트웨어 신뢰성 성장 모델)

  • Park Seok-Gyu;Lee Sang-Un
    • The KIPS Transactions:PartD
    • /
    • v.11D no.7 s.96
    • /
    • pp.1451-1458
    • /
    • 2004
  • Current software reliability growth models based on Gompertz growth curve are all logarithmic type. Software reliability growth models based on logarithmic type Gompertz growth curve has difficulties in parameter estimation. Therefore this paper proposes a software reliability growth model based on the logistic type Gompertz growth curie. Its usefulness is empirically verified by analyzing the failure data sets obtained from 13 different software projects. The parameters of model are estimated by linear regression through variable transformation or Virene's method. The proposed model is compared with respect to the average relative prediction error criterion. Experimental results show that the pro-posed model performs better the models based on the logarithmic type Gompertz growth curve.

Statistical Analysis for Risk Factors and Prediction of Hypertension based on Health Behavior Information (건강행위정보기반 고혈압 위험인자 및 예측을 위한 통계분석)

  • Heo, Byeong Mun;Kim, Sang Yeob;Ryu, Keun Ho
    • Journal of Digital Contents Society
    • /
    • v.19 no.4
    • /
    • pp.685-692
    • /
    • 2018
  • The purpose of this study is to develop a prediction model of hypertension in middle-aged adults using Statistical analysis. Statistical analysis and prediction models were developed using the National Health and Nutrition Survey (2013-2016).Binary logistic regression analysis showed statistically significant risk factors for hypertension, and a predictive model was developed using logistic regression and the Naive Bayes algorithm using Wrapper approach technique. In the statistical analysis, WHtR(p<0.0001, OR = 2.0242) in men and AGE (p<0.0001, OR = 3.9185) in women were the most related factors to hypertension. In the performance evaluation of the prediction model, the logistic regression model showed the best predictive power in men (AUC = 0.782) and women (AUC = 0.858). Our findings provide important information for developing large-scale screening tools for hypertension and can be used as the basis for hypertension research.

A Success Prediction Model for Debut Webtoon Based on Reader reaction Using Deep Learning and Machine Learning (딥러닝과 머신러닝을 활용한 독자 반응 기반 웹툰 데뷔작 성공 예측 모델)

  • Heo, Eun Yeong;Kim, Seung Hwa;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.770-773
    • /
    • 2019
  • 본 논문에서는 매년 성장하는 웹툰 시장 속에서 신인 작가들이 성공할 수 있는 성공 요인을 밝히고자 하였다. 국내 1위 웹툰 플랫폼인 네이버 웹툰 중 데뷔작을 기준으로 완결 웹툰 212개, 연재 중인 웹툰 112개, 총 324개의 웹툰을 수집하여 연구를 진행하였다. 기존 선행연구와의 차별화를 두기 위해 독자의 직접적인 반응 중 하나인 댓글을 성공 요인에 포함하였다. 댓글에 담긴 긍정, 부정을 나타내는 주관을 탐지하기 위해 딥러닝을 이용하여 감성 분석을 실시하였다. 각 웹툰에 대한 댓글 반응을 포함하여 평균, '좋아요' 수, 장르 그리고 첫 화 댓글 수와 5화까지 평균 댓글 수를 흥행에 영향을 미치는 독립변수로 사용했다. 댓글 반응이 중요 요인인지를 확인하기 위해 각 모델 생성 시 댓글 반응을 포함한 모델과 포함하지 않은 모델을 생성하여 성능 평가를 실시하였다. 로지스틱 회귀분석, 아다 부스트, 그리고 서포트 벡터 머신 모델을 정확도와 ROC 그래프를 이용해 효율성을 비교하고, 이를 통해 댓글 반응을 활용한 로지스틱 회귀 모델이 가장 적합하다고 판단하였다. 모델 생성 결과 '좋아요' 수, 1화 댓글 수, 댓글 반응 순으로 성공 요인에 많은 영향을 미치는 것을 알 수 있었다.

Customer List Segmentation Using the Combined Response Modeling (결합 리스펀스 모델링을 이용한 고객리스트 세분화)

  • Eui-ho Seo;Kap-chel Noh;Eung-beom Lee
    • Asia Marketing Journal
    • /
    • v.1 no.2
    • /
    • pp.19-35
    • /
    • 1999
  • 데이터베이스 마케팅 전략을 수립하고 집행함에 있어서 고객에게 접근하기 위한 촉진 매체로써 직접우편(Direct Mail)과 텔레 마케팅 등의 직접반응매체를 주요 수단으로 하는 경우 이를 다이렉트 마케팅이라고 한다. 다른 마케팅 전략들과 마찬가지로 다이렉트 마케팅에서도 마케팅 자원이 효과적으로 사용될 수 있도록 고객 데이터베이스를 세분화하는 작업을 수행한다. 리스펀스 모델링(Response Modeling)은 다이렉트 마케팅분야에서 고객리스트를 세분화하고 각 세그멘트별로 고객의 반응(구매행위)을 예측하는 기법을 말하며 RFM(Recency, Frequency, Monetary), 로지스틱, 신경망은 리스펀스 모델링을 위해서 가장 널리 사용되고 있는 기법이다. 과거에 이들 방법은 고객 데이터베이스 전체에 단독 모델로 적용되어 왔으나 이러한 단독 모델을 고객 데이터베이스에 적용하는 것이 정당화 되려면 고객들이 동일한 방식으로 반응한다는 전제가 필요하다. 그러나 일반적으로 고객의 반응방식에는 상당한 이질성이 존재한다. 예컨대 직업, 나이, 소득, 성별 등이 같다고 해서 같은 구매패턴을 보이지는 않는다는 것이다. 즉 고객A의 구매행위는 회귀선에 의해서 잘 설명되는 반면에 고객B는 신경망이나 RFM으로 잘 설명될 수 있는 경우가 존재하는 것이다. 이러한 구매행위의 이질성을 반영하기 위해서 최근에는 두개 이상의 방법을 결합하여 사용하는 결합 리스펀스 모델링 방법도 시도 되어 왔다. 그러나 결합 리스펀스 모델링에 관한 기존 연구들은 상관관계가 낮은 모델들을 결합함으로써 세분화의 효과를 단독 모델을 사용할 때 보다 개선할 수 있다고는 하였으나 구체적으로 어떤 모델들이 서로 낮은 상관관계를 갖는지는 보여주지 못하였다. 본 논문에서는 RFM 방법을 모델 내에서 사용하는 변수와 이를 이용한 모델링 방법상의 차이로 인하여 다른 두 방법(로지스틱, 신경망)과 매우 낮은 상관관계를 갖는 방법으로 제시하고 RFM과 다른 두 방법간의 낮은 상관관계를 이용하여 결합하는 경우 모델의 예측효과를 상당히 개선할 수 있음을 사례분석을 통해서 보이고자 한다.

  • PDF

A Study on the Fraud Detection of Industrial Accident Compensation Insurance (산재보험 부정수급 식별모형에 관한 연구)

  • Ham, Seung-O;Hong, Jeong-Sik
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2008.10a
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

An Idea, Strategy of Congestion Pricing for Differentiated Services and Forecasting Probability of Access using Logistic Regression Model (차등서비스를 위한 혼잡요금부과의 타당성 검토와 로지스틱 회귀모형을 이용한 인터넷 접속 확률 예측)

  • Ji Seonsu
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.10 no.1
    • /
    • pp.9-15
    • /
    • 2005
  • Congestion control is an important research area in computer network. In this paper, I provided strategy of congestion pricing with differentiated services. And, suggested forecasting model of access that considered differentiated pricing, delay time, satisfaction using logistic regression. In a forecasting model of access with logistic regression technique, it is shown that coefficient of determination using suggested model is $70.7\%$.

  • PDF

A Prediction Model of Landslides in the Tertiary Sedimentary Rocks and Volcanic Rocks Area (제3기 퇴적암 및 화산암 분포지의 산사태 예측모델)

  • Chae Byung-Gon;Kim Won-Young;Na Jong-Hwa;Cho Yong-Chan;Kim Kyeong-Su;Lee Choon-Oh
    • The Journal of Engineering Geology
    • /
    • v.14 no.4 s.41
    • /
    • pp.443-450
    • /
    • 2004
  • This study developed a prediction model of debris flow to predict a landslide probability on natural terrain composed of the Tertiary sedimentary and volcanic rocks using a logistic regression analysis. The landslides data were collected around Pohang, Gyeongbuk province where more than 100 landslides were occurred in 1998. Considered with basic characteristics of the logistic regression analysis, field survey and laboratory soil tests were performed for both slided points and not-slided points. The final iufluential factors on landslides were selected as six factors by the logistic regression analysis. The six factors are composed of two topographic factors and four geologic factors. The developed landslide prediction model has more than $90\%$ of prediction accuracy. Therefore, it is possible to make probabilistic and quantitative prediction of landslide occurrence using the developed model in this study area as well as the previously developed model for metamorphic and granitic rocks.