• Title/Summary/Keyword: 로지스틱회귀

Search Result 1,744, Processing Time 0.027 seconds

A Study on the Sentiment analysis of Google Play Store App Comment Based on WPM(Word Piece Model) (WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구)

  • Park, jae Hoon;Koo, Myong-wan
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.291-295
    • /
    • 2016
  • 본 논문에서는 한국어 기본 유니트 단위로 WPM을 활용한 구글 플레이 스토어 앱의 댓글 감정분석을 수행하였다. 먼저 자동 띄어쓰기 시스템을 적용한 후, 어절단위, 형태소 분석기, WPM을 각각 적용하여 모델을 생성하고, 로지스틱 회귀(Logistic Regression), 소프트맥스 회귀(Softmax Regression), 서포트 벡터머신(Support Vector Machine, SVM)등의 알고리즘을 이용하여 댓글 감정(긍정과 부정)을 비교 분석하였다. 그 결과 어절단위, 형태소 분석기보다 WPM이 최대 25%의 향상된 결과를 얻었다. 또한 분류 과정에서 로지스틱회귀, 소프트맥스 회귀보다는 SVM 성능이 우수했으며, SVM의 기본 파라미터({'kernel':('linear'), 'c':[4]})보다 최적의 파라미터를 적용({'kernel': ('linear','rbf', 'sigmoid', 'poly'), 'C':[0.01, 0.1, 1.4.5]} 하였을 때, 최대 91%의 성능이 나타났다.

  • PDF

로지스틱 회귀를 통한 경마의 입상확률모형

  • 유선경;박흥선
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.35-43
    • /
    • 2000
  • 본 연구에서는 우리 나라 경마의 실제자료를 이용하여 연승식 경마의 입상확률에 미치는 여러 가지 요인을 조사하였고, 이를 토대로 입상확률모형을 유도하여 보았다. 외국의 경우, 경마에 대한 통계적 접근이 다각적으로 시행되었지만, 기존의 선행방법이 배당금에 의한 입상확률에 근거를 하고 있는 반면, 본 연구에서는 경마장에서 쉽게 구할 수 있는 정보를 중심으로, 로지스틱 회귀를 이용한 방법을 시도해 보았다.

  • PDF

Penalized logistic regression models for determining the discharge of dyspnea patients (호흡곤란 환자 퇴원 결정을 위한 벌점 로지스틱 회귀모형)

  • Park, Cheolyong;Kye, Myo Jin
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.1
    • /
    • pp.125-133
    • /
    • 2013
  • In this paper, penalized binary logistic regression models are employed as statistical models for determining the discharge of 668 patients with a chief complaint of dyspnea based on 11 blood tests results. Specifically, the ridge model based on $L^2$ penalty and the Lasso model based on $L^1$ penalty are considered in this paper. In the comparison of prediction accuracy, our models are compared with the logistic regression models with all 11 explanatory variables and the selected variables by variable selection method. The results show that the prediction accuracy of the ridge logistic regression model is the best among 4 models based on 10-fold cross-validation.

Principal Components Regression in Logistic Model (로지스틱모형에서의 주성분회귀)

  • Kim, Bu-Yong;Kahng, Myung-Wook
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.4
    • /
    • pp.571-580
    • /
    • 2008
  • The logistic regression analysis is widely used in the area of customer relationship management and credit risk management. It is well known that the maximum likelihood estimation is not appropriate when multicollinearity exists among the regressors. Thus we propose the logistic principal components regression to deal with the multicollinearity problem. In particular, new method is suggested to select proper principal components. The selection method is based on the condition index instead of the eigenvalue. When a condition index is larger than the upper limit of cutoff value, principal component corresponding to the index is removed from the estimation. And hypothesis test is sequentially employed to eliminate the principal component when a condition index is between the upper limit and the lower limit. The limits are obtained by a linear model which is constructed on the basis of the conjoint analysis. The proposed method is evaluated by means of the variance of the estimates and the correct classification rate. The results indicate that the proposed method is superior to the existing method in terms of efficiency and goodness of fit.

An educational tool for binary logistic regression model using Excel VBA (엑셀 VBA를 이용한 이분형 로지스틱 회귀모형 교육도구 개발)

  • Park, Cheolyong;Choi, Hyun Seok
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.2
    • /
    • pp.403-410
    • /
    • 2014
  • Binary logistic regression analysis is a statistical technique that explains binary response variable by quantitative or qualitative explanatory variables. In the binary logistic regression model, the probability that the response variable equals, say 1, one of the binary values is to be explained as a transformation of linear combination of explanatory variables. This is one of big barriers that non-statisticians have to overcome in order to understand the model. In this study, an educational tool is developed that explains the need of the binary logistic regression analysis using Excel VBA. More precisely, this tool explains the problems related to modeling the probability of the response variable equal to 1 as a linear combination of explanatory variables and then shows how these problems can be solved through some transformations of the linear combination.

The Landslide Probability Analysis using Logistic Regression Analysis and Artificial Neural Network Methods in Jeju (로지스틱회귀분석기법과 인공신경망기법을 이용한 제주지역 산사태가능성분석)

  • Quan, He Chun;Lee, Byung-Gul;Lee, Chang-Sun;Ko, Jung-Woo
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.19 no.3
    • /
    • pp.33-40
    • /
    • 2011
  • This paper presents the prediction and evaluation of landslide using LRA(logistic regression analysis) and ANN (Artificial Neural Network) methods. In order to assess the landslide, we selected Sarabong, Byeoldobong area and Mt. Song-ak in Jeju Island. Five factors which affect the landslide were selected as: slope angle, elevation, porosity, dry density, permeability. So as to predict and evaluate the landslide, firstly the weight value of each factor was analyzed by LRA(logistic regression analysis) and ANN(Artificial Neural Network) methods. Then we got two prediction maps using AcrView software through GIS(Geographic Information System) method. The comparative analysis reveals that the slope angle and porosity play important roles in landslide. Prediction map generated by LRA method is more accurate than ANN method in Jeju. From the prediction map, we found that the most dangerous area is distributed around the road and path.

A Proposal of the Evaluation Method for Rock Slope Stability Using Logistic Regression Analysis (로지스틱 회귀분석을 통한 암반사면의 안정성 평가법 제안)

  • 이용희;김종열
    • Tunnel and Underground Space
    • /
    • v.14 no.2
    • /
    • pp.133-141
    • /
    • 2004
  • Through the many site investigations, different methods for evaluating stability of rock slopes have been proposed. Those methods, however, may lead to different results depending on the subjective judgments associated with the selection of the evaluation items and the application of weighting factor. Accordingly, binary logistic regression analysis was carried out to ensure fair appliction of the weighting factor, leading to an equation for evaluating the stability of rock slopes.

Comparative Analysis on Peak and non-peak hours Traffic Accident using Logistic Regression Analysis (로지스틱 회귀분석을 이용한 첨두·비첨두시간 사고유형 비교분석 연구)

  • Yoon, Byoung-Jo;Ko, Eun-Hyeck;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2016.11a
    • /
    • pp.263-264
    • /
    • 2016
  • 본 연구는 첨두 비첨두시간에 발생되는 교통사고의 주요 요인들을 발견하고 비교하여 각 시간대의 사고특성을 제시하고자 한다. 이에 로지스틱 회귀분석을 통해 분석한 결과 흐린 날씨의 경우 첨두시간에 발생되는 사망사고 위험도가 비첨두시간의 경우보다 더 높게 나타났고, 비첨두시간 사망사고 위험도의 경우 안개가 낀 날 증가하고 맑은 날 감소하는 모습이 나타났다. 과속의 경우 비첨두시간이 첨두시간의 경우 보다 크게 나타났고, 횡단 중인 보행자와 발생되는 사고에 대해서는 첨두시간의 사망위험도가 상대적으로 높은 것으로 나타났다. 차량단독 사고의 경우 공작물과 충돌로 인한 사망위험도는 첨두시간이 높은 것으로 나타났고, 도로 이탈로 인한 사망위험도는 비첨두시간이 높은 것으로 나타났다.

  • PDF

The Study on the Severity of Children Traffic Accident using Ordinal Logistic Regression Analysis (순서형 로지스틱 회귀분석을 이용한 어린이 사고심각도 분석 연구)

  • Yoon, Byoung-Jo;Ko, Eun-Hyeck;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2016.11a
    • /
    • pp.259-260
    • /
    • 2016
  • 어린이의 경우 다른 연령층에 비해 신체적, 정신적으로 완성되지 못하여 교통사고의 가능성이 높으며, 특히 전국의 어린이 교통사고는 점진적으로 감소 추세이나 인천의 어린이 교통사고는 감소하다가 다시 증가 추세에 들어선 실정이다. 따라서 본 연구의 목적은 어린이 교통사고 심각도에 영향을 미치는 주요 요인들을 발견하고 제시하고자 하였다. 순서형 로지스틱 회귀분석을 활용하여 순서척도인 반응변수에 대한 설명변수의 오즈(Odds)를 확인하고자 하였으며 안전운전불이행, 차대사람(횡단중), 차대차(측면직각충돌)사고가 유의한 결과로 나타났다. 안전운전불이행으로 인한 사망사고와 기타사고의 오즈차이는 1.35배, 측면직각충돌로 인한 사망사고와 기타사고의 오즈차이는 1.76배 증가하는 것으로 나타났고, 횡단중인 경우에는 오히려 사망 위험도의 오즈값이 0.58배로 감소하는 것으로 나타났다.

  • PDF

A Study on the Relative Risk by Elderly Driver's Age using Logistic Regression (로지스틱 회귀분석을 이용한 고령운전자 연령대별 상대위험도 분석에 관한 연구)

  • Yoon, Byoung-Jo;Lee, So-Yeon;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2017.11a
    • /
    • pp.205-206
    • /
    • 2017
  • 도로교통공단 교통사고 분석시스템(TAAS)에 따르면 2016년 기준 전체사고의 약 11%가 고령운전자 사고이며, 고령운전자 사고로 인한 사망자수는 759명에 달한다. 본 연구에서는 고령운전자의 신체적 특징을 감안하여 전기(65세~74세), 중기(75세~84세), 후기(85세 이후)로 나누고 로지스틱 회귀분석을 이용하여 고령운전자의 연령대별 사고특성과 사망사고에 영향을 미치는 요인을 파악하고 그 특성을 고려한 안전대책을 제시하고자 하였다. 분석결과 차량단독사고일 때 고령자 전 연령대에서 사고위험도가 높게 나타났으며, 도로이탈로 인한 사고인 경우 다른 사고요인에 비해 위험도가 높게 나타났다. 사고원인별로 살펴보면 안전운전의무 불이행, 중앙선침범으로 인한 사고인 경우가 높았으며, 기상상태별로 볼 때 전기고령자에서 중기, 후기 고령자로 갈수록 흐릴 때의 사고위험도가 높아지는 것으로 나타났다.

  • PDF