• Title/Summary/Keyword: 로지스틱 분석

Search Result 1,841, Processing Time 0.026 seconds

Data Mining for Road Traffic Accident Type Classification (데이터 마이닝을 이용한 교통사고 심각도 분류분석)

  • 손소영;신형원
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.4
    • /
    • pp.187-194
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도 변화에 영향력 있는 변수 선택을 위하여 독립성 검정을 위한 $x^2$ test와 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 Decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합한 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

Data Mining for Road Traffic Accident Type Classification (데이터 마이닝을 이용한 교통사고 심각도 분류분석)

  • 손소영
    • Proceedings of the KOR-KST Conference
    • /
    • 1998.10a
    • /
    • pp.373-381
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도변화에 영향력 있는 변수선택을 위하여 $X^2$ 독립성 검정과 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합합 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

한국 제조기업의 혁신성과에 영향을 미치는 장애요인에 관한 연구

  • Kim, Jae-Yeong;Hwang, Jeong-Jae;Park, Jae-Min
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.11a
    • /
    • pp.483-497
    • /
    • 2017
  • a본 논문에서는 과학기술정책연구원에서 조사한 2016년 한국기술혁신조사(KIS 2016) 데이터를 이용하여 한국 제조기업의 혁신성과에 영향을 미치는 혁신저해요인에 관한 분석을 진행하였다. KIS 2016 데이터의 제조업 기업 수는 4000개였는데 이 중 혁신 설문에서 제시한 혁신 저해요인 중 아무것도 겪지 않았다고 답한 기업과 응답이 누락된 기업을 제외한 3159개 기업의 데이터를 활용하여 분석을 진행하였으며, 분석 방법으로는 로지스틱 회귀모형을 사용하였다. 자료를 바탕으로 요인분석을 실시하였으며, 그에 따라 혁신 저해요인으로 자금 문제, 기업 역량 요인, 필요 요인 총 세 가지 요인이 추출되었다. 이를 바탕으로 로지스틱 회귀분석 결과 자금 문제와 기업 역량 요인의 경우 혁신 제품의 시장 출시에 정(+)의 영향을 미치는 것으로 나타났으며 필요 요인의 경우 음(-)의 영향을 미치는 것으로 나타나 기업의 혁신 성공에 있어서는 기술혁신의 필요성에 대한 인식 제고가 시급한 것으로 분석되었다.

  • PDF

A Study on the Sentiment analysis of Google Play Store App Comment Based on WPM(Word Piece Model) (WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구)

  • Park, jae Hoon;Koo, Myong-wan
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.291-295
    • /
    • 2016
  • 본 논문에서는 한국어 기본 유니트 단위로 WPM을 활용한 구글 플레이 스토어 앱의 댓글 감정분석을 수행하였다. 먼저 자동 띄어쓰기 시스템을 적용한 후, 어절단위, 형태소 분석기, WPM을 각각 적용하여 모델을 생성하고, 로지스틱 회귀(Logistic Regression), 소프트맥스 회귀(Softmax Regression), 서포트 벡터머신(Support Vector Machine, SVM)등의 알고리즘을 이용하여 댓글 감정(긍정과 부정)을 비교 분석하였다. 그 결과 어절단위, 형태소 분석기보다 WPM이 최대 25%의 향상된 결과를 얻었다. 또한 분류 과정에서 로지스틱회귀, 소프트맥스 회귀보다는 SVM 성능이 우수했으며, SVM의 기본 파라미터({'kernel':('linear'), 'c':[4]})보다 최적의 파라미터를 적용({'kernel': ('linear','rbf', 'sigmoid', 'poly'), 'C':[0.01, 0.1, 1.4.5]} 하였을 때, 최대 91%의 성능이 나타났다.

  • PDF

Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D) (제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교)

  • Park, Jae-Cheol;Kim, Min-Ho;Lee, Jea-Young
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.5
    • /
    • pp.573-585
    • /
    • 2018
  • In this study, we fit the logistic regression model and naïve Bayesian classifier model using 11 risk factors to predict the incidence rate probability for type 2 diabetes mellitus. We then introduce how to construct a nomogram that can help people visually understand it. We use data from the 2013-2015 Korean National Health and Nutrition Examination Survey (KNHANES). We take 3 interactions in the logistic regression model to improve the quality of the analysis and facilitate the application of the left-aligned method to the Bayesian nomogram. Finally, we compare the two nomograms and examine their utility. Then we verify the nomogram using the ROC curve.

Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data (보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교)

  • Rhee, Eun Hee;Hwang, Beom Seuk
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.1
    • /
    • pp.131-146
    • /
    • 2022
  • Logit models are commonly used to predicting and classifying categorical response variables. Most Bayesian approaches to logit models are implemented based on the Metropolis-Hastings algorithm. However, the algorithm has disadvantages of slow convergence and difficulty in ensuring adequacy for the proposal distribution. Therefore, we use auxiliary mixture sampler proposed by Frühwirth-Schnatter and Frühwirth (2007) to estimate logit models. This method introduces two sequences of auxiliary latent variables to make logit models satisfy normality and linearity. As a result, the method leads that logit model can be easily implemented by Gibbs sampling. We applied the proposed method to diabetes data from the Community Health Survey (2020) of the Korea Disease Control and Prevention Agency and compared performance with Metropolis-Hastings algorithm. In addition, we showed that the logit model using auxiliary mixture sampling has a great classification performance comparable to that of the machine learning models.

노인의 사망요인 분석: 치매와 타 원인간의 비교

  • Kim, Han-Gon;Poston Jr., Dudley L.;Min, Hosik
    • Korea journal of population studies
    • /
    • v.30 no.1
    • /
    • pp.49-66
    • /
    • 2007
  • 본 연구는 2001년 한국에서 사망한 60세 이상 노인들 62,000명의 사망기록 자료를 이용하여 사망원인의 다양성을 보여주는 한편 치매에 의한 사망원인을 가장 잘 예측할 수 있는 변수를 경험적으로 규명하고자 실시하였다. 이와 같은 목적을 위한 연구내용은 다음과 같다. 첫째, 노인들의 주요 사망원인에 해당하는 악성종양, 뇌혈관 질환, 심장병, 당뇨, 만성 호흡기 질환, 치매, 고혈압, 간 질환, 사고, 결핵 및 기타 질병 등 11개 사망원인에 대하여 빈도분석을 실시하였다. 둘째, 60세 이상 사망자들 가운데 치매에 의한 사망원인과 나머지 19개의 사망원인을 비교하여 치매에 의한 사망에 영향을 미치는 요인들을 다항로지스틱회귀분석을 통해 분석하였다. 그 결과, 한국의 노인인구 가운데 연령이 높을수록 치매로 인하여 사망할 가능성(우도비)이 높으며 여성이 남성에 비해 치매에 의하여 사망할 가능성이 높은 것으로 밝혀졌다. 그러나 교육수준이 높을수록 치매에 의하여 사망할 가능성이 낮은 것으로 나타났으며 거주지역은 치매에 의한 사망과 통계적으로 유의미한 관계가 있었으나 일관성은 없는 것으로 밝혀졌다. 한편 결혼지위는 치매에 의한 사망과 통계적으로 유의미한 관계가 없는 것으로 나타났다.

A Study on the Cause of Death Accident between Cental & Southern Area Highways using Logistic Regression Analysis (로지스틱 회귀분석을 이용한 중부·남부 고속도로별 사망사고 원인 분석 및 비교에 관한 연구)

  • Yoon, Byoung-Jo;Baek, Jun-Hyouk;Yang, Sung-Ryong
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2017.11a
    • /
    • pp.209-210
    • /
    • 2017
  • 본 연구는 고속도로 40개선을 중부 남부 그룹으로 나누어 종단경사, 월별, 가해자연령구간 측면에서 사고 특성을 파악함으로써 유의하게 지역별 고속도로 사망사고를 높이는 요인을 분석하고자 했다. 조사된 노선 중 88올림픽선, 남해선, 호남선, 울산선 등을 포함한 18개 고속도로 노선을 남부 그룹으로, 경인선, 영동선, 서울외곽순환선 등을 포함한 11개 고속도로 노선을 중부 그룹으로 나누어 비교 분석 결과는 다음과 같았다. 고속도로에서의 사망사고 주요 원인의 비율 1위 과속, 2위 주시태만으로 비슷했으나 남부 고속도로 그룹은 요인 중 졸음에만 유의했다. 중부 고속도로 그룹에서도 졸음 시 유의하게 나타났으며 남부보다 오즈비가 1.22배 높게 나타났다. 추가로 중부 고속도로 그룹에서 주시태만(오즈비 1.477), 운전자기타(오즈비 0.347)이 유의하게 도출되었다.

  • PDF