• Title/Summary/Keyword: 로지스틱분석

Search Result 1,820, Processing Time 0.031 seconds

Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic (다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로)

  • Kim, Mi-Jung
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.4
    • /
    • pp.589-602
    • /
    • 2008
  • This article studies on disability pensioners' characteristic with multinomial logit and logistic regression model. Seven factors are examined on whether each factor is reflected in degree of disability in the disability pension. By incorporating multinomial logit and logistic regression model, effectiveness and characteristic of the seven factors are investigated on the degree of disability. Result shows all the seven factors are significant on the degree of disability, while among the seven, five factors, age, sex, type of coverage, type of category, insured duration show a trend in degree of disability and the other two, cause of disability and class of standard monthly income are not effective on trend in degree of disability. Results from analyses might be useful for disability pension management.

Development of heavy rain damage prediction function using logistic regression model (로지스틱 회귀모형을 이용한 호우피해 예측함수 개발)

  • Choi, Chang Hyun;Kim, Jong Sung;Kim, Dong Hyun;Lee, Jong So;Kim, Hung Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.41-41
    • /
    • 2017
  • 자연재난으로 인한 피해의 대형화, 다양화, 집중화 현상이 일어나고 있으며, 이로 인한 사회 경제적 피해가 과거에 비해 계속적으로 증가하고 있다. 만약 기존에 발생하였던 재난 피해 자료와 기상현상간의 통계적 분석을 통해 재난의 발생 가능성과 피해 범위를 예측할 수 있다면, 효율적으로 재난관리를 할 수 있을 것이다. 따라서 본 연구에서는 대표적인 자연재난 피해인 호우피해를 대상으로 낙동강 권역 69개 시군구별 재해통계 자료를 기반으로 수문기상자료와의 통계적 분석을 통해 호우피해 예측함수를 개발하였다. 국민안전처에서 발간하는 재해연보 자료를 통해 호우피해 발생기간별 호우피해액 자료를 분석하였고, 이를 호우피해 예측함수의 종속변수로 사용하였다. 종관기상관측소의 시강우 자료를 분석하여 선행강우, 지속시간별 최대강우, 총강우량을 구축하였고, 시군구별 면적 등의 지역 특성을 수집하여 설명변수로 사용하였다. 기존의 피해예측함수 관련 연구에서 제기되었던 피해액이 큰 부분에서 예측력이 떨어지는 문제를 해결하기 위해, 피해액이 큰 집단과 피해액이 작은 집단을 구분하여 함수식을 개발할 수 있는 로지스틱 회귀모형을 사용하여 호우피해 예측함수를 개발하였다. 개발된 호우피해 예측함수의 NRMSE는 6.34~18.79%로 나타났으며, 대부분 호우피해를 적절하게 예측하는 것으로 나타났다. 본 연구에서는 호우피해액이 큰 집단과 피해액이 작은 집단으로 구분할 수 있는 로지스틱 회귀모형을 이용하여 낙동강 권역의 시군구별 호우피해 예측함수를 개발하였다. 본 연구에서 제시한 시군구별 호우피해 예측함수를 이용하여 사전에 호우피해를 예측할 수 있다면 호우피해액이 크게 줄어들 것으로 사료된다.

  • PDF

수량화 분석과 AHP를 이용한 산사태 예측모형 개발

  • Nam, Eun-Mi;Jun, Kyoung-Ho;Yu, Hyu-Kyong;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.114-119
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 달리 AHP(Analytic Hierarchy Process) 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

  • PDF

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • Lee, Seung-Yeon;Lee, Eun-Ju;Choe, Ho-Sik
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

Development of model for prediction of land sliding at steep slopes (급경사지 붕괴 예측을 위한 모형 개발)

  • Park, Ki-Byung;Joo, Yong-Sung;Park, Dug-Keun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.691-699
    • /
    • 2011
  • Land sliding is one of well-known nature disaster. As a part of effort to reduce damage from land sliding, many researchers worked on increasing prediction ability. However, because previous studies are conducted mostly by non-statisticians, previously proposed models were hardly statistically justifiable. In this paper, we predicted the probability of land sliding using the logistic regression model. Since most explanatory variables under consideration were correlated, we proposed the final model after backward elimination process.

A Comparative Experiment of Software Defect Prediction Models using Object Oriented Metrics (객체지향 메트릭을 이용한 결함 예측 모형의 실험적 비교)

  • Kim, Yun-Kyu;Kim, Tae-Yeon;Chae, Heung-Seok
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.8
    • /
    • pp.596-600
    • /
    • 2009
  • To support an efficient management of software verification and validation activities, many defect prediction models have been proposed based on object oriented metrics. They usually adopt logistic regression analysis, And, they state that the correctness of prediction is about 60${\sim}$70%, We performed a similar experiment with Eclipse 3.3 to check their prediction effectiveness, However, the result shows that correctness is about 40% which is much lower than the original results. We also found that univariate logistic regression analysis produces better results than multivariate logistic regression analysis.

Logistic Regressions with Sensory Evaluation Data about Hanwoo Steer Beef (한우 거세우 고기 관능평가 데이터의 로지스틱 회귀분석)

  • Lee, Hye-Jung;Kim, Jae-Hee
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.857-870
    • /
    • 2010
  • This study was conducted to investigate the relationship between the socio-demographic factors and the Korean consumers palatability evaluation grades with Hanwoo sensory evaluation data from 2006 to 2008 by National Institute of Animal Science. The dichotomy logistic regression model and the multinomial logistic regression model are fitted with the independent variables such as the consumer living location, age, gender occupation, monthly income, beef cut and the the palatability grade as the categorical dependent variable and tenderness, 리avor and juiciness as the continuous dependent variable. Stepwise variable selection procedure is incorporated to find the final model and odds ratios are calculated to nd the associations between categories.

A Study on the Sentiment analysis of Google Play Store App Comment Based on WPM(Word Piece Model) (WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구)

  • Park, jae Hoon;Koo, Myong-wan
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.291-295
    • /
    • 2016
  • 본 논문에서는 한국어 기본 유니트 단위로 WPM을 활용한 구글 플레이 스토어 앱의 댓글 감정분석을 수행하였다. 먼저 자동 띄어쓰기 시스템을 적용한 후, 어절단위, 형태소 분석기, WPM을 각각 적용하여 모델을 생성하고, 로지스틱 회귀(Logistic Regression), 소프트맥스 회귀(Softmax Regression), 서포트 벡터머신(Support Vector Machine, SVM)등의 알고리즘을 이용하여 댓글 감정(긍정과 부정)을 비교 분석하였다. 그 결과 어절단위, 형태소 분석기보다 WPM이 최대 25%의 향상된 결과를 얻었다. 또한 분류 과정에서 로지스틱회귀, 소프트맥스 회귀보다는 SVM 성능이 우수했으며, SVM의 기본 파라미터({'kernel':('linear'), 'c':[4]})보다 최적의 파라미터를 적용({'kernel': ('linear','rbf', 'sigmoid', 'poly'), 'C':[0.01, 0.1, 1.4.5]} 하였을 때, 최대 91%의 성능이 나타났다.

  • PDF

A Study on the Fraud Detection of Industrial Accident Compensation Insurance (산재보험 부정수급 식별모형에 관한 연구)

  • Ham, Seung-O;Hong, Jeong-Sik
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2008.10a
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF