• Title/Summary/Keyword: 로지스틱판별분석

Search Result 74, Processing Time 0.03 seconds

Steal Success Model for 2007 Korean Professional Baseball Games (2007년 한국프로야구에서 도루성공모형)

  • Hong, Chong-Sun;Choi, Jeong-Min
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.455-468
    • /
    • 2008
  • Based on the huge baseball game records, the steal plays an important role to affect the result of games. For the research about success or failure of the steal in baseball games, logistic regression models are developed based on 2007 Korean professional baseball games. The analyses of logistic regression models are compared of those of the discriminant models. It is found that the performance of the logistic regression analysis is more efficient than that of the discriminant analysis. Also, we consider an alternative logistic regression model based on categorical data which are transformed from uneasy obtainable continuous data.

Local Linear Logistic Classification of Microarray Data Using Orthogonal Components (직교요인을 이용한 국소선형 로지스틱 마이크로어레이 자료의 판별분석)

  • Baek, Jang-Sun;Son, Young-Sook
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.3
    • /
    • pp.587-598
    • /
    • 2006
  • The number of variables exceeds the number of samples in microarray data. We propose a nonparametric local linear logistic classification procedure using orthogonal components for classifying high-dimensional microarray data. The proposed method is based on the local likelihood and can be applied to multi-class classification. We applied the local linear logistic classification method using PCA, PLS, and factor analysis components as new features to Leukemia data and colon data, and compare the performance of the proposed method with the conventional statistical classification procedures. The proposed method outperforms the conventional ones for each component, and PLS has shown best performance when it is embedded in the proposed method among the three orthogonal components.

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • Lee, Seung-Yeon;Lee, Eun-Ju;Choe, Ho-Sik
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

A credit classification method based on generalized additive models using factor scores of mixtures of common factor analyzers (공통요인분석자혼합모형의 요인점수를 이용한 일반화가법모형 기반 신용평가)

  • Lim, Su-Yeol;Baek, Jang-Sun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.2
    • /
    • pp.235-245
    • /
    • 2012
  • Logistic discrimination is an useful statistical technique for quantitative analysis of financial service industry. Especially it is not only easy to be implemented, but also has good classification rate. Generalized additive model is useful for credit scoring since it has the same advantages of logistic discrimination as well as accounting ability for the nonlinear effects of the explanatory variables. It may, however, need too many additive terms in the model when the number of explanatory variables is very large and there may exist dependencies among the variables. Mixtures of factor analyzers can be used for dimension reduction of high-dimensional feature. This study proposes to use the low-dimensional factor scores of mixtures of factor analyzers as the new features in the generalized additive model. Its application is demonstrated in the classification of some real credit scoring data. The comparison of correct classification rates of competing techniques shows the superiority of the generalized additive model using factor scores.

Development of Discernment Analysis System by Graphical User Interface

  • Cha, Kyung-Joon;Shin, Young-Jae;Lee, Yong-Koun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2006.11a
    • /
    • pp.113-117
    • /
    • 2006
  • 우리는 다양한 자료에서 유의미한 정보를 파악하기 위한 방법으로 다변량 분석 방법 중에서 정준판별분석, 로지스틱, 다층퍼셉트론 그리고 의사결정나무를 사용자 편의를 극대화하고 사용이 간단한 비주얼 베이직 6.0을 이용하여 개발하였다.

  • PDF

A Hierarchical Approach for Diagnose of Safety Performance and Factor Identification for Black Spots (Black on Suwon-city) (사고다발지점의 안전성능진단 및 위치별 사고요인분석(수원시를 중심으로))

  • Kim, Suk-Hui;Jang, Jeong-A;Choe, Gi-Ju
    • Journal of Korean Society of Transportation
    • /
    • v.23 no.1
    • /
    • pp.9-20
    • /
    • 2005
  • Accident type and/or factor identification is important in accident reduction planning. The aim of this paper is to apply the hierarchical approach with binomial distribution and logistic regression analysis to find out types and factors, respectively. Based on 2001 Suwon city black spot data, a binomial distribution modeling approach has been applied to diagnose the black spots, with the help of safety performance modeling approach has been applied to diagnose the black spots, with the help of safety performance function. Then, the logistic regression analysis has been employed to identify the critical factors. Some accident remedies are also reviewed in the light of the model outcomes. The proposed research framework sheds light on a different accident related research and can also be successfully applied to similar studies and sites.

통계적 분류방법을 이용한 문화재 정보 분석

  • Kang, Min-Gu;Sung, Su-Jin;Lee, Jin-Young;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

스플라인을 이용한 스코어 카드

  • Choe, Min-Seong;Gu, Ja-Yong;Choe, Dae-U
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.285-288
    • /
    • 2003
  • 신용위험 관리에서 필수적인 방법론이 스코어 카드이며 이를 작성하는 데에 있어서 널리 쓰이는 방법 중의 하나가 로지스틱 회귀분석이다. 본 논문에서는 로지스틱 회귀 방법에 기초한 스플라인 방법론을 소개하고자 한다. 최종 스코어 카드는 연속형 변수를 범주형 변수화 하므로 조각 선형 스플라인을 채택하였다. 모의 실험을 통하여 제안된 방법의 성 능을 규명 하였다.

  • PDF

Consumer Credit Scoring Model with Two-Stage Mathematical Programming (통합 수리계획법을 이용한 개인신용평가모형)

  • Lee, Sung-Wook;Roh, Tae-Hyup
    • The Journal of Information Systems
    • /
    • v.16 no.1
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

사학연금 퇴직률 산출 개선방안 연구

  • Baek, Hye-Yeon
    • Journal of Teachers' Pension
    • /
    • v.3
    • /
    • pp.279-305
    • /
    • 2018
  • 공적연금제도는 장기적 유지 및 운영을 위해 기금의 재정건전성 및 지속가능성 진단을 목적으로 재정계산제도를 운영하고 있다. 정확한 재정계산은 매우 중요하며 이를 위한 선행작업으로 재정계산에 요구되는 기본 가정들을 보다 합리적으로 추정해야 할 필요가 있다. 본 연구는 로지스틱 회귀분석(logistic regression)을 이용하여 사학연금의 재정계산에 적용되는 다양한 기초율들 중 퇴직률을 산출하는 것에 그 목적이 있다. 사학연금은 현재 퇴직률을 교원 및 직원에 대하여 각 성별로 총 4개 집단을 구분하여 각 집단별 가입연령과 재직기간에 따라 산출하고 있다. 그러나 본 연구에서는 학교급 등 퇴직률 산출에 있어 보다 유의한 집단 구분이 있는지를 확인하고 보정의 어려움을 피할 수 있는 하나의 대안으로서 로지스틱 회귀분석을 이용하여 퇴직률을 산출해 보았다. 또한 우수한 모형을 판별하기 위해 통계적으로 우수한 모형보다는 실무적으로 사학연금 재정추계에 적합한 모형을 찾는 것을 목표로 하여 퇴직률을 추정한 값을 제시하였다.