• Title/Summary/Keyword: 판별분석모형

Search Result 240, Processing Time 0.022 seconds

중풍의 증형 진단을 위한 판별모형

  • Sin, Yang-Gyu
    • Journal of the Korean Data and Information Science Society
    • /
    • v.7 no.2
    • /
    • pp.283-287
    • /
    • 1996
  • 본 연구는 중풍에서의 한의학의 풍부한 임상자료들에 대한 객관적이고도 논리적인 자료처리방법 및 변증으로부터 증형을 추론할 수 있는 통계적 방법을 연구하고자 한다. 중풍 전문의에 의해 수집된 65명의 환자들의 임상자료로부터 다변량 자료 분석의 하나인 판별분석을 이용하여 증후로부터 증형을 판단할 수 있는 수리적 판별모형을 구축하였다. 구축된 모형은 중풍 전문가 시스템을 개발하기 위한 기초가 될 것이다.

  • PDF

Link Weight Discrimination Analysis based Design of Input Nodes in ANN Models for Bankruptcy Prediction: Strong-Linked Neurons Selection and Weak-Linked Neurons Elimination Approach (연결강도판별분석에 의한 부도예측용 신경망 모형의 입력노드 설계 : 강체연결뉴론 선정 및 약체연결뉴론 제거 접근법)

  • 이웅규;손동우
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.11a
    • /
    • pp.469-477
    • /
    • 2000
  • 본 연구에서는 부도예측용 인공신경망 모형의 입력노드를 선정하기 위한 방법론으로 연결강도판별분석(Link Weight Discrimination Analysis)에 의한 약체뉴론제거법(Weak-Linked Neuron Elimination)과 강체뉴론선택법 (Strong-Linked Neurons Selection)을 제안한다. 연결강도판별분석이란 적절한 학습이 끝난 인공신경망 모형에서 입력노드와 연결되는 가중치의 합에 대한 절대값인 연결강도 판별식(Link Weight Discrimination)에 의해 해당 입력노 드가 출력노드에 미치는 영향정도를 분석하는 것이다. 한편 강체연결뉴론선택법은 선처리를 통해 얻어진 학습된 인공신경망의 입력노드 가운데서 연결강도판별식이 큰 뉴론만을 본처리의 입력노드로 선정하는 것인데 비해 약체연결뉴론제거법은 연결강도판별식이 일정 값 즉, 연결강도 판별임계치(Link Weight Discrimination Cut off Value) 보다 낮은 입력노드를 제외하고 나머지 입력노드만을 본처리의 입력노드로 선정하는 것이다. 본 연구에서는 강체연결뉴론선택법과 약체연결뉴론제거법을 각각 정형적인 방법론으로 정립하고 이 방법론에 의해 부도예측용 인공신경망을 구축하여 각각의 모형을 의사결정트리에 의해 선정된 인공신경망 모형 및 선처리 과정을 거치지 않은 인공신경망 모형과 성능을 비교, 분석하여 본 연구에서 제안한 방법론의 타당성을 제시하였다.

  • PDF

한의학에서의 사상체질판별함수 개발에 관한 연구 (II) - 도수분석에 의한 변수선택 -

  • Kim, Gyu-Gon;Jo, Min-Hyeong
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.69-77
    • /
    • 2004
  • 본 논문에서는 한방병원에서 사상체질분류검사설문지를 이용하여 사상체질을 진단할 때 진단의 정확도를 향상시키기 위한 사상체질분류함수를 개발하기 위하여 데이터마이닝에서의 판별분석모형을 이용한다. 데이터 정제 과정에서 양질의 데이터를 확보하기 위한 기준은 상반되는 설문의 응답 패턴과 체질별 설문의 응답 비율을 이용하며, 변수선택의 기준은 도수분석의 비율차이검정과 선형판별함수의 계수를 이용한다.

  • PDF

한의학에서의 사상체질판별함수 개발에 관한 연구 (I) - 크론박 알파 계수에 의한 변수선택 -

  • Kim, Gyu-Gon;Choi, Seung-Bae
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.61-68
    • /
    • 2004
  • 본 논문에서는 한방병원에서 사상체질분류검사설문지를 이용하여 사상체질을 진단할 때 진단의 정확도를 향상시키기 위한 사상체질분류함수를 개발하기 위하여 데이터마이닝에서의 판별분석모형을 이용한다. 데이터 정제 과정에서 불성실한 응답자를 제거시키기 위한 기준은 상반되는 설문의 응답 패턴과 체질별 설문의 응답 비율을 이용하며, 변수선택의 기준은 상관분석의 크론박 알파 계수와 선형판별함수의 계수를 이용한다.

  • PDF

Steal Success Model for 2007 Korean Professional Baseball Games (2007년 한국프로야구에서 도루성공모형)

  • Hong, Chong-Sun;Choi, Jeong-Min
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.455-468
    • /
    • 2008
  • Based on the huge baseball game records, the steal plays an important role to affect the result of games. For the research about success or failure of the steal in baseball games, logistic regression models are developed based on 2007 Korean professional baseball games. The analyses of logistic regression models are compared of those of the discriminant models. It is found that the performance of the logistic regression analysis is more efficient than that of the discriminant analysis. Also, we consider an alternative logistic regression model based on categorical data which are transformed from uneasy obtainable continuous data.

Consumer Credit Scoring Model with Two-Stage Mathematical Programming (통합 수리계획법을 이용한 개인신용평가모형)

  • Lee, Sung-Wook;Roh, Tae-Hyup
    • The Journal of Information Systems
    • /
    • v.16 no.1
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution (사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구)

  • Beum, Soo-Gyun;Jeon, Mi-Ran;Oh, Am-Suk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.08a
    • /
    • pp.155-159
    • /
    • 2008
  • In this thesis, in order to develop a new classification model of Sasang Constitutional medical types, which is helpful for improving the accuracy of diagnosis of medical types. various data-mining classification models such as discriminant analysis. decision trees analysis, neural networks analysis, logistics regression analysis, clustering analysis which are main classification methods were applied to the questionnaires of medical type classification. In this manner, a model which scientifically classifies constitutional medical types in the field of Sasang Constitutional Medicine, one of a traditional Korean medicine, has been developed. Also, the above-mentioned analysis models were systematically compared and analyzed. In this study, a classification of Sasang constitutional medical types was developed based on the discriminate analysis model and decision trees analysis model of which accuracy is relatively high, of which analysis procedure is easy to understand and to explain and which are easy to implement. Also, a diagnosis system of Sasang constitution was implemented applying the two analysis models.

  • PDF

A credit classification method based on generalized additive models using factor scores of mixtures of common factor analyzers (공통요인분석자혼합모형의 요인점수를 이용한 일반화가법모형 기반 신용평가)

  • Lim, Su-Yeol;Baek, Jang-Sun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.2
    • /
    • pp.235-245
    • /
    • 2012
  • Logistic discrimination is an useful statistical technique for quantitative analysis of financial service industry. Especially it is not only easy to be implemented, but also has good classification rate. Generalized additive model is useful for credit scoring since it has the same advantages of logistic discrimination as well as accounting ability for the nonlinear effects of the explanatory variables. It may, however, need too many additive terms in the model when the number of explanatory variables is very large and there may exist dependencies among the variables. Mixtures of factor analyzers can be used for dimension reduction of high-dimensional feature. This study proposes to use the low-dimensional factor scores of mixtures of factor analyzers as the new features in the generalized additive model. Its application is demonstrated in the classification of some real credit scoring data. The comparison of correct classification rates of competing techniques shows the superiority of the generalized additive model using factor scores.

A Study on the Optimal Discriminant Model Predicting the likelihood of Insolvency for Technology Financing (기술금융을 위한 부실 가능성 예측 최적 판별모형에 대한 연구)

  • Sung, Oong-Hyun
    • Journal of Korea Technology Innovation Society
    • /
    • v.10 no.2
    • /
    • pp.183-205
    • /
    • 2007
  • An investigation was undertaken of the optimal discriminant model for predicting the likelihood of insolvency in advance for medium-sized firms based on the technology evaluation. The explanatory variables included in the discriminant model were selected by both factor analysis and discriminant analysis using stepwise selection method. Five explanatory variables were selected in factor analysis in terms of explanatory ratio and communality. Six explanatory variables were selected in stepwise discriminant analysis. The effectiveness of linear discriminant model and logistic discriminant model were assessed by the criteria of the critical probability and correct classification rate. Result showed that both model had similar correct classification rate and the linear discriminant model was preferred to the logistic discriminant model in terms of criteria of the critical probability In case of the linear discriminant model with critical probability of 0.5, the total-group correct classification rate was 70.4% and correct classification rates of insolvent and solvent groups were 73.4% and 69.5% respectively. Correct classification rate is an estimate of the probability that the estimated discriminant function will correctly classify the present sample. However, the actual correct classification rate is an estimate of the probability that the estimated discriminant function will correctly classify a future observation. Unfortunately, the correct classification rate underestimates the actual correct classification rate because the data set used to estimate the discriminant function is also used to evaluate them. The cross-validation method were used to estimate the bias of the correct classification rate. According to the results the estimated bias were 2.9% and the predicted actual correct classification rate was 67.5%. And a threshold value is set to establish an in-doubt category. Results of linear discriminant model can be applied for the technology financing banks to evaluate the possibility of insolvency and give the ranking of the firms applied.

  • PDF

A Study on Predicting Bankruptcy Discriminant Model for Small-Sized Venture Firms using Technology Evaluation Data (기술력평가 자료를 이용한 중소벤처기업 파산예측 판별모형에 관한 연구)

  • Sung Oong-Hyun
    • Journal of Korea Technology Innovation Society
    • /
    • v.9 no.2
    • /
    • pp.304-324
    • /
    • 2006
  • There were considerable researches by finance people trying to find out business ratios as predictors of corporate bankruptcy. However, such financial ratios usually lack theoretical justification to predict bankruptcy for technology-oriented small sized venture firms. This study proposes a bankruptcy predictive discriminant model using technology evaluation data instead of financial data, evaluates the model fit by the correct classification rate, cross-validation method and M-P-P method. The results indicate that linear discriminant model was found to be more appropriate model than the logistic discriminant model and 69% of original grouped data were correctly classified while 67% of future data were expected to be classified correctly.

  • PDF