• 제목/요약/키워드: Multivariate Statistical Method

검색결과 295건 처리시간 0.023초

Support Vector Machine을 이용한 기업부도예측 (Bankruptcy Prediction using Support Vector Machines)

  • 박정민;김경재;한인구
    • Asia pacific journal of information systems
    • /
    • 제15권2호
    • /
    • pp.51-63
    • /
    • 2005
  • There has been substantial research into the bankruptcy prediction. Many researchers used the statistical method in the problem until the early 1980s. Since the late 1980s, Artificial Intelligence(AI) has been employed in bankruptcy prediction. And many studies have shown that artificial neural network(ANN) achieved better performance than traditional statistical methods. However, despite ANN's superior performance, it has some problems such as overfitting and poor explanatory power. To overcome these limitations, this paper suggests a relatively new machine learning technique, support vector machine(SVM), to bankruptcy prediction. SVM is simple enough to be analyzed mathematically, and leads to high performances in practical applications. The objective of this paper is to examine the feasibility of SVM in bankruptcy prediction by comparing it with ANN, logistic regression, and multivariate discriminant analysis. The experimental results show that SVM provides a promising alternative to bankruptcy prediction.

Identifying Multiple Leverage Points ad Outliers in Multivariate Linear Models

  • Yoo, Jong-Young
    • Communications for Statistical Applications and Methods
    • /
    • 제7권3호
    • /
    • pp.667-676
    • /
    • 2000
  • This paper focuses on the problem of detecting multiple leverage points and outliers in multivariate linear models. It is well known that he identification of these points is affected by masking and swamping effects. To identify them, Rousseeuw(1985) used robust estimators of MVE(Minimum Volume Ellipsoids), which have the breakdown point of 50% approximately. And Rousseeuw and van Zomeren(1990) suggested the robust distance based on MVE, however, of which the computation is extremely difficult when the number of observations n is large. In this study, e propose a new algorithm to reduce the computational difficulty of MVE. The proposed method is powerful in identifying multiple leverage points and outlies and also effective in reducing the computational difficulty of MVE.

  • PDF

Unmasking Multiple Outliers in Multivariate Data

  • Yoo Jong-Young
    • Communications for Statistical Applications and Methods
    • /
    • 제13권1호
    • /
    • pp.29-38
    • /
    • 2006
  • We proposed a procedure for detecting of multiple outliers in multivariate data. Rousseeuw and van Zomeren (1990) have suggested the robust distance $RD_i$ by using the Resampling Algorithm. But $RD_i$ are based on the assumption that X is in the general position.(X is said to be in the general position when every subsample of size p+1 has rank p) From the practical points of view, this is clearly unrealistic. In this paper, we proposed a computing method for approximating MVE, which is not subject to these problems. The procedure is easy to compute, and works well even if subsample is singular or nearly singular matrix.

A Review of the Statistical Analysis used in Clinical Articles Published on Journal of Korean Neurosurgical Society

  • Kang, Wee-Chang
    • Journal of Korean Neurosurgical Society
    • /
    • 제40권4호
    • /
    • pp.304-308
    • /
    • 2006
  • Statistical analyses used in clinical articles published on the Journal of Korean Neurosurgical Society were identified and appropriateness of statistical aspects in reporting results was assessed. Forty seven clinical articles were selected in this study, which were published from February, 2005 to February, 2006 on the journal. The frequency of statistical analysis was as follows : descriptive statistics only 24 [51.1%]. one type of statistical method 10 [21.3%], two or more methods 13 [27.6%]. An assessment of statistical aspects was performed in 24 clinical articles reporting inferential statistics. Ten articles [41.7%] did not adequately describe or reference all statistical methods used. There were six articles [25.0%] not reporting the confidence level used as the critical criteria of the statistical significance. In thirteen articles [54.2%] it seems more appropriate to implement multivariate analyses in addition to univariate analyses. We recommend that the journal readers should concentrate on improving their knowledge of basic statistics and statistical review for manuscripts submitted should be sought from professionals in the fields of biostatistics and epidemiology.

다변량 통계분석법을 이용한 PET 중합공정 중 직접 에스테르화 반응기의 거동 및 생산제품 예측 (Multivariate Statistical Analysis Approach to Predict the Reactor Properties and the Product Quality of a Direct Esterification Reactor for PET Synthesis)

  • 김성영;정창복;최수형;이범석;이범석
    • 제어로봇시스템학회논문지
    • /
    • 제11권6호
    • /
    • pp.550-557
    • /
    • 2005
  • The multivariate statistical analysis methods, using both multiple linear regression(MLR) and partial least square(PLS), have been applied to predict the reactor properties and the product quality of a direct esterification reactor for polyethylene terephthalate(PET) synthesis. On the basis of the set of data including the flow rate of water vapor, the flow rate of EG vapor, the concentration of acid end groups of a product and other operating conditions such as temperature, pressure, reaction times and feed monomer mole ratio, two multi-variable analysis methods have been applied. Their regression and prediction abilities also have been compared. The prediction results are critically compared with the actual plant data and the other mathematical model based results in reliability. This paper shows that PLS method approach can be used for the reasonably accurate prediction of a product quality of a direct esterification reactor in PET synthesis process.

가능도 함수를 기초로 한 다변량 정규성 검정 (A Test of the Multivariate Normality Based on Likelihood Functions)

  • 여인권
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.223-232
    • /
    • 2002
  • 이 논문에서는 비선형 변환과 가능도 함수를 이용하여 다변량 자료의 정규성을 검정하는 방법에 대해 알아본다. 사용된 변환은 변환모수에 따라 여러 가지 형태를 가지는 변환족을 구성하는데 이 변환모수를 검정하여 자료의 정규성을 검정한다. 모수의 검정은 점수함수(score function)을 기초로 이루어지며 표본크기가 적은 경우에도 검정통계량의 분포를 유도하기 위한 모수적 붓스트랩 검정방법이 사용된다. 모의실험 결과 기존의 방법과 검정력을 비교하여 제안된 방법이 검정력이 높은 것으로 나타났다.

치우친 다변량 t-분포 혼합모형에 대한 최우추정 (An Alternating Approach of Maximum Likelihood Estimation for Mixture of Multivariate Skew t-Distribution)

  • 김승구
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.819-831
    • /
    • 2014
  • 치우친 다변량 t-분포 혼합을 적합하기 위해 Exact-EM 알고리즘이 사용된다. 그러나 이 방법은 E-step에서 매우 긴 처리시간을 요하는 다변량 절단 t-분포의 적률을 계산해야 한다. 본 논문에서는 이러한 문제점을 완화하기 위해 SPU-EM이라 명명한 알고리즘을 제안하는데, 이것은 Meng과 van Dyk (1997)의 AECM 알고리즘의 원리를 이용하여 다차원 적률의 계산상의 어려움을 해결한다. 결과적으로 제안된 방법은 Exact-EM 알고리즘 보다 빠른 처리시간으로 보장한다. 이를 입증하기 위해 실험을 통해 제안된 방법의 유효성을 보인다.

로버스트 회귀모형을 이용한 자료결합방법 (Statistical Matching Techniques Using the Robust Regression Model)

  • 전명식;정시송;박혜진
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.981-996
    • /
    • 2008
  • 서로 다른 출처로부터 얻어진 데이터 파일들을 하나의 데이터 파일로 만드는 통계적 자료결합방법은 공통변수와 서로 다른 고유변수를 포함하여 변수들 간에 존재하는 관련성에 대해 살펴볼 수 있다. Robin (1986)이 제안한 일반회귀모형의 예측값을 이용한 통계적 결합방법은 자료에 대한 다변량 정규성을 가정하기 때문에 이 가정을 위반하는 자료를 이용하는 것은 많은 문제를 수반한다. 본 연구는 제공파일의 고유변수에 모분포를 반영하지 못하는 특이점이 존재하는 경우, 일반회귀모형을 이용한 통계적 결합방법의 대안으로 로러스트 회귀추정방법을 이용한 자료결합방법을 제안하였다. 나아가 로버스트 회귀모형을 이용한 결합방법과 일반회귀모형을 이용한 결합방법에서의 상관관계 및 결정계수 보존에 관한 성능을 비교하기 위하여 모의실험을 수행하였다.

벤치마킹방법을 이용한 분기 GRDP의 추정 (Estimating Quarterly GRDP Using Benchmarking Method)

  • 이긍희
    • 응용통계연구
    • /
    • 제22권1호
    • /
    • pp.75-88
    • /
    • 2009
  • 지역경제를 대표하는 통계인 GRDP는 시의성이 부족하고 연간으로만 발표되어 정책수립 및 통계분석 연구에 충분히 활용되지 못하고 있다. 따라서 분기 GRDP를 작성할 필요가 있다. 본 논문에서는 산업별 GDP와 산업별 GRDP가 공행하고 지역별로 산업구조가 다르다는 점을 감안한 분기 참고 지표를 먼저 만들고 이를 바탕으로 벤치마킹방법인 Chow-Lin 방법과 다변량 Denton 방법을 적용하여 시간적 일치성과 회계적 일치성을 가지는 분기 GRDP를 작성하였다.

붓스트랩을 활용한 최적 절사공간중위수 추정량 (A Trimmed Spatial Median Estimator Using Bootstrap Method)

  • 이동희;정병철
    • 응용통계연구
    • /
    • 제23권2호
    • /
    • pp.375-382
    • /
    • 2010
  • 본 논문에서는 다변량 자료의 위치모수에 대한 로버스트 추정량으로 공간중위수에 대한 절사 추정량을 제안하였다. 최적절사율은 붓스트랩 방법을 이용하여 결정하였으며, 이중붓스트랩을 활용하여 추정된 절사공간중위수의 공분산행렬을 추정하였다. 모의실험 결과 붓스트랩 방법에 의한 절사공간중위수는 자료가 다변량 코시분포를 따르는 경우 기존 공간중위수에 비하여 작은 평균제곱오차를 보여 효율적인 추정량으로 나타났다. 아울러 이중붓스트랩을 이용한 절사추정량의 공분산행렬 추정량은 단순붓스트랩 방법에 의하여 추정된 공분산행렬이 갖는 과소추정의 문제를 해결하는 방법으로 나타났다.