• 제목/요약/키워드: Robust Statistics

검색결과 397건 처리시간 0.021초

Robust Variable Selection in Classification Tree

  • 장정이;정광모
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.89-94
    • /
    • 2001
  • In this study we focus on variable selection in decision tree growing structure. Some of the splitting rules and variable selection algorithms are discussed. We propose a competitive variable selection method based on Kruskal-Wallis test, which is a nonparametric version of ANOVA F-test. Through a Monte Carlo study we note that CART has serious bias in variable selection towards categorical variables having many values, and also QUEST using F-test is not so powerful to select informative variables under heavy tailed distributions.

  • PDF

A SIGN TEST FOR UNIT ROOTS IN A SEASONAL MTAR MODEL

  • Shin, Dong-Wan;Park, Sei-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제36권1호
    • /
    • pp.149-156
    • /
    • 2007
  • This study suggests a new method for testing seasonal unit roots in a momentum threshold autoregressive (MTAR) process. This sign test is robust against heteroscedastic or heavy tailed errors and is invariant to monotone data transformation. The proposed test is a seasonal extension of the sign test of Park and Shin (2006). In the case of partial seasonal unit root in an MTAR model, a Monte-Carlo study shows that the proposed test has better power than the seasonal sign test developed for AR model.

Unit Root Tests for Autoregressive Moving Average Processes Based on M-estimators

  • Shin, Dong-Wan;Lee, Oesook
    • Journal of the Korean Statistical Society
    • /
    • 제31권3호
    • /
    • pp.301-314
    • /
    • 2002
  • For autoregressive moving average (ARMA) models, robust unit root tests are developed using M-estimators. The tests are parametric in the sense ARMA parameters are estimated jointly with unit roots. A Monte-Carlo experiment reveals superiority of the parametric tests over the semipararmetric tests of Lucas (1995a) in terms of both empirical sizes and powers.

로버스트 선형혼합모형을 이용한 필드시험 데이터 분석 (Analysis of Field Test Data using Robust Linear Mixed-Effects Model)

  • 홍은희;이영조;옥유진;나명환;노맹석;하일도
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.361-369
    • /
    • 2015
  • 연속측도의 반응변수가 반복측정된 실험 자료의 분석을 위해 흔히 선형혼합모형이 사용된다. 그러나, 잔차의 분포가 이분산성이거나 비정규성을 가질 때 표준적인 선형혼합모형은 적절하지 않은 결과를 가져온다. 잔차의 분포가 두터운 꼬리를 가진 비정규분포를 보이는 타이어 필드시험 데이터를 로버스트 선형혼합모형에 적합시킴으로써 보다 더 정확하고 신뢰할 수 있는 분석결과를 얻을 수 있다. 추가적으로 신뢰성 분석 결과를 제시한다.

Robust Design for Multiple Quality Characteristics using Principal Component Analysis

  • Kwon, Yong-Man;Hong, Yeon-Woong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권3호
    • /
    • pp.545-551
    • /
    • 2003
  • Robust design is to identify appropriate settings of control factors that make the system's performance robust to changes in the noise factors that represent the source of variation. In this paper we propose how to simultaneously optimize multiple quality characteristics using the principal component analysis of multivariate statistical analysis. An example is illustrated to compare it with already proposed method.

  • PDF

Empirical Choice of the Shape Parameter for Robust Support Vector Machines

  • Pak, Ro-Jin
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.543-549
    • /
    • 2008
  • Inspired by using a robust loss function in the support vector machine regression to control training error and the idea of robust template matching with M-estimator, Chen (2004) applies M-estimator techniques to gaussian radial basis functions and form a new class of robust kernels for the support vector machines. We are specially interested in the shape of the Huber's M-estimator in this context and propose a way to find the shape parameter of the Huber's M-estimating function. For simplicity, only the two-class classification problem is considered.

Robust Bayes and Empirical Bayes Analysis in Finite Population Sampling with Auxiliary Information

  • Kim, Dal-Ho
    • Journal of the Korean Statistical Society
    • /
    • 제27권3호
    • /
    • pp.331-348
    • /
    • 1998
  • In this paper, we have proposed some robust Bayes estimators using ML-II priors as well as certain empirical Bayes estimators in estimating the finite population mean in the presence of auxiliary information. These estimators are compared with the classical ratio estimator and a subjective Bayes estimator utilizing the auxiliary information in terms of "posterior robustness" and "procedure robustness" Also, we have addressed the issue of choice of sampling design from a robust Bayesian viewpoint.

  • PDF

시뮬레이션을 통한 다양한 로버스트 회귀추정량의 비교 연구 (A comparison study of various robust regression estimators using simulation)

  • 장수희;윤정연;전희주
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.471-485
    • /
    • 2016
  • 회귀모형의 대표적인 추정법인 최소제곱법은 오차항의 분포가 정규분포를 따르고 이상치가 없는 상황에서는 최적이지만, 자료가 회귀모형의 가정을 만족하지 않을 경우 또는 이상치를 포함하는 경우와 같이 자료가 오염된 상황에서는 왜곡된 추정 결과를 준다. 따라서 이상치에 민감한 최소제곱법의 단점을 보완하기 위해 다양한 로버스트 추정방법이 제안되었다. 본 논문에서는 MLE를 기반으로 제안된 M 추정량, 순서형 통계량을 기반으로 제안된 L 추정량, 잔차의 순위를 기반으로 제안된 R 추정량 계열에서 높은 붕괴점 또는 높은 효율을 갖는 대표적인 추정량들을 다양한 모의실험을 통해 비교 연구하였다. 추정량의 성능을 비교하는데 효율성 뿐만 아니라 편의, 분산을 포함한 분포를 살펴보았다. 그 결과 실제 데이터 적용에는 MM 추정량과 GR 추정량이 좋은 성능을 가진 것으로 보였다.

Robust PCA를 활용한 이공계 대학생의 확률 및 통계 개념 이해도 분석 (Clustering Analysis of Science and Engineering College Students' understanding on Probability and Statistics)

  • 유용석
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.252-258
    • /
    • 2022
  • 본 연구에서는 실제 대학의 소규모 강좌에서 확률과 통계에 대한 수강생들의 이해도를 쉽고 빠르게 분석하기 위한 방법을 제안한다. 95명의 이공계 대학생을 대상으로 확률과 통계에 대한 컴퓨터 기반 검사를 시행하였다. 학생들의 응답을 Robust PCA와 가우시안 혼합 모델을 사용하여 7개의 군집으로 나눈 뒤, 각 군집 별로 주제별 성취도를 분석하였다. 상위권 군집은 통계적 추정을 제외한 다른 주제들에 대해서 대체로 높은 성취도를 보였으며, 저성취 군집들은 서로 다른 주제에 대해서 강약점을 보였다. 제안하는 기법은 기존에 널리 쓰이는 PCA를 사용하여 차원 축소 후 군집 분석을 수행한 것 보다 각 군집들의 특성이 더 분명하게 나타냈다. 이는 각 군집 별 특징에 따른 개별화된 학습 전략을 개발하는 데 활용될 수 있다.

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.