• 제목/요약/키워드: Robust Statistics

검색결과 397건 처리시간 0.019초

Robust Discriminant Analysis using Minimum Disparity Estimators

  • 조미정;홍종선;정동빈
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.135-140
    • /
    • 2004
  • Lindsay and Basu (1994)에 의해 소개된 최소차이추정량 (Minimum Disparity Estimators)들은 실제 자료 분석 도구로써 유용하다. 본 논문에서는 최소일반화음지수 차이추정량 (Minimum Generalized Negative Exponential Disparity Estimator, MGNEDE)이 최대가능도추정량 (Maximum Likelihood Estimator, MLE)와 최소가중 헬링거거리추정량 (Minimum Blended Weight Hellinger Distance Estimator, MBWHDE)에 비해 오염된 정규모형에서 효율적이고 로버스트하다는 것을 모의실험을 통하여 확인하였다. 또한 세 가지 추정량들에 의해 추정된 모수들을 이용하여 판별하였을 때 자 추정량득의 판별율을 비교함으로써 오염된 정규모형에서 MLE의 대안으로 MGNEDE와 MBWHDE를 사용할 수 있음을 보였다.

  • PDF

The Detection and Testing of Multiple Outliers in Linear Regression

  • Park, Jin-Pyo;Zamar, Ruben H.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권4호
    • /
    • pp.921-934
    • /
    • 2004
  • We consider the problem of identifying and testing outliers in linear regression. First, we consider the scale-ratio tests for testing the null hypothesis of no outliers. A test based on the ratio of two residual scale estimates is proposed. We show the asymptotic distribution of test statistics and investigate the properties of the test. Next we consider the problem of identifying the outliers. A forward procedure based on the suggested test is proposed and shown to perform fairly well. The forward procedure is unaffected by masking and swamping effects because the test statistics used a robust scale estimate.

  • PDF

A Distribution-Free Rank Test for Ordered Alternatives in a Randomized Block Design

  • Kim, Dong-Hee;Song, Moon-Sup;Kim, Woo-Chul
    • Journal of the Korean Statistical Society
    • /
    • 제15권1호
    • /
    • pp.9-25
    • /
    • 1986
  • In this paper we propose a distribution-free rank test for ordered alternatives in a randomized block design and investigate the properties of the proposed test. The proposed test is an extension of the Page test to allow replications in each cell. Some asymptotic properties including ARE's are investigated. A small sample Monte Carlo study was performed to compare the powers of the test considered in this paper for small samples. The results show that our proposed test is robust and efficient in the case of equally-spaced treatment effects.

  • PDF

The Bivariate Kumaraswamy Weibull regression model: a complete classical and Bayesian analysis

  • Fachini-Gomes, Juliana B.;Ortega, Edwin M.M.;Cordeiro, Gauss M.;Suzuki, Adriano K.
    • Communications for Statistical Applications and Methods
    • /
    • 제25권5호
    • /
    • pp.523-544
    • /
    • 2018
  • Bivariate distributions play a fundamental role in survival and reliability studies. We consider a regression model for bivariate survival times under right-censored based on the bivariate Kumaraswamy Weibull (Cordeiro et al., Journal of the Franklin Institute, 347, 1399-1429, 2010) distribution to model the dependence of bivariate survival data. We describe some structural properties of the marginal distributions. The method of maximum likelihood and a Bayesian procedure are adopted to estimate the model parameters. We use diagnostic measures based on the local influence and Bayesian case influence diagnostics to detect influential observations in the new model. We also show that the estimates in the bivariate Kumaraswamy Weibull regression model are robust to deal with the presence of outliers in the data. In addition, we use some measures of goodness-of-fit to evaluate the bivariate Kumaraswamy Weibull regression model. The methodology is illustrated by means of a real lifetime data set for kidney patients.

A Comparison of Methods for the Detection of Outliers in Multivariate Data

  • Hadi, Ali-S.;Joo, Hye-Seon;Son, Mun-S.
    • Communications for Statistical Applications and Methods
    • /
    • 제3권2호
    • /
    • pp.53-67
    • /
    • 1996
  • Numerous classical as well as robust methods have been proposed in the literature for the detection of multiple outlier in multivariate data. The effectiveness and power of each of these methods have not been thoroughly investigated. In this paper we first reduce the vast number of outlier detection methods to a small number of viable ones. This reduction is based on previous work of other researches and on some theoretical arguments. Then we design and implement a Monte Carlo experiment for comparing these methods. The main goal of our study is to determine which methods are most powerful in the detection of multiple outlier and in dealing with the masking and swamping problems. The results of the Monte Carlo study indicate that two of the methods seem to hace better performances than the others for the detection of multiple outlier in multivariate data.

  • PDF

Fused inverse regression with multi-dimensional responses

  • Cho, Youyoung;Han, Hyoseon;Yoo, Jae Keun
    • Communications for Statistical Applications and Methods
    • /
    • 제28권3호
    • /
    • pp.267-279
    • /
    • 2021
  • A regression with multi-dimensional responses is quite common nowadays in the so-called big data era. In such regression, to relieve the curse of dimension due to high-dimension of responses, the dimension reduction of predictors is essential in analysis. Sufficient dimension reduction provides effective tools for the reduction, but there are few sufficient dimension reduction methodologies for multivariate regression. To fill this gap, we newly propose two fused slice-based inverse regression methods. The proposed approaches are robust to the numbers of clusters or slices and improve the estimation results over existing methods by fusing many kernel matrices. Numerical studies are presented and are compared with existing methods. Real data analysis confirms practical usefulness of the proposed methods.

수정 결정계수를 사용한 로지스틱 회귀모형에서의 변수선택법 (Variable Selection for Logistic Regression Model Using Adjusted Coefficients of Determination)

  • 홍종선;함주형;김호일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.435-443
    • /
    • 2005
  • 로지스틱 회귀모형에서 결정계수는 선형 회귀모형보다 다양하게 정의되며 그 값들도 매우 작아 로지스틱 회귀모형 평가기준으로 사용되는 통계량이 라고 할 수 없다. Liao와 McGee(2003)는 부적절한 설명변수의 추가 또는 표본크기의 변화에 민감하지 않은 두 종류의 수정 결정계수를 제안하였다. 본 연구에서는 실제자료에 적용한 로지스틱 회귀모형에서 수정 결정계수를 포함한 네 종류의 결정계수들을 변수선택의 기준으로 사용하여 기존의 변수선택 방법인 전진선택, 후진제거, 단계적 선택방법, AIC 통계량 등을 사용한 방법들과 비교하여 그 적절함과 효율성을 토론한다.

R&D 분야의 목표 시그마 수준 설정과 설계 공차의 강건 한계 결정에 대한 연구 (A study on target Sigma Level at R&D stage and robust limits for design margins)

  • 고승곤
    • 응용통계연구
    • /
    • 제29권2호
    • /
    • pp.369-379
    • /
    • 2016
  • 시그마 수준(sigma level)이란 미국 모토롤라사에 의해 소개된 프로세스 능력 지수로서 1970년대 이후 널리 활용되고 있는 다양한 지수들 중의 하나이다. 이는 다른 지수들과 비교할 때 모 프로세스의 확률 분포에 기초한다는 장점을 갖지만 양산 단계를 가정한 것으로 R&D 분야의 시제품 그리고/또는 초도 양산품 단계에 직접 적용하는 것은 적절하지 못할 수 있다. 이에 본 논문은 시그마 수준을 계산할 때 가정하는 치우침에 대한 통계적 고찰을 통하여 양산단계에서 6 시그마 품질 수준을 달성하기 위한 개발 단계의 시제품 그리고/또는 초도 양산품의 목표 시그마 수준 설정 방법을 소개한다. 그리고 이를 기초로 개발과 양산 단계에서 경제성을 달성할 수 있는 설계 공차의 강건 한계 도출 방법을 제시해 보고자 한다.

일반화 파레토 분포에서 임계치 결정에 대한 대안적 연구 (An Alternative Study of the Determination of the Threshold for the Generalized Pareto Distribution)

  • 윤정연;조재범;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.931-939
    • /
    • 2011
  • 일반적으로 일반화 파레토 분포(Generalized Pareto Distribution; GPD)에서 임계치를 결정하는 방법으로는 MEF-그래프나 Hill-그래프를 통한 주관적인 판단을 이용한다는 약점이 존재한다. 본 연구에서는 이와 같은 기존 방법의 약점을 해결하기 위하여 GPD에서 임계치를 결정하는 방법으로 로버스트 추정량을 이용하는 새로운 접근 방법을 제안하였다. 더불어 1987년 1월 5일부터 2009년 8월 3일까지 공시된 KOSPI지수의 일별수익률의 손실부분에 해당하는 왼쪽꼬리부분을 이용하여 실증분석을 실시하였다. 실증분석은 기존의 그래프를 이용한 임계치 결정방법과 본 연구에서 제안한 방법에서 계산된 VaR이 어떤 차이가 존재하는가를 알아보는 방법으로 실시되었다. 분석결과 본 논문에서 제안한 임계치 결정방법에 의하여 계산된 VaR값들은 기존 방법의 VaR과 큰 차이를 보이지 않았다. 아울러 본 연구에서 제안한 임계치 결정방법의 안정성을 파악한 결과 기존 방법과 큰 차이를 보이지 않았다. 이와 같은 결과들을 토대로 본 연구에서 제안한 로버스트 추정량을 이용한 임계치 결정방법은 기존의 그래프를 이용한 주관적인 임계치 결정방법에 대한 대안적인 방법으로 충분히 고려될 수 있을 것으로 생각된다.

Michaelis-Menten 모형의 모수의 불확실성에 대한 Maximin 타입의 강건 실험 (The Maximin Robust Design for the Uncertainty of Parameters of Michaelis-Menten Model)

  • 김영일;장대흥;이성백
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1269-1278
    • /
    • 2014
  • D-최적 실험은 실험의 이론적인 기초를 제공하는 이유로 비선형모형에 대해 실험설계 시 인기가 있지만 이러한 실험기준은 비선형인 경우 알려져 있지 않은 모수에 의존하는 모순적인 특징이 있다. 그러나 일부 비선형모형은 최적 실험이 비선형 모형의 일부 모수에만 의존하는 특징이 있는 부분비선형모형임 밝혀졌다. 일반적으로 비선형 모형인 경우는 maximin방법은 일반적으로 모수의 불확실성에 강건한 실험을 제공하지 못한다고 알려져 있으나 많은 부분비선형 모형인 경우 하나의 모수에만 최적실험이 의존하는 구조를 갖고 있어 최적실험의 구조를 밝히는데 매우 용이하다. 본 연구에서는 Michaelis-Menten 모형을 대상으로 모수의 불확실성에 대처하기 위한 maximin 방법을 D-최적 및 $D_s$-최적을 기준으로 살펴보았다.