• Title/Summary/Keyword: 다변량통계

Search Result 542, Processing Time 0.022 seconds

Notes on identifying source of out-of-control signals in phase II multivariate process monitoring (다변량 공정 모니터링에서 이상신호 발생시 원인 식별에 관한 연구)

  • Lee, Sungim
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.1
    • /
    • pp.1-11
    • /
    • 2018
  • Multivariate process control has become important in various applied fields. For instance, there are many situations in which the simultaneous monitoring of multivariate quality characteristics is necessary for the manufacturing industry. Despite its importance, its practical usage is not as convenient because it is difficult to identify the source of the out-of-control signal in a multivariate control chart. In this paper, we will introduce how to detect the source of the out-of-control by using confidence intervals for new observations, and will discuss the identification and interpretation of the out-of-control variable through simulation studies.

An approximate fitting for mixture of multivariate skew normal distribution via EM algorithm (EM 알고리즘에 의한 다변량 치우친 정규분포 혼합모형의 근사적 적합)

  • Kim, Seung-Gu
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.3
    • /
    • pp.513-523
    • /
    • 2016
  • Fitting a mixture of multivariate skew normal distribution (MSNMix) with multiple skewness parameter vectors via EM algorithm often requires a highly expensive computational cost to calculate the moments and probabilities of multivariate truncated normal distribution in E-step. Subsequently, it is common to fit an asymmetric data set with MSNMix with a simple skewness parameter vector since it allows us to compute them in E-step in an univariate manner that guarantees a cheap computational cost. However, the adaptation of a simple skewness parameter is unrealistic in many situations. This paper proposes an approximate estimation for the MSNMix with multiple skewness parameter vectors that also allows us to treat them in an univariate manner. We additionally provide some experiments to show its effectiveness.

Monte-Carlo Simulation for Parameter Estimation of Bivariate Probability Distribution for Hydrological Data (수문자료의 이변량 확률분포형 매개변수 추정 개선을 위한 Monte-Carlo 모의실험)

  • Joo, Kyungwon;Kim, Sunghun;Jung, Younghun;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.335-335
    • /
    • 2019
  • 최근 수문자료에 대한 다변량 빈도해석 연구가 활발히 이루어지고 있다. 하나의 자료를 확률변수로 사용하는 단변량 빈도해석에 비해 여러 수문자료를 조합하여 동시에 추정할 수 있는 다변량 빈도해석은 수문자료의 상관성을 고려하면서 확률분포형을 추정할 수 있다는 장점이 있다. 이에 다변량 확률분포형을 이용한 빈도해석 과정 중 정확한 매개변수 추정을 위한 연구도 최근 여러방면으로 이루어지고 있다. 본 연구에서는 다변량 확률분포형의 매개변수 추정방법 중 기존에 주로 사용되고 있는 의사최우도법(MPL, Maximum Pseudo-Likelihood method)의 성능을 개선하기 위해 기존의 방법과 본 연구에서 제안하는 매개변수 추정방법의 Monte-Carlo 모의실험을 수행하였다. 일반적으로 수문자료는 양(+)의 왜곡도계수를 갖기 때문에 GEV(Geveralized Extreme Value) 분포형을 모분포로 하여 각 방법의 정확성을 검토하였다. 모의실험을 수행한 결과, 기존의사최우도법에서 Weibull 식을 이용하여 순위통계량을 계산하는 방법보다 본 연구에서 제안한 왜곡도를 고려하는 순위통계량을 사용하는 것이 더 정확한 매개변수 추정결과를 보여주는 것으로 나타났다.

  • PDF

Detecting Influential Observations in Multivariate Statistical Analysis of Incomplete Data by PCA (주성분분석에 의한 결손 자료의 영향값 검출에 대한 연구)

  • 김현정;문승호;신재경
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.383-392
    • /
    • 2000
  • Since late 1970, methods of influence or sensitivity analysis for detecting influential observations have been studied not only in regression and related methods but also in various multivariate methods. If results of multivariate analyses sometimes depend heavily on a small number of observations, we should be very careful to draw a conclusion. Similar phenomena may also occur in the case of incomplete data. In this research we try to study such influential observations in multivariate statistical analysis of incomplete data. Case of principal component analysis is studied with a numerical example.

  • PDF

Multivariate conditional tail expectations (다변량 조건부 꼬리 기대값)

  • Hong, C.S.;Kim, T.W.
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.7
    • /
    • pp.1201-1212
    • /
    • 2016
  • Value at Risk (VaR) for market risk management is a favorite method used by financial companies; however, there are some problems that cannot be explained for the amount of loss when a specific investment fails. Conditional Tail Expectation (CTE) is an alternative risk measure defined as the conditional expectation exceeded VaR. Multivariate loss rates are transformed into a univariate distribution in real financial markets in order to obtain CTE for some portfolio as well as to estimate CTE. We propose multivariate CTEs using multivariate quantile vectors. A relationship among multivariate CTEs is also derived by extending univariate CTEs. Multivariate CTEs are obtained from bivariate and trivariate normal distributions; in addition, relationships among multivariate CTEs are also explored. We then discuss the extensibility to high dimension as well as illustrate some examples. Multivariate CTEs (using variance-covariance matrix and multivariate quantile vector) are found to have smaller values than CTEs transformed to univariate. Therefore, it can be concluded that the proposed multivariate CTEs provides smaller estimates that represent less risk than others and that a drastic investment using this CTE is also possible when a diversified investment strategy includes many companies in a portfolio.

A Comparative Study of Covariance Matrix Estimators in High-Dimensional Data (고차원 데이터에서 공분산행렬의 추정에 대한 비교연구)

  • Lee, DongHyuk;Lee, Jae Won
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.5
    • /
    • pp.747-758
    • /
    • 2013
  • The covariance matrix is important in multivariate statistical analysis and a sample covariance matrix is used as an estimator of the covariance matrix. High dimensional data has a larger dimension than the sample size; therefore, the sample covariance matrix may not be suitable since it is known to perform poorly and event not invertible. A number of covariance matrix estimators have been recently proposed with three different approaches of shrinkage, thresholding, and modified Cholesky decomposition. We compare the performance of these newly proposed estimators in various situations.

A Study of Influence Factors for Reservoir Evaporation Using Multivariate Statistical Analysis (다변량 통계분석을 이용한 저수지증발량 영향인자에 관한 연구)

  • Lee, Kyungsu;Kwak, Sunghyun;Seo, Yong Jae;Lyu, Siwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.237-240
    • /
    • 2017
  • 지구온난화로 인해 세계 곳곳에서 기온상승이 관측되고 있으며, 이는 전지구적 기후시스템의 변화를 보여주는 대표적인 예이다. 온도를 비롯한 강수량, 풍속, 증발량 등의 기상학적, 수문학적 인자들이 각각 서로에게 영향을 주고 받으며 복잡하게 변화할 것이고, 그 변화폭도 점점 커질 것이다. 증발에 영향을 미치는 인자들은 크게 세 가지로 나뉘는데, 태양복사에너지, 온도, 바람, 기압, 습도와 같은 기상학적인자, 증발표면의 특성인자 그리고 수질인자로 분류할 수 있다. 증발에 영향을 주는 인자들은 예전부터 알려져 있지만 이들 간의 복잡한 상호작용에 대해 정확히 이해하기는 쉽지 않다. 본 연구에서는 댐유역의 증발량에 영향을 미치는 기상인자 파악을 위해 2008부터 2016년까지 관측된 낙동강수계 내 안동댐과 남강댐의 기상자료(기온, 강수량, 풍속, 상대습도, 기압, 일사량, 일조시간, 전운량)를 이용한 변화를 분석하였으며, 다변량 통계기법인요인분석을 통해 증발량과 상관성이 높은 인자들을 분류하였다. 안동댐과 남강댐 공통적으로 증발량과 기온, 기압이 같은 요인으로 분류되고 높은 상관성을 보였으며, 강수량, 일조시간, 일사량, 전운량이 같은 요인으로 분류되었다. 국내의 증발량 측정지점에 대한 추가적인 분석과 영향인자를 이용한 다변량회귀식과 인공신경망 통해 증발량 미측정 지점의 증발량 산정이 가능할 것으로 판단된다.

  • PDF

Analysis of freshness of rice depending on packing materials using MANOVA (다변량 분산분석을 이용한 포장 재질에 따른 쌀의 신선도 분석)

  • Kim, Seong-Ju
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.7
    • /
    • pp.1421-1428
    • /
    • 2016
  • This paper concerns the freshness of rice depending on packing materials using MANOVA. Freshness of rice is measured in terms of moisture content and rice flavor. Ordinary paper and charcoal-coated paper are compared as packing materials. Storing places are considered as a block. The bivariate observations of moisture content and the rice flavor are compared using MANOVA for a completely randomized block design. It is observed that there is a significant difference between ordinary paper and charcoal-coated paper. Therefore we apply ANOVA for moisture content and rice flavor, respectively. Significant differences are observed for the moisture content but not for the rice flavor.

군집방법의 역사와 응용사례에 관한 고찰

  • 이승우
    • Journal for History of Mathematics
    • /
    • v.10 no.2
    • /
    • pp.48-52
    • /
    • 1997
  • 통계학이란 미래에 대한 예측을 하고 이에 대비하여 합리적인 의사결정을 내리는데 도움을 받을 수 있는 학문이다. 최근 다변량 통계분석은 관찰이나 실험의 대상이 되는 하나 이상의 변수들을 동시에 분석할 수 있는 매우 실제성이 높은 분석방법으로 통계학, 경영학, 사회학, 심리학, 생물학 등 여러 전공 분야에서 복잡하고 다양한 자료 분석에 폭넓게 활용되고 있다. 이 논문에서는 다변량 분석 방법 중 컴퓨터와 통계 분석 소프트웨어의 발전으로 인하여 최근에 활발히 연구되고 있는 군집방법의 역사와 여러 연구분야의 실제자료분석에 응용할 수 있도록 군집분석을 6가지로 나누어서 분류하였고 그 방법론을 제시하였다.

  • PDF

Statistical Outliers in Florida Counties at the Presidential Election 2000 (2000년 미국대선 플로리다주의 투표결과 분석)

  • 김현철
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.21-32
    • /
    • 2002
  • We searched out in the votes data of the State of Florida at presidential election 2000. We used a multivariate regression analysis. We got there were several outliers including Palm Beach County. It means that we should analyze the number of disqualified ballots which were double-punched as well as the votes, to insist the " Butterfly Ballot" made Palm Beach outlier.