• 제목/요약/키워드: Nonparametric method

검색결과 342건 처리시간 0.024초

장기간 의존 시계열에서 붓스트랩을 이용한 장기적 분산 추정 (Bootstrap estimation of long-run variance under strong dependence)

  • 백창룡;권용
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.449-462
    • /
    • 2016
  • 본 논문은 시계열 분석의 추론에서 매우 중요한 역할을 하는 장기적 분산에 대해서 붓스트랩을 이용한 추정을 다룬다. 본 논문은 기존의 방법을 두가지 측면에서 확장한다. 첫째, 단기억 시계열에서의 장기적 분산 추정을 확장하여 자료의 의존성이 매우 강한 장기간 의존 시계열에서 붓스트랩을 이용한 장기적 분산의 추정에 대해서 논의한다. 또한 장기간 의존 시계열이 평균변화모형과 매우 쉽게 잘 혼동됨이 잘 알려져 있기에 이를 해결하기 위해서 쌍봉형 커널을 이용한 추세 추정 및 붓스트랩의 블럭을 결정하는 방법을 제안한다. 모의 실험결과 제안한 방법이 매우 유의하였으며 북반구 평균 온도 변화 자료 분석으로 실증 자료 예제도 아울러 제시하였다.

Bearing fault detection through multiscale wavelet scalogram-based SPC

  • Jung, Uk;Koh, Bong-Hwan
    • Smart Structures and Systems
    • /
    • 제14권3호
    • /
    • pp.377-395
    • /
    • 2014
  • Vibration-based fault detection and condition monitoring of rotating machinery, using statistical process control (SPC) combined with statistical pattern recognition methodology, has been widely investigated by many researchers. In particular, the discrete wavelet transform (DWT) is considered as a powerful tool for feature extraction in detecting fault on rotating machinery. Although DWT significantly reduces the dimensionality of the data, the number of retained wavelet features can still be significantly large. Then, the use of standard multivariate SPC techniques is not advised, because the sample covariance matrix is likely to be singular, so that the common multivariate statistics cannot be calculated. Even though many feature-based SPC methods have been introduced to tackle this deficiency, most methods require a parametric distributional assumption that restricts their feasibility to specific problems of process control, and thus limit their application. This study proposes a nonparametric multivariate control chart method, based on multiscale wavelet scalogram (MWS) features, that overcomes the limitation posed by the parametric assumption in existing SPC methods. The presented approach takes advantage of multi-resolution analysis using DWT, and obtains MWS features with significantly low dimensionality. We calculate Hotelling's $T^2$-type monitoring statistic using MWS, which has enough damage-discrimination ability. A bootstrap approach is used to determine the upper control limit of the monitoring statistic, without any distributional assumption. Numerical simulations demonstrate the performance of the proposed control charting method, under various damage-level scenarios for a bearing system.

자격증이 임금, 노동이동에 미치는 효과: 기능사 2급 자격증을 중심으로 (Analysis of Certification Effects on Wage and Labor Mobility : Evidence from Craft II Class Certification)

  • 이상준
    • 노동경제논집
    • /
    • 제29권2호
    • /
    • pp.145-169
    • /
    • 2006
  • 이 연구는 국가기술자격증 중 기능사 2급 자격 등급을 이용하여 자격증의 임금, 노동이동 효과에 대한 실증분석을 하고 있다. 이를 위해 모수적 방법과 비모수적 방법을 사용한다. 모수적 방법에서는 자격증의 선택 문제를 해결하고자 직종별 사업장 규모별 자격증 비율을 IV로 사용하였으며 비모수적 방법에는 페어메칭을 이용하였다. 간략한 연구 결과를 살펴보면 자격증이 임금에 미치는 효과는 작게는 5.5%에서 많게는 9.9% 가량 존재하고 있다. 자격증과 노동이동 간의 관계에서는 실제 노동이동을 통한 자격증의 임금효과보다는 한 직장에 근속함으로써 얻는 임금효과가 크게 나타나고 있음을 알 수 있다. 또한 자격증이 없는 근로자들일수록 상대적으로 동일 사업장에 정착하기가 어렵다는 것을 알 수 있었다.

  • PDF

Wage Determinants Analysis by Quantile Regression Tree

  • Chang, Young-Jae
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.293-301
    • /
    • 2012
  • Quantile regression proposed by Koenker and Bassett (1978) is a statistical technique that estimates conditional quantiles. The advantage of using quantile regression is the robustness in response to large outliers compared to ordinary least squares(OLS) regression. A regression tree approach has been applied to OLS problems to fit flexible models. Loh (2002) proposed the GUIDE algorithm that has a negligible selection bias and relatively low computational cost. Quantile regression can be regarded as an analogue of OLS, therefore it can also be applied to GUIDE regression tree method. Chaudhuri and Loh (2002) proposed a nonparametric quantile regression method that blends key features of piecewise polynomial quantile regression and tree-structured regression based on adaptive recursive partitioning. Lee and Lee (2006) investigated wage determinants in the Korean labor market using the Korean Labor and Income Panel Study(KLIPS). Following Lee and Lee, we fit three kinds of quantile regression tree models to KLIPS data with respect to the quantiles, 0.05, 0.2, 0.5, 0.8, and 0.95. Among the three models, multiple linear piecewise quantile regression model forms the shortest tree structure, while the piecewise constant quantile regression model has a deeper tree structure with more terminal nodes in general. Age, gender, marriage status, and education seem to be the determinants of the wage level throughout the quantiles; in addition, education experience appears as the important determinant of the wage level in the highly paid group.

Investigation of gene-gene interactions of clock genes for chronotype in a healthy Korean population

  • Park, Mira;Kim, Soon Ae;Shin, Jieun;Joo, Eun-Jeong
    • Genomics & Informatics
    • /
    • 제18권4호
    • /
    • pp.38.1-38.9
    • /
    • 2020
  • Chronotype is an important moderator of psychiatric illnesses, which seems to be controlled in some part by genetic factors. Clock genes are the most relevant genes for chronotype. In addition to the roles of individual genes, gene-gene interactions of clock genes substantially contribute to chronotype. We investigated genetic associations and gene-gene interactions of the clock genes BHLHB2, CLOCK, CSNK1E, NR1D1, PER1, PER2, PER3, and TIMELESS for chronotype in 1,293 healthy Korean individuals. Regression analysis was conducted to find associations between single nucleotide polymorphism (SNP) and chronotype. For gene-gene interaction analyses, the quantitative multifactor dimensionality reduction (QMDR) method, a nonparametric model-free method for quantitative phenotypes, were performed. No individual SNP or haplotype showed a significant association with chronotype by both regression analysis and single-locus model of QMDR. QMDR analysis identified NR1D1 rs2314339 and TIMELESS rs4630333 as the best SNP pairs among two-locus interaction models associated with chronotype (cross-validation consistency [CVC] = 8/10, p = 0.041). For the three-locus interaction model, the SNP combination of NR1D1 rs2314339, TIMELESS rs4630333, and PER3 rs228669 showed the best results (CVC = 4/10, p < 0.001). However, because the mean differences between genotype combinations were minor, the clinical roles of clock gene interactions are unlikely to be critical.

A pooled Bayes test of independence using restricted pooling model for contingency tables from small areas

  • Jo, Aejeong;Kim, Dal Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제29권5호
    • /
    • pp.547-559
    • /
    • 2022
  • For a chi-squared test, which is a statistical method used to test the independence of a contingency table of two factors, the expected frequency of each cell must be greater than 5. The percentage of cells with an expected frequency below 5 must be less than 20% of all cells. However, there are many cases in which the regional expected frequency is below 5 in general small area studies. Even in large-scale surveys, it is difficult to forecast the expected frequency to be greater than 5 when there is small area estimation with subgroup analysis. Another statistical method to test independence is to use the Bayes factor, but since there is a high ratio of data dependency due to the nature of the Bayesian approach, the low expected frequency tends to decrease the precision of the test results. To overcome these limitations, we will borrow information from areas with similar characteristics and pool the data statistically to propose a pooled Bayes test of independence in target areas. Jo et al. (2021) suggested hierarchical Bayesian pooling models for small area estimation of categorical data, and we will introduce the pooled Bayes factors calculated by expanding their restricted pooling model. We applied the pooled Bayes factors using bone mineral density and body mass index data from the Third National Health and Nutrition Examination Survey conducted in the United States and compared them with chi-squared tests often used in tests of independence.

cDNA 마이크로어레이에서 유전자간 상관 관계에 대한 보고 (A Report on the Inter-Gene Correlations in cDNA Microarray Data Sets)

  • 김병수;장지선;김상철;임요한
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.617-626
    • /
    • 2009
  • 최근에 보고되는 일련의 연구는 Affymetrix 마이크로어레이 자료에서 유전자간 상관관계가 강하고 장범위(長範圍)(long-ranged)로 나타나고 있으며, 기존의 "편한" 가정, 즉 유전자간 상관관계가 매우 약하며, 따라서 유전자간 유사 독립성을 가정할 수 있다는 주장이 비현실적이라는 것을 보고하고 있다. Qui 등 (2005b)은 각 유전자의 검정통계량을 병합하여 통계적 추론을 하는 이른바 비모수적 경험적 베이즈 방법을 적용하면 검색된 특이발현 유전자수의 분산이 커진다는 것을 보고하고 있고, 이러한 분산의 불안전성 이유로서 유전자간 강한 상관관계를 지적하고 있다. 또한 Klebanov와 Yakovlev (2007)는 유전자간 상관관계가 통계적 분석을 어렵게 하는 요인이라기 보다는 유용한 정보의 원천이고 적정한 변환을 통하여 근사 독립을 유지할 수 있는 급수를 만들 수 있으며 이 급수를 ${\delta}$-급수라고 불렀다. 본 보고에서는 국내에서 생산된 2조의 cDNA 마이크로어레이 자료에서 유전자간 상관관계가 비교적 강하며, 장범위(長範圍)로 나타나는 것을 확인하며, 유사 독립성을 전제할 수 있는 ${\delta}$-급수가 cDNA 마이크로어레이에서도 발견되는 것을 보고하고자 한다, 동 보고는 추후 cDNA 마이크로어레이 자료의 분석에서도 유전자간 상관관계를 고려하여야 함을 강조하고 있다.

남강 수질측정망 자료를 이용한 비모수적 장기 수질 추세 분석 (A Nonparametric Long-Term Trend Analysis Using Water Quality Monitoring Data in Nam-River)

  • 정강영;김묘정;송광덕;서권옥;홍성조;조소현;이영재;김경현
    • 한국환경과학회지
    • /
    • 제27권11호
    • /
    • pp.1029-1048
    • /
    • 2018
  • In this study, seasonal Mann - Kendall test method was applied to 12 stations of the water quality measurement network of Nam-River based on data of BOD, COD, TN and TP for 11 years from January 2005 to December 2015 The changes of water quality at each station were examined through linear trends and the tendency of water quality change during the study period was analyzed by applying the locally weighted scatter plot smoother (LOWESS) method. In addition, spatial trends of the whole Nam-River were examined by items. The flow-adjusted seasonal Kendall test was performed to remove the flow at the water quality measurement station. As a result, BOD, COD concentration showed "no trand" and TN and TP concentration showed "down trand" in regional Kendall test throughout the study period. BOD and TP concentration in "no trand", COD, and TN concentration showed an "up trand" tendency in Nam-River dam. LOWESS analysis showed no significant water quality change in most of the analysis items and stations, but water quality fluctuation characteristics were shown at some stations such as NR1 (Kyungho-River 1), NR2 (Kyungho-River 2), NR3 (Nam-River), NR6 (Nam-River 2A). In addition, the flow-adjusted seasonal Kendall results showed that the BOD concentration was "up trand" due to the flow at the NR3 (Nam-River) station. The COD concentration was "up trand" due to the flow at NR1 (Kyungho-River 1) and NR2 (Kyungho-River 2) located upstream of the Nam-River. The effect of influent flow on water quality varies according to each site and analysis item. Therefore, for the effective water quality management in the Nam-River, it is necessary to take measures to improve the water quality at the point where the water quality is continuously "up trand" during the study period.

임의중단자료에서의 조건부 평균잔여수명함수 추정 (Estimation of conditional mean residual life function with random censored data)

  • 이원기;송명언;정성화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권1호
    • /
    • pp.89-97
    • /
    • 2011
  • 본 연구에서는 Buckley와 James의 방법을 이용하여 중도절단된 자료를 보완한 조건부생존함수 추정량으로부터 조건부평균잔여수명함수를 추정하는 방법을 제안하고, 모의실험을 통하여 제안된 방법의 효율성을 평가하였다. 모의실험 결과 비례위험모형이 아닌 경우 제안된 방법으로 추정한 조건부 평균잔여수명함수의 평균제곱오차가 Cox모형이나 Beran의 비모수적 방법을 이용하여 구한 추정치의 평균제곱오차보다 작게 나타났으며, 비례위험모형인 경우에는 제안된 방법으로 추정한 결과들이 Cox 모형을 이용하여 얻은 결과들과 비슷하게 나타났다. 또한 K대학교병원 외과에서 위암 수술을 받은 1,192명의 환자 자료를 이용하여 제안된 방법의 임상적 적용의 적절성을 평가하였다.

Waerden 통계량을 이용한 강인한 에지검출 방법 (A Robust Edge Detection method using Van der Waerden Statistic)

  • 최명희;이호근;김주원;하영호
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.147-153
    • /
    • 2004
  • 본 논문에서는 원영상과 잡음영상에서 Waerden 통계량을 이용하여 효율적인 에지 검출을 제안한다. 에지는 영상의 밝기값이 낮은 값에서 높은 값으로 또는 높은 값에서 낮은 값으로 급격히 변하는 경계에 존재한다. 통계적 에지 검출 방법으로 통계가설 검정인 비모수 Wilcoxon 검정과 모수 T검정을 설명한다. 특정한 유의수준 α 에 의해 결정되어 지는 임계값을 사용하며, 반면 Bovik, Huang 과 Munson 은 임계값에 대한 검정 통계량의 가능한 범위를 생각한다. 에지 검출의 실험 결과로부터 T와 Wilcoxon 방법은 잡음 영상에 민감하게 반응하는데 반하여 제안한 Waerden 방법은 유의수준 α=0.0005 에서 잡음영상과 잡음이 없는 영상 모두에서 로버스트 하다. 통계적인 검정 방법들과 Sobel, LoG, Canny연산자를 이용한 에지검출 방법을 비교해보면, Waerden 방법이 잡음 영상과 잡음 없는 영상 모두에 훨씬 더 효율적으로 에지를 검출한다.