• 제목/요약/키워드: Bootstrap 방법

검색결과 171건 처리시간 0.019초

시계열분석을 위한 주파수 공간상에서의 재표집 기법 (Resampling Methods on Frequency Domains for Time Series)

  • 여인권;윤화형;조신섭
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.121-134
    • /
    • 2006
  • 이 논문에서는 이산코사인변환을 이용하여 시계열자료를 주파수 공간으로 변환시킨 후, 이산코사인변환 계수를 재표집하여 시계열자료에 대한 재표본을 추출하는 방법에 대해 알아본다. 기존 주파수 공간상에서의 붓스트랩 방법은 스펙트럼평균(spectral mean)에 대한 추론을 하기위해 사용되지만 제안하고자 하는 방법은 시간영역상에서의 시계열자료에 얻을 수 있다는 것이 가장 큰 차이점이다. 이 논문에서는 정상시계열의 경우, 이산코사인변환 계수의 통계적 성질을 유도하고 이 성질을 이용하여 붓스트랩하는 과정을 설명한다. 모의 실험을 통해 기존에 사용되고 있는 방법과 성능을 비교하였다.

동측치가 많은 FRAILTY 모형의 분석 (Analysis of the Frailty Model with Many Ties)

  • 김용대;박진경
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.67-81
    • /
    • 2005
  • 프레일티모형에 대한 기존의 추론방법은 동측치가 많은 경우에 그 성능이 떨어진다. 그 이유는 사용된 경험적 우도함수가 동측치가 많은 자료에는 적합하지 않기 때문이다. 본 논문에서는 동측치가 많은 프레일티 모형에서의 새로운 추론방법을 제안한다. 이항형태의 경험적우도함수를 바탕으로 베이지안 부스트랩을 사용하여 모수의 사후분포를 구한다. 제안된 방법의 장점은 기존에 제안된 주변최대우도추정량에 비하여 계산이 수월하고 안정적인 결과를 제공하는데 있다. 이를 실증적으로 비교하기 위하여 제안된 방법을 주변최대우도추정량과 가상실험을 통하여 비교한다.

철도산업의 수직분리와 운영효율성의 관련성에 관한 연구 (A Study on the Relationship between Vertical Separation and Operational Efficiency of Railway Industry)

  • 김성호;최태성
    • 한국철도학회논문집
    • /
    • 제12권6호
    • /
    • pp.844-851
    • /
    • 2009
  • 본 논문에서는 수직분리 및 수직통합의 경험이 함께 존재하는 유럽철도의 자료를 기존연구에서 사용된 바 없는 Simar and Wilson(2008)의 붓스트랩을 활용한 효율성에 관한 가설검정방법으로 분석하여 수직분리가 철도산업의 운영효율성과 어떤 관련성을 가지고 있는지를 밝혀보고자 하였다. 1998년부터 2005년까지의 20개 유럽국가의 자료를 분석한 결과 검정통계량의 관측값은 수직분리구조를 가진 국가의 철도산업이 수직통합구조를 가졌거나 또는 지주회사의 형태로 수직통합을 유지하고 있는 국가의 철도산업보다 상대적으로 운영효율성이 높게 타나났으나 그러한 차이가 통계적으로 뒷받침되지는 못하였다.

가설검정과 신뢰구간의 재현성 (Reproducibility of Hypothesis Testing and Confidence Interval)

  • 허명회
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.645-653
    • /
    • 2014
  • p-값은 관측 표본과 관측 결과보다 심하게 대안가설의 방향으로 영가설을 이탈하는 표본들이 영가설 하에서 갖는 확률이다. p-값이 일정 ${\alpha}$(= 0:05)보다 작게 나타나면 연구자는 대안가설이 지지된 것으로 본다. 그런 경우라고 하더라도 그의 가설이 향후 연구에서 번복될 수 있는데 그 이유는 p-값이 표본에 따라 변동하는 통계량이기 때문이다. Boos와 Stefanski (2011)는 붓스트랩 방법으로 p-값의 예측분포를 구할 수 있음을 보였다. 그들은 그 분포의 상위 10-20% 분위수가 ${\alpha}$보다 작은가를 확인할 필요가 있음을 강조한다. 만약 그렇지 않은 경우에는 "지지"된 가설의 재현성이 문제될 수 있기 때문이다. 가설검정에서 일정 수준의 재현율을 확보하기 위해서는 표본의 증대가 요구된다. 이 연구는 k배 확대 붓스트랩 표본추출(boosted bootstrap sampling)로써 필요한 표본크기를 계산할 수 있음을 두 표본의 비교와 다중선형회귀의 수치 예에서 보인다. k 값을 정하기 위해서는 몇 차례 시행착오를 해야 하지만 계산적 부담은 크지 않다. 95% 신뢰구간은 독립적인 표본들로부터 같은 방식으로 산출되는 구간이 미지의 모수를 포함할 확률이 95%가 되도록 설정된다. 이 연구는 한 관측표본으로부터 얻어진 95% 신뢰구간 내 개별 점이 미래 연구의 신뢰구간에도 포함될 것인지 그 재현성을 붓스트랩 재표본들에서 평가한다. 이 연구는 개별 점에서 산출한 신뢰구간 재현율을 그래프로 보인다.

붓스트랩 방법을 활용한 SVM 기반 유전자 선택 기법 (Gene Selection Based on Support Vector Machine using Bootstrap)

  • 송석헌;김경희;박창이;구자용
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.531-540
    • /
    • 2007
  • 본 연구에서는 유전자 선택 방법으로 최근 이용되는 SVM-RFE 알고리즘은 단순히 가중치의 절대값을 유전자 선택 기준으로 사용하여 유전자 값의 변동성을 고려하지 못하므로 가중치의 절대값을 그것의 표준오차로 나눈 보완된 통계량, B-RFE 알고리즘을 새로운 기준으로 제안하였다. 두 방법을 모의실험을 통해서 비교한 결과 본 연구에서 제안한 B-RFE 알고리즘이 더 의미 있는 순위를 도출하였다.

국내 주식형 펀드의 타이밍 능력은 존재하는가? (Is There Timing Ability in Korean Equity Funds?)

  • 김상배;박종구
    • 재무관리연구
    • /
    • 제26권2호
    • /
    • pp.93-112
    • /
    • 2009
  • 본 연구의 목적은 국내에서 운용되는 신탁형과 회사형을 포함한 주식형 펀드들의 시장 타이밍 능력과 변동성 타이밍 능력을 검증하는데 있다. 본 연구의 표본기간은 2001년 1월에서 2007년 12월까지의 기간으로, 표본 기간 동안 24개월 이상 존재한 545개의 펀드를 분석 대상으로 하였다. 분석결과, 전통적인 방법을 이용하였을 경우 소수의 펀드에서 시장 타이밍 능력과 변동성 타이밍 능력이 존재하는 것으로 나타났다. 하지만, 횡단면 부트스트랩(cross-sectional bootstrap) 방법으로 도출된 '운(luck)' 분포를 이용하였을 경우, 타이밍 능력이 존재하는 소수의 주식형 펀드들은 단지 '운(luck)'에 의한 것이지 '능력(skill)'에 의한 것이라고 판단하기 어렵다는 것을 발견하였다.

  • PDF

모의실험에 의한 온실가스 인벤토리 불확도 산정을 위한 지수분포 신뢰구간 추정방법 (Estimation of confidence interval in exponential distribution for the greenhouse gas inventory uncertainty by the simulation study)

  • 이영섭;김희경;손덕규;이종식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.825-833
    • /
    • 2013
  • 온실가스 인벤토리 불확도 산정을 위해서는 인벤토리의 신뢰구간 추정이 필수적이다. 일반적으로 모수에 대한 신뢰구간 추정시에는 모집단이 정규분포를 따른다고 가정한다. 그러나 자료의 구조가 복잡해짐에 따라 정규분포가 아닌 비대칭형 자료, 즉 양의 왜도를 갖는 자료의 경우 기존의 정규분포를 가정한 신뢰구간 추정 방식은 적합하지 않다. 본 연구에서는 비대칭형 분포인 지수분포의 신뢰구간추정 방법으로 모수적인 방법과 비모수적인 방법에 대해 각각 비교분석하였다. 모의실험을 통한 신뢰구간 추정 결과를 바탕으로 범위확률, 신뢰구간 길이, 상대적 편의를 비교한 결과 모수적 방법 중에서 예상했던 대로 정확한 방법인 카이제곱방법이 신뢰계수와 유사한 범위확률을 보이고 상대적 편의도 작아 모수적 방법 중에서 신뢰구간 추정에 가장 적합한 것으로 나타났다. 마찬가지로 비모수적 방법 중에서는 표준화된 t-붓스트랩 방법이 가장 적합한 것으로 나타났다.

Cox 회귀모형(回歸模型)에서 붓스트랩방법(方法)에 의한 생존함수추정량(生存函數推定量)의 비교연구(比較硏究) (Comparison of Survival Function Estimators for the Cox's Regression Model using Bootstrap Method)

  • 차영준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제4권
    • /
    • pp.1-11
    • /
    • 1993
  • The Cox's regression model is frequently used for covariate effects in survival data analysis, But, much of the statistical work has focused on asymptotic behavior so the small sample evaluation has been neglected. In this paper, we compare the small or moderate sample performances of the survival function estimators for the Cox's regression model using bootstrap method. The smoothed PL type estimator and the Link estimator are slightly better than corresponding the PL type estimator and the Nelson type estimator in the sense of the achieved error rates.

  • PDF

DEA효율성점수의 결정요인 분석방법 비교 (A Comparison of Alternative Approaches to Determinants of DEA Efficiency Scores)

  • 김성호
    • 한국경영과학회지
    • /
    • 제35권2호
    • /
    • pp.19-35
    • /
    • 2010
  • Many papers have used a two-stage approach of first calculating DEA efficiency scores and then seeking to correlate these scores with various environmental variables. Most of the studies have not checked whether such a two-stage approach is statistically valid for identifying significant environmental variables. Recently Simar and Wilson (2007) (SW) introduce a sensible data generating process and bootstrap procedure based on truncated regression for the two-stage approach. Banker and Natarajan (2008) (BN) provide a statistical foundation for the two-stage approach comprising a DEA followed by an ordinary least squares or maximum likelihood estimation. Researchers have to identify an approach suitable for their research circumstances in terms of properties, merits, demerits, and robustness to plausible departures from its chosen data generating process. We summarize the foundations and properties of the two-stage procedures suggested by SW and BN. And we discuss merits and demerits of those procedures. Also using Monte Carlo simulation we assess their relative performance under several misspecified settings.

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.263-266
    • /
    • 2002
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.