• 제목/요약/키워드: BOOTSTRAP

검색결과 686건 처리시간 0.025초

Bootstrap 기법을 이용한 서울지점 강우자료의 정량적 동질성 분석 (A Quantative Homogeneity Analysis of Seoul Rainfall using Bootstrap)

  • 황석환;김중훈;유철상;정성원;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1157-1161
    • /
    • 2009
  • 본 연구에서는 부트스트랩(Bootstrap) 기법을 이용하여 측우기 강우량 관측계열(CWK)과 근대우량계 강우량 관측계열(MRG)에 대해 동질성 분석을 실시하였다. 서로다른 두 자료계열에 대한 전통적인 통계적 동질성 검정 방법은 모집단의 분포형을 알고 있어야 검정결과가 유효하였기 때문에 모집단의 분포가 복잡한 기상자료들은 이러한 전통적 방법을 사용하여 동질성을 파악하는 것이 매우 어려웠고 결과로 제시된 통계적 유의성에 대해서도 의심의 여지가 있었다. 이러한 이유로 본 논문에서는 모집단을 가정하지 않아도 되는 비모수적 모의 방법인 부트스트랩 기법을 이용하여 두 자료계열간의 동질성 검정을 실시하였다. 분석 결과 M20의 CWK와 MRG는 미소한 기후의 경년변화 (Trend)의 영향을 제외하면 동질성을 가진 자료로 볼 수 있었으나, 갈수기의 경우는 월강우량의 크기에 변화가 있으며 호우기의 경우는 일강우량의 크기 및 호우의 형태에 변화가 있는 것으로 나타났다.

  • PDF

Developing a Molecular Prognostic Predictor of a Cancer based on a Small Sample

  • Kim Inyoung;Lee Sunho;Rha Sun Young;Kim Byungsoo
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.195-198
    • /
    • 2004
  • One Important problem in a cancer microarray study is to identify a set of genes from which a molecular prognostic indicator can be developed. In parallel with this problem is to validate the chosen set of genes. We develop in this note a K-fold cross validation procedure by combining a 'pre-validation' technique and a bootstrap resampling procedure in the Cox regression . The pre-validation technique predicts the microarray predictor of a case without having seen the true class level of the case. It was suggested by Tibshirani and Efron (2002) to avoid the possible over-fitting in the regression in which a microarray based predictor is employed. The bootstrap resampling procedure for the Cox regression was proposed by Sauerbrei and Schumacher (1992) as a means of overcoming the instability of a stepwise selection procedure. We apply this K-fold cross validation to the microarray data of 92 gastric cancers of which the experiment was conducted at Cancer Metastasis Research Center, Yonsei University. We also share some of our experience on the 'false positive' result due to the information leak.

  • PDF

복합 분위수 회귀에 대한 붓스트랩 방법의 응용 (Bootstrapping Composite Quantile Regression)

  • 서강민;방성완;전명식
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.341-350
    • /
    • 2012
  • 선형 회귀모형에서 오차항들이 서로 독립이고 동일한 분포를 따른다고 가정할 경우, (회귀계수의 강건한 추정을 위하여) 모든 분위수 함수의 회귀계수가 동일한 값을 갖는다는 사실에 근거한 복합 분위수 회귀(composite quantile regression) 방법을 고려할 수 있다. 본 논문에서는 복합 분위수 회귀에서 사용되는 분위수의 개수를 선택하기 위해 붓스트랩 방법의 가능성을 검토하였다. 또한, 분위수 회귀와 복합 분위수 회귀의 성능을 비교하기 위해 붓스트랩 방법을 이용하여 신뢰구간을 구축하고, 이들의 포함확률과 평균길이를 비교하였다. 이러한 모의실험을 통하여 복합 분위수 회귀의 우월성과 통계적 추론에 있어서 붓스트랩 방법의 유용성을 확인하였다.

철도산업의 수직분리와 운영효율성의 관련성에 관한 연구 (A Study on the Relationship between Vertical Separation and Operational Efficiency of Railway Industry)

  • 김성호;최태성
    • 한국철도학회논문집
    • /
    • 제12권6호
    • /
    • pp.844-851
    • /
    • 2009
  • 본 논문에서는 수직분리 및 수직통합의 경험이 함께 존재하는 유럽철도의 자료를 기존연구에서 사용된 바 없는 Simar and Wilson(2008)의 붓스트랩을 활용한 효율성에 관한 가설검정방법으로 분석하여 수직분리가 철도산업의 운영효율성과 어떤 관련성을 가지고 있는지를 밝혀보고자 하였다. 1998년부터 2005년까지의 20개 유럽국가의 자료를 분석한 결과 검정통계량의 관측값은 수직분리구조를 가진 국가의 철도산업이 수직통합구조를 가졌거나 또는 지주회사의 형태로 수직통합을 유지하고 있는 국가의 철도산업보다 상대적으로 운영효율성이 높게 타나났으나 그러한 차이가 통계적으로 뒷받침되지는 못하였다.

꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간 (Confidence Intervals for High Quantiles of Heavy-Tailed Distributions)

  • 김지현
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.461-473
    • /
    • 2014
  • 꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간을 연구하였다. 통계량의 극한 분포에 근거한 점근적 방법과 붓스트랩 방법을 같이 고려하였다. 이 두 방법에 모수적, 비모수적, 준모수적 기법을 각각 적용할 수 있는데, 전체 11가지 신뢰구간의 성능을 실제신뢰수준과 길이로 비교하였다. 모의실험 결과 준모수적이면서 점근적인 신뢰구간과 축량을 이용하는 준모수적 붓스트랩 신뢰구간이 실제신뢰수준의 기준에서 안정된 성능을 보인다는 것을 알 수 있었다.

지렛대 붓스트랩을 이용한 이변량 구간 중도 절단 자료의 일치성 검정 (A concordance test for bivariate interval censored data using a leverage bootstrap)

  • 김양진
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.753-761
    • /
    • 2019
  • 본 논문에서는 이변량 구간 중도 절단 자료의 연관성 검정을 연구하고자 한다. Kendall's τ 통계량은 분포의 가정을 필요로 하지 않는 비모수방법으로 연관성 검정을 위해 빈번히 적용되고 있다. 본 논문에서도 이러한 τ 통계량을 이용한 검정을 하기 위해 붓스트랩 방법을 적용시킨다. 일반적인 비모수 붓스트랩 방법의 구간 중도 절단에 적용은 편의된 결과를 보여주었다. 이는 구간 중도 절단자료의 불완전성(incompleteness)과 관련된 것으로 이를 극복하기 위해 지렛대 붓스트랩 방법을 적용하였다. 추정된 분포에 근거하여 구간 중도 절단 대신 모의 완전한 표본(pseudo complete data)을 추룰하는 것이다. 본 논문에서는 재표본의 크기 m을 결정하기 위해 기존 연구자의 공식을 이용하였다. 시행된 모의 실험의 결과는 바람직한 제 1종 오류값과 좋은 검정력을 보였주었으며 실제 적용 예로 AIDS 자료에서 HIV 감염시점과 바이러스 잠복 시간과의 연관성 여부를 검정해보았다.

표지방류 조사를 통한 거제 외포 주변해역 대구(Gadus macrocephalus) 자원량과 어획사망률 추정 (Estimating the Abundance and Fishing Mortality of Pacific Cod Gadus macrocephalus during the Spawning Season in Jinhae Bay, Korea, Using a Mark-Recapture Method)

  • 황강석;최일수;정석근
    • 한국수산과학회지
    • /
    • 제45권5호
    • /
    • pp.499-506
    • /
    • 2012
  • We estimated the population size and fishing mortality of Pacific cod Gadus macrocephalus during the spawning season in waters off Woipo, Geoje Island, Korea, using a mark-recapture method. We marked and released 51 cod>50 cm in total length; six were recaptured by local fishermen during the period from December 15 to 31, 2009. The estimated population size was ca. 180,000 and the fishing mortality of the exploitable cod was 26%. Although we could assume a closed population due to the short survey period, we evaluated the uncertainty in the estimates by applying bootstrap resampling because the sample size was small. The estimated 95% confidence interval was 94,000-568,000 for the population size and 8-49% for fishing mortality. Our study demonstrated that the application of mark-recapture methods and bootstrap resampling can be useful in stock assessment for fisheries management in Korea, but requires a larger sample size, spatially extensive coverage, and sophisticated mark-recapture models based on a refined sampling design for reliable stock assessment and biological reference points in sustainable cod management.

댐 수위 추정 방법의 개선을 통한 수리${\cdot}$수문학적 위험도 분석 (Hydraulic${\cdot}$Hydrologic Dam Risk Analysis through Improving Estimation Methods of Dam Water Surface Level)

  • 권현한;문영일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.863-869
    • /
    • 2004
  • 댐의 수리${\cdot}$수문학적 월류 확률 추정시에 가장 민감한 불확실성 변량은 댐의 초기수위라 할 수 있으며, 특히 자료의 특성을 충분히 반영하고 댐마루(dam crest)의 높이를 초과하지 않으면서 경계를 갖는 분포형을 추정하는 것은 무엇보다 중요하다. 그러나 기존의 매개변수적 확률분포 추정방법으로 이러한 문제점을 적절히 반영할 수 없으며 통계특성을 반영하지 못하고 이상화시키는 단점이 있다. 이러한 문제점을 보완하기 위해서 비매개변수적 핵밀도함수 방법과 Bootstrap 기법을 적용하여 수위의 신뢰구간을 추정하였다. 연 최대치 자료를 이용한 비매개변수적 핵밀도함수 기법을 이용한 해석결과에서는 댐의 설계빈도를 상회하는 비교적 큰 위험도 나타냈으며 홍수기의 평상수위고 가정하는 Bootstrap Resampling을 적용한 위험도는 5.11E-06의 간을 나타났다. 가장 극심한 기상상태를 가정한 해석 결과인 1.1972E-03은 본 댐은 여수로의 설계빈도가 1,000년 빈도로서 설계당시보다 확률수문량이 크게 증가된 현재 여수로 방류능력 및 안전성 상태로 고려해보면 적당한 위험도 값으로 추정된다.

  • PDF

Genetic Differentiation among the Mitochondrial ND2 Gene and $tRNA^{Trp}$ Gene Sequences of Genus Rana (Anura) in Korea

  • Lee, Hyuk;Yang, Suh-Yung;Lee, Hei-Yung
    • Animal cells and systems
    • /
    • 제4권1호
    • /
    • pp.31-37
    • /
    • 2000
  • The genetic variations among six species of Rana from Korea (R. nigro-maculata, R. piancyi, R. dybowskii, R. sp, R. rugosa type A, B and R. amurensis) were investigated using 499 bases of mitochondrial DNA sequences for ND2 (NADH dehydrogenase subunit 2) gene and $tRNA^{Trp}$ gene. Partial sequences of ND2 gene (427 bp) and full sequences of $tRNA^{Trp}$ gene (73 bp) were identified. The level of sequence divergences ranged from 0.2 to 5.2% within species and 4.9-28.0% among 6 species of the genus Rana. The $tRNA^{Trp}$ gene of the genus Rana was composed of 77 nucleotides which showed a two dimensional "cloverleaf" structure. The secondary structure of $tRNA^{Trp}$ was not found compensatory changes which could potentially confound phylogenetic inference. In the neighborjoining tree, brown frogs were clustered first with the level of sequence divergence of 13.20% between R. amurensis and R. dybowskii, and 9% between R. dybowskii and R. sp. supported by 99% bootstrap iterations, respectively. R. nigromaculata and R. plancyi were clustered into another group with 5.1% divergence supported by 100% bootstrap iteration. R. rugosa A 8nd B types were grouped by 4.9% divergence and clustered into the last group with other two groups with 100% bootstrap iterations.

  • PDF

잭나이프 및 붓스트랩 방법을 이용한 임상자료의 회귀계수 타당성 확인 (Check for regression coefficient using jackknife and bootstrap methods in clinical data)

  • 손기철;신임희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.643-648
    • /
    • 2012
  • 여러 임상자료를 이용하여 반응변수와 설명변수간의 관계를 규명하는 분석이 많이 이루어지고 있다. 이를 위해서 회귀분석이 흔히 사용되고 있으며, 이를 통해 설명변수가 반응변수를 얼마나 설명하는지 또한 모형이 얼마나 자료에 적합한지에 대해 분석하고 있다. 그러나 임상자료로 분석된 회귀모형에 대한 타당성 확인은 대부분 분석된 회귀모형이 얼마나 자료를 설명하는가를 나타내는 결정계수만을 살펴보는 것에 그치고 있다. 결정계수 이외의 다른 방법으로도 분석된 회귀모형의 회귀계수에 대한 타당성을 확인할 필요가 있다. 따라서 본 논문에서는 잭나이프 회귀분석과 붓스트랩 회귀분석을 이용하여 임상자료로 분석한 회귀모형의 회귀계수에 대한 타당성을 확인하는 방법을 소개하고자 한다.