• 제목/요약/키워드: bootstrap algorithm

검색결과 41건 처리시간 0.033초

부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선 (Improving an Ensemble Model by Optimizing Bootstrap Sampling)

  • 민성환
    • 인터넷정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2016
  • 앙상블 학습 기법은 개별 모형보다 더 좋은 예측 성과를 얻기 위해 다수의 분류기를 결합하는 것으로 예측 성과를 향상시키는데에 매우 유용한 것으로 알려져 있다. 배깅은 단일 분류기의 예측 성과를 향상시키는 대표적인 앙상블 기법중의 하나이다. 배깅은 원 학습 데이터로부터 부트스트랩 샘플링 방법을 통해 서로 다른 학습 데이터를 추출하고, 각각의 부트스트랩 샘플에 대해 학습 알고리즘을 적용하여 서로 다른 다수의 기저 분류기들을 생성시키게 되며, 최종적으로 서로 다른 분류기로부터 나온 결과를 결합하게 된다. 배깅에서 부트스트랩 샘플은 원 학습 데이터로부터 램덤하게 추출한 샘플로 각각의 부트스트랩 샘플이 동일한 정보를 가지고 있지는 않으며 이로 인해 배깅 모형의 성과는 편차가 발생하게 된다. 본 논문에서는 이와 같은 부트스트랩 샘플을 최적화함으로써 표준 배깅 앙상블의 성과를 개선시키는 새로운 방법을 제안하였다. 제안한 모형에서는 앙상블 모형의 성과를 개선시키기 위해 부트스트랩 샘플링을 최적화하였으며 이를 위해 유전자 알고리즘이 활용되었다. 본 논문에서는 제안한 모형을 국내 부도 예측 문제에 적용해 보았으며, 실험 결과 제안한 모형이 우수한 성과를 보였다.

붓스트랩방법을 이용한 피로모형의 설계곡선 설정 (Construction of a Design Curve for Fatigue Model Using Bootstrap Method)

  • 서순근;조유희
    • 품질경영학회지
    • /
    • 제30권4호
    • /
    • pp.106-119
    • /
    • 2002
  • The fatigue curve with estimated parameters represents the estimate of the median or mean life at a given applied stress But, in order to assist a designer in making decisions regarding the fatigue failure mode, it is common practice to construct a design curve on the lower or safe side of data. In this study, to overcome the limitations(i.e., no runout, equal variance, and quality of the approximation, etc) of Shen, Wirsching, and Cashman's method which suggested the approximate design curve for nonlinear models using tolerance interval constructed by Owen's method, an algorithm to find design curves under the fatigue model using a parametric bootstrap method, is proposed and illustrated with multiple fatigue data sets.

Improvement of Support Vector Clustering using Evolutionary Programming and Bootstrap

  • Jun, Sung-Hae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권3호
    • /
    • pp.196-201
    • /
    • 2008
  • Statistical learning theory has three analytical tools which are support vector machine, support vector regression, and support vector clustering for classification, regression, and clustering respectively. In general, their performances are good because they are constructed by convex optimization. But, there are some problems in the methods. One of the problems is the subjective determination of the parameters for kernel function and regularization by the arts of researchers. Also, the results of the learning machines are depended on the selected parameters. In this paper, we propose an efficient method for objective determination of the parameters of support vector clustering which is the clustering method of statistical learning theory. Using evolutionary algorithm and bootstrap method, we select the parameters of kernel function and regularization constant objectively. To verify improved performances of proposed research, we compare our method with established learning algorithms using the data sets form ucr machine learning repository and synthetic data.

Optimization of Blind Adaptive Decorrelating PIC Detector Performance in DS-CDMA System

  • Sirijiamrat, S.;Benjangkaprasert, C.;Sangaroon, O.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1962-1965
    • /
    • 2004
  • In this paper, the new algorithm for blind adaptive decorrelating parallel interference canceller detector in direct-sequence code division multiple access (DS-CDMA) synchronous communication systems is proposed. The goal of this paper is to improve the performance of the blind adaptive decorrelating parallel interference cancellation detector (BAD/PIC). The proposed blind adaptive decorrelating detector is using optimum step-size technique bootstrap algorithm as an initial stage of PIC, which does not require a training sequence. Therefore, this algorithm has a superior view of utilizing bandwidth and reduces the complexity of computation of inversion cross-correlation matrix. The computer simulation results show that the bit error rate performance of the proposed algorithm for the new structure of detector is better than that of the other detectors such as matched filters, the conventional PIC, and the blind adaptive decorrelating PIC detector.

  • PDF

일반화추정방정식(GEE)에 대한 부스트랩의 적용 (Bootstrap Estimation for GEE Models)

  • 박종선;전용문
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.207-216
    • /
    • 2011
  • 본 논문에서는 일반화추정방정식(GEE)모형에 대한 부스트랩 방법의 적용에 대하여 살펴본다. 다양한 부스트랩 방법들 중 GEE모형에 적용이 가능한 잔차, 쌍 및 점수함수 부스트랩 방법을 가상 및 실제 자료들에 적용한 결과 회귀계수들에 대한 추정치와 표준오차가 점근값들과 차이를 보이는 것으로 나타났다. 따라서 표본수가 크지 않은 경우 부스트랩 방법을 통하여 GEE모형에서의 회귀계수에 대한 추정치화 표준편차를 구하는 것이 효과적임을 알 수 있다.

On Employing Nonparametric Bootstrap Technique in Oscillometric Blood Pressure Measurement for Confidence Interval Estimation

  • Lee, Yong-Kook;Lee, Im-Bong;Chang, Joon-Hyuk;Lee, Soo-Jeong
    • 한국멀티미디어학회논문지
    • /
    • 제17권2호
    • /
    • pp.200-207
    • /
    • 2014
  • Blood pressure (BP) is an important vital signal for determining the health of an individual subject. Although estimation of mean arterial blood pressure is possible using oscillometric blood pressure techniques, there are no established techniques in the literature for obtaining confidence interval (CI) for systolic blood pressure (SBP) and diastolic blood pressure (DBP) estimates obtained from such BP measurements. This paper proposes a nonparametric bootstrap technique to obtain CI with a small number of the BP measurements. The proposed algorithm uses pseudo measurements employing nonparametric bootstrap technique to derive the pseudo maximum amplitudes (PMA) and the pseudo envelopes (PE). The SBP and DBP are then derived using the new relationships between PMA and PE and the CIs for such estimates. Application of the proposed method on an experimental dataset of 85 patients with five sets of measurements for each patient has yielded a smaller Cl than the conventional student t-method.

Application of Bayesian Computational Techniques in Estimation of Posterior Distributional Properties of Lognormal Distribution

  • Begum, Mun-Ni;Ali, M. Masoom
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권1호
    • /
    • pp.227-237
    • /
    • 2004
  • In this paper we presented a Bayesian inference approach for estimating the location and scale parameters of the lognormal distribution using iterative Gibbs sampling algorithm. We also presented estimation of location parameter by two non iterative methods, importance sampling and weighted bootstrap assuming scale parameter as known. The estimates by non iterative techniques do not depend on the specification of hyper parameters which is optimal from the Bayesian point of view. The estimates obtained by more sophisticated Gibbs sampler vary slightly with the choices of hyper parameters. The objective of this paper is to illustrate these tools in a simpler setup which may be essential in more complicated situations.

  • PDF

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.263-266
    • /
    • 2002
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.

향상된 PAIRWISE COUPLING 알고리즘에 의한 자료의 분류 (On the Classfication by an Improved Pairwise Coupling Algorithm)

  • 최대우;윤중식
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.415-425
    • /
    • 2000
  • 붓스트랩 표본추출과 pairwise coupling의 알고리즘을 결합한 새로운 분류 알고리즘을 제안하고, 이를 선형판별분석과 2차 판별분석에 적용하였다. 그리고 새로운 분류 알고리즘의 정확도를 비교하기위해 널리 사용되는 waveform 자료 등을 분석한 후, 그 결과를 기존 분류 방법과 비교하였다.

  • PDF

A Novel Text Sample Selection Model for Scene Text Detection via Bootstrap Learning

  • Kong, Jun;Sun, Jinhua;Jiang, Min;Hou, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.771-789
    • /
    • 2019
  • Text detection has been a popular research topic in the field of computer vision. It is difficult for prevalent text detection algorithms to avoid the dependence on datasets. To overcome this problem, we proposed a novel unsupervised text detection algorithm inspired by bootstrap learning. Firstly, the text candidate in a novel form of superpixel is proposed to improve the text recall rate by image segmentation. Secondly, we propose a unique text sample selection model (TSSM) to extract text samples from the current image and eliminate database dependency. Specifically, to improve the precision of samples, we combine maximally stable extremal regions (MSERs) and the saliency map to generate sample reference maps with a double threshold scheme. Finally, a multiple kernel boosting method is developed to generate a strong text classifier by combining multiple single kernel SVMs based on the samples selected from TSSM. Experimental results on standard datasets demonstrate that our text detection method is robust to complex backgrounds and multilingual text and shows stable performance on different standard datasets.