• 제목/요약/키워드: model selection

검색결과 4,039건 처리시간 0.026초

On an Optimal Bayesian Variable Selection Method for Generalized Logit Model

  • Kim, Hea-Jung;Lee, Ae Kuoung
    • Communications for Statistical Applications and Methods
    • /
    • 제7권2호
    • /
    • pp.617-631
    • /
    • 2000
  • This paper is concerned with suggesting a Bayesian method for variable selection in generalized logit model. It is based on Laplace-Metropolis algorithm intended to propose a simple method for estimating the marginal likelihood of the model. The algorithm then leads to a criterion for the selection of variables. The criterion is to find a subset of variables that maximizes the marginal likelihood of the model and it is seen to be a Bayes rule in a sense that it minimizes the risk of the variable selection under 0-1 loss function. Based upon two examples, the suggested method is illustrated and compared with existing frequentist methods.

  • PDF

연결강도분석을 이용한 통합된 부도예측용 신경망모형

  • 이웅규;임영하
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2002년도 추계학술대회
    • /
    • pp.289-312
    • /
    • 2002
  • This study suggests the Link weight analysis approach to choose input variables and an integrated model to make more accurate bankruptcy prediction model. the Link weight analysis approach is a method to choose input variables to analyze each input node's link weight which is the absolute value of link weight between an input nodes and a hidden layer. There are the weak-linked neurons elimination method, the strong-linked neurons selection method in the link weight analysis approach. The Integrated Model is a combined type adapting Bagging method that uses the average value of the four models, the optimal weak-linked-neurons elimination method, optimal strong-linked neurons selection method, decision-making tree model, and MDA. As a result, the methods suggested in this study - the optimal strong-linked neurons selection method, the optimal weak-linked neurons elimination method, and the integrated model - show much higher accuracy than MDA and decision making tree model. Especially the integrated model shows much higher accuracy than MDA and decision making tree model and shows slightly higher accuracy than the optimal weak-linked neurons elimination method and the optimal strong-linked neurons selection method.

  • PDF

시뮬레이션을 통한 베이즈요인에 의한 모형선택의 비교연구 : 포아송, 음이항모형의 선택과 정규, 이중지수, 코쉬모형의 선택 (Comparative Study of Model Selection Using Bayes Factor through Simulation : Poisson vs. Negative Binomial Model Selection and Normal, Double Exponential vs. Cauchy Model Selection)

  • 오미라;윤소영;심정욱;손영숙
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.335-349
    • /
    • 2003
  • 본 논문에서는 포아송분포 대 음이항분포, 그리고 정규분포, 이중지 수분포 대 코쉬분포에 대한 모형선택을 위하여 베이지안 방법을 사용한다. 각 모수에 대한 사전분포로는 무정보 부적절 사전분포의 가정 하에, 베이지안 모형선택을 위하여 O'Hagan (1995)의 부분적 베 이즈요인을 이용하였다. 실제자료와 모의 실험 자료의 분석을 통하여 부분적 베이즈요인의 유용성을 Berger와 Pericchi (1996, 1998)의 내재적 베이즈요인들과 함께 비교 검토해 본다.

표본선택 편의를 반영한 임금결정요인 분석 (The wage determinants applying sample selection bias)

  • 박성익;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1317-1325
    • /
    • 2016
  • 본 연구에서는 한국고용정보원에서 실시한 "2013 고졸자 취업진로조사" 자료를 활용하여 특성화고 졸업자의 임금결정요인을 분석하였다. 일반적으로 임금은 개인의 취업여부와 임금의 크기에 대한 두 가지의 복합적인 정보를 담고 있다. 그러나 임금 결정요인분석의 많은 선행연구에서는 후자의 정보만을 대상으로 최소제곱법에 기초한 선형 회귀분석을 수행함으로써 표본선택에 의한 편의 (sample selection bias) 문제가 발생하게 된다. 본 연구에서는 임금결정요인분석에서 표본선택에 의한 편의 문제를 극복하기 위해 Tobit 모형과 Heckman의 표본선택 모형을 분석에 활용하였다. 주요 분석 결과를 요약하면 다음과 같다. 먼저 Tobit 모형과 Heckman의 표본선택 모형에 대한 타당성은 통계적으로 유의함을 알 수 있었다. 성별은 취업확률과 임금의 크기에서 모두 통계적으로 유의한 것으로 나타났다. 마이스터고 졸업생은 취업확률과 임금의 크기 모두 기타고 졸업생에 비해서 높은 것을 알 수 있었으며, 부모소득이 높을수록 취업확률과 임금의 크기가 모두 통계적으로 유의하게 증가하였다. 부모학력이 고졸이하에 비해서 대졸이상이 취업확률은 통계적으로 유의하게 낮지만, 임금의 크기는 높게 나타났다. 고교성적은 높을수록, 고교 만족도가 높을수록, 그리고 자격증 수가 많을수록 취업확률과 임금의 크기 모두 통계적으로 유의하게 높은 것을 알 수 있다.

On loss functions for model selection in wavelet based Bayesian method

  • Park, Chun-Gun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1191-1197
    • /
    • 2009
  • Most Bayesian approaches to model selection of wavelet analysis have drawbacks that computational cost is expensive to obtain accuracy for the fitted unknown function. To overcome the drawback, this article introduces loss functions which are criteria for level dependent threshold selection in wavelet based Bayesian methods with arbitrary size and regular design points. We demonstrate the utility of these criteria by four test functions and real data.

  • PDF

A Study of a Server Selection Model for Selecting a Replicated Server based on Downstream Measurement in the Server-side

  • Kim, Seung-Hae;Lee, Won-Hyuk;Cho, Gi-Hwan
    • Journal of Information Processing Systems
    • /
    • 제2권2호
    • /
    • pp.130-134
    • /
    • 2006
  • In the distributed replicating server model, the provision of replicated services will improve the performance of the providing service and efficiency for clients. Efficiently composing the server selection algorithm decreases the retrieval time for replicated data. In this paper, we define the system model that selects and connects the replicated server that provides an optimal service using the server-side downstream measurement and propose a server selection algorithm.

A Note on Parametric Bootstrap Model Selection

  • Lee, Kee-Won;Songyong Sim
    • Journal of the Korean Statistical Society
    • /
    • 제27권4호
    • /
    • pp.397-405
    • /
    • 1998
  • We develop parametric bootstrap model selection criteria in an example to fit a random sample to either a general normal distribution or a normal distribution with prespecified mean. We apply the bootstrap methods in two ways; one considers the direct substitution of estimated parameter for the unknown parameter, and the other focuses on the bias correction. These bootstrap model selection criteria are compared with AIC. We illustrate that all the selection rules reduce to the one sample t-test, where the cutoff points converge to some certain points as the sample size increases.

  • PDF

신경 회로망 학습을 통한 모델 선택의 자동화 (Automation of Model Selection through Neural Networks Learning)

  • 류재흥
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.313-316
    • /
    • 2004
  • Model selection is the process that sets up the regularization parameter in the support vector machine or regularization network by using the external methods such as general cross validation or L-curve criterion. This paper suggests that the regularization parameter can be obtained simultaneously within the learning process of neural networks without resort to separate selection methods. In this paper, extended kernel method is introduced. The relationship between regularization parameter and the bias term in the extended kernel is established. Experimental results show the effectiveness of the new model selection method.

  • PDF

모형 선택 기준들에 대한 LASSO 회귀 모형 편의의 영향 연구 (A study on bias effect of LASSO regression for model selection criteria)

  • 유동현
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.643-656
    • /
    • 2016
  • 고차원 자료(high dimensional data)는 변수의 수가 표본의 수보다 많은 자료로 다양한 분야에서 관측 또는 생성되고 있다. 일반적으로, 고차원 자료에 대한 회귀 모형에서는 모수의 추정과 과적합을 피하기 위하여 변수 선택이 이루어진다. 벌점화 회귀 모형(penalized regression model)은 변수 선택과 회귀 계수의 추정을 동시에 수행하는 장점으로 인하여 고차원 자료에 빈번하게 적용되고 있다. 하지만, 벌점화 회귀 모형에서도 여전히 조율 모수 선택(tuning parameter selection)을 통한 최적의 모형 선택이 요구된다. 본 논문에서는 벌점화 회귀 모형 중에서 대표적인 LASSO 회귀 모형을 기반으로 모형 선택의 기준들에 대한 LASSO 회귀 추정량의 편의가 어떠한 영향을 미치는지 모의실험을 통하여 수치적으로 연구하였고 편의의 보정의 필요성에 대하여 나타내었다. 실제 자료 분석에서의 영향을 나타내기 위하여, 폐암 환자의 유전자 발현량(gene expression) 자료를 기반으로 바이오마커 식별(biomarker identification) 문제에 적용하였다.

Cox proportional hazard model with L1 penalty

  • Hwang, Chang-Ha;Shim, Joo-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.613-618
    • /
    • 2011
  • The proposed method is based on a penalized log partial likelihood of Cox proportional hazard model with L1-penalty. We use the iteratively reweighted least squares procedure to solve L1 penalized log partial likelihood function of Cox proportional hazard model. It provide the ecient computation including variable selection and leads to the generalized cross validation function for the model selection. Experimental results are then presented to indicate the performance of the proposed procedure.