• 제목/요약/키워드: Selection model

검색결과 4,060건 처리시간 0.031초

Bayesian Model Selection for Nonlinear Regression under Noninformative Prior

  • Na, Jonghwa;Kim, Jeongsuk
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.719-729
    • /
    • 2003
  • We propose a Bayesian model selection procedure for nonlinear regression models under noninformative prior. For informative prior, Na and Kim (2002) suggested the Bayesian model selection procedure through MCMC techniques. We extend this method to the case of noninformative prior. The difficulty with the use of noninformative prior is that it is typically improper and hence is defined only up to arbitrary constant. The methods, such as Intrinsic Bayes Factor(IBF) and Fractional Bayes Factor(FBF), are used as a resolution to the problem. We showed the detailed model selection procedure through the specific real data set.

Variable selection in L1 penalized censored regression

  • Hwang, Chang-Ha;Kim, Mal-Suk;Shi, Joo-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.951-959
    • /
    • 2011
  • The proposed method is based on a penalized censored regression model with L1-penalty. We use the iteratively reweighted least squares procedure to solve L1 penalized log likelihood function of censored regression model. It provide the efficient computation of regression parameters including variable selection and leads to the generalized cross validation function for the model selection. Numerical results are then presented to indicate the performance of the proposed method.

서비스 경영 혁신 기업 평가 모형의 개선 방안 연구 (A Research on Improving the Evaluation Model for Management Innovative Enterprises)

  • 노재확
    • 통상정보연구
    • /
    • 제12권4호
    • /
    • pp.279-302
    • /
    • 2010
  • A better selection model on management innovative enterprises is needed since the Korean government provides multi benefits to those selected enterprises. However, the selection model's propriety is suspicious because of the shortage of consideration of assessment items. In particular, the most important two assessment items, strategy and performance are suspected of multicollinearity because of high correlation scores. No consideration on multicollinearity among those items leads to erroneous selection which doubly counts the same components with different item names. The principle component analysis is applied to factor out the uncorrelated items. Using the resulted principle components, the new estimations are carried out. The comparison between estimated results from using principle components and non principle components shows that the present selection model overly considers the performance items compared to the real effect of items, which is a result of multicollinearity between performance and strategy.

  • PDF

CAPP에서 공정계획 선정을 위한 유전 알고리즘 접근 (A Genetic Algorithm A, pp.oach for Process Plan Selection on the CAPP)

  • 문치웅;김형수;이상준
    • 지능정보연구
    • /
    • 제4권1호
    • /
    • pp.1-10
    • /
    • 1998
  • Process planning is a very complex task and requires the dynamic informatioon of shop foor and market situations. Process plan selection is one of the main problems in the process planning. In this paper, we propose a new process plan selection model considering operation flexibility for the computer aided process planing. The model is formulated as a 0-1 integer programming considering realistic shop factors such as production volume, machining time, machine capacity, transportation time and capacity of tractors such as production volume, machining time, machine capacity, transportation time capacity of transfer device. The objective of the model is to minimize the sum of the processing and transportation time for all parts. A genetic algorithm a, pp.oach is developed to solve the model. The efficiency of the proposed a, pp.oach is verified with numerical examples.

  • PDF

교차검증을 이용한 SVM 전력수요예측 (SVM Load Forecasting using Cross-Validation)

  • 조남훈
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제55권11호
    • /
    • pp.485-491
    • /
    • 2006
  • In this paper, we study the problem of model selection for Support Vector Machine(SVM) predictor for short-term load forecasting. The model selection amounts to tuning SVM parameters, such as the cost coefficient C and kernel parameters and so on, in order to maximize the prediction performance of SVM. We propose that Cross-Validation method can be used as a model selection algorithm for SVM-based load forecasting technique. Through the various experiments on several data sets, we found that the difference between the prediction error of SVM using Cross-Validation and that of ideal SVM is less than 5%. This shows that SVM parameters for load forecasting can be efficiently tuned by using Cross-Validation.

Category Factor Based Feature Selection for Document Classification

  • Kang Yun-Hee
    • International Journal of Contents
    • /
    • 제1권2호
    • /
    • pp.26-30
    • /
    • 2005
  • According to the fast growth of information on the Internet, it is becoming increasingly difficult to find and organize useful information. To reduce information overload, it needs to exploit automatic text classification for handling enormous documents. Support Vector Machine (SVM) is a model that is calculated as a weighted sum of kernel function outputs. This paper describes a document classifier for web documents in the fields of Information Technology and uses SVM to learn a model, which is constructed from the training sets and its representative terms. The basic idea is to exploit the representative terms meaning distribution in coherent thematic texts of each category by simple statistics methods. Vector-space model is applied to represent documents in the categories by using feature selection scheme based on TFiDF. We apply a category factor which represents effects in category of any term to the feature selection. Experiments show the results of categorization and the correlation of vector length.

  • PDF

실시간 오차 보정을 위한 열변형 오차 모델의 최적 변수 선택 (Optimal Variable Selection in a Thermal Error Model for Real Time Error Compensation)

  • 황석현;이진현;양승한
    • 한국정밀공학회지
    • /
    • 제16권3호통권96호
    • /
    • pp.215-221
    • /
    • 1999
  • The object of the thermal error compensation system in machine tools is improving the accuracy of a machine tool through real time error compensation. The accuracy of the machine tool totally depends on the accuracy of thermal error model. A thermal error model can be obtained by appropriate combination of temperature variables. The proposed method for optimal variable selection in the thermal error model is based on correlation grouping and successive regression analysis. Collinearity matter is improved with the correlation grouping and the judgment function which minimizes residual mean square is used. The linear model is more robust against measurement noises than an engineering judgement model that includes the higher order terms of variables. The proposed method is more effective for the applications in real time error compensation because of the reduction in computational time, sufficient model accuracy, and the robustness.

  • PDF

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

경제동물의 주요 경제형질에 대한 표지인자를 이용한 선발(MAS)의 효율성 (Efficiency of Marker Assisted Selection(MAS) over The Phenotypic Selection for Economic Traits in Economic Animals)

  • 전광주
    • Journal of Animal Science and Technology
    • /
    • 제44권6호
    • /
    • pp.669-676
    • /
    • 2002
  • 유전표지인자를 이용한 선발(marker assisted selection; MAS)과 전통적인 표현형기록에 근거한 반응의 비교분석을 위하여 고정효과모델(deterministic model)을 이용하여 시뮬레이션을 하였다. 자신의 단일 기록을 이용한 경우와 자신의 기록과 자신의 표지인자 정보를 이용할 경우 유전력이 높을수록 MAS의 효율성이 38%정도 높게 나타났다. 그러나 유전력이 높은 경우(50%) MAS의 효율성은 약 1%정도로서 효율성이 대단히 낮은 것으로 나타났다. 자신의 기록과 부모의 표현형 정보에 표지인자 정보를 추가할 경우 MAS의 효율성은 27% 정도였으며 마찬가지로 유전력이 높은 경우에는 효율성이 0에 가깝게 나타났다. MAS의 효율성은 유전력이 낮을수록 그리고 이용한 표지인자의 유전적 변이가 클수록 효율성이 높아지는 것으로 나타났다.

Gaussian Mixture Model을 이용한 다중 범주 분류를 위한 특징벡터 선택 알고리즘 (Feature Selection for Multi-Class Genre Classification using Gaussian Mixture Model)

  • 문선국;최택성;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제32권10C호
    • /
    • pp.965-974
    • /
    • 2007
  • 본 논문에서는 내용 기반 음악 범주 분류 시스템에서 다중 범주를 위한 특징벡터 선택 알고리즘을 제안한다. 제안된 특징벡터 선택 알고리즘은 분리 성능을 측정할 때 가우시안 혼합 모델(Gaussian Mixture Model: GMM)을 기반으로 GMM separation score을 측정함으로써 확률분포 및 분리 성능 추정의 정확도를 높였고, sequential forward selection 방법을 개선하여 이전까지 선택된 특징벡터들이 분리를 잘 하지 못하는 범주들을 기준으로 다음 특징벡터를 선택하는 알고리즘을 제안하여 다중 범주 분류의 성능을 높였다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 특징벡터 선택 알고리즘과 기존의 알고리즘으로 특징벡터를 선택한 후 GMM classifier와 k-NN classifier를 이용하여 분류 성능을 평가하였다. 제안된 특징벡터 선택 알고리즘은 기존 알고리즘에 비하여 3%에서 8% 정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터의 분류 실험에서는 분류 정확도 측면에서 5%에서 10% 향상된 좋은 성능을 보였다.