• 제목/요약/키워드: Subset selection problem

검색결과 40건 처리시간 0.024초

Subset selection in multiple linear regression: An improved Tabu search

  • Bae, Jaegug;Kim, Jung-Tae;Kim, Jae-Hwan
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제40권2호
    • /
    • pp.138-145
    • /
    • 2016
  • This paper proposes an improved tabu search method for subset selection in multiple linear regression models. Variable selection is a vital combinatorial optimization problem in multivariate statistics. The selection of the optimal subset of variables is necessary in order to reliably construct a multiple linear regression model. Its applications widely range from machine learning, timeseries prediction, and multi-class classification to noise detection. Since this problem has NP-complete nature, it becomes more difficult to find the optimal solution as the number of variables increases. Two typical metaheuristic methods have been developed to tackle the problem: the tabu search algorithm and hybrid genetic and simulated annealing algorithm. However, these two methods have shortcomings. The tabu search method requires a large amount of computing time, and the hybrid algorithm produces a less accurate solution. To overcome the shortcomings of these methods, we propose an improved tabu search algorithm to reduce moves of the neighborhood and to adopt an effective move search strategy. To evaluate the performance of the proposed method, comparative studies are performed on small literature data sets and on large simulation data sets. Computational results show that the proposed method outperforms two metaheuristic methods in terms of the computing time and solution quality.

포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 - (Subset Selection in the Poisson Models - A Normal Predictors case -)

  • 박종선
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.247-255
    • /
    • 1998
  • 일반선형 모형의 하나인 포아송모형에서 설명변수들을 선택하는 문제를 고려하여 보았다 설명변수들이 정규분포를 따르는 확률변수일 때 반응변수의 조건부 분포를 통하여 모형에 필요한 설명변수의 부분집합을 선택하는 방범을 제시하였다.

  • PDF

4G 통신시스템 기반의 Pre-coding과 Antenna Subset Selection, AMC 기법을 적용한 각 MIMO-OFDM 기법의 성능 분석 및 비교 (The Performance Analysis and Comparison of The MIMO-OFDM Scheme Applied to Pre-coding, Antenna Subset Selection and AMC for 4G Communication System)

  • 조인식;서창우;윤길상;이정환;황인태
    • 대한전자공학회논문지TC
    • /
    • 제47권3호
    • /
    • pp.31-38
    • /
    • 2010
  • 본 논문에서는 MIMO-OFDM 시스템에 여러 MIMO 기법을 적용한 후 모의실험을 통하여 성능을 비교 및 분석하였고, 또한 Pre-coding, Antenna Subset Selection, AMC 기법을 적용하여 시스템을 분석하였다. 그리고 최종적으로 제안한 Adaptive-MCM(Adaptive-MIMO-Coding-Modulation) 기법의 성능을 분석하였다. 그 결과 4세대 이동통신 시스템에서 요구되고 있는 최대 전송률과 고품질 서비스의 Trade-off 관계를 개선할 수 있음을 확인하였다.

A two-stage damage detection approach based on subset selection and genetic algorithms

  • Yun, Gun Jin;Ogorzalek, Kenneth A.;Dyke, Shirley J.;Song, Wei
    • Smart Structures and Systems
    • /
    • 제5권1호
    • /
    • pp.1-21
    • /
    • 2009
  • A two-stage damage detection method is proposed and demonstrated for structural health monitoring. In the first stage, the subset selection method is applied for the identification of the multiple damage locations. In the second stage, the damage severities of the identified damaged elements are determined applying SSGA to solve the optimization problem. In this method, the sensitivities of residual force vectors with respect to damage parameters are employed for the subset selection process. This approach is particularly efficient in detecting multiple damage locations. The SEREP is applied as needed to expand the identified mode shapes while using a limited number of sensors. Uncertainties in the stiffness of the elements are also considered as a source of modeling errors to investigate their effects on the performance of the proposed method in detecting damage in real-life structures. Through a series of illustrative examples, the proposed two-stage damage detection method is demonstrated to be a reliable tool for identifying and quantifying multiple damage locations within diverse structural systems.

An Exploration on the Use of Data Envelopment Analysis for Product Line Selection

  • Lin, Chun-Yu;Okudan, Gul E.
    • Industrial Engineering and Management Systems
    • /
    • 제8권1호
    • /
    • pp.47-53
    • /
    • 2009
  • We define product line (or mix) selection problem as selecting a subset of potential product variants that can simultaneously minimize product proliferation and maintain market coverage. Selecting the most efficient product mix is a complex problem, which requires analyses of multiple criteria. This paper proposes a method based on Data Envelopment Analysis (DEA) for product line selection. Data Envelopment Analysis (DEA) is a linear programming based technique commonly used for measuring the relative performance of a group of decision making units with multiple inputs and outputs. Although DEA has been proved to be an effective evaluation tool in many fields, it has not been applied to solve the product line selection problem. In this study, we construct a five-step method that systematically adopts DEA to solve a product line selection problem. We then apply the proposed method to an existing line of staplers to provide quantitative evidence for managers to generate desirable decisions to maximize the company profits while also fulfilling market demands.

부분집합 합 문제에서의 유전 알고리즘과 동적 계획법의 성능 비교 (Performance Comparison between Genetic Algorithms and Dynamic Programming in the Subset-Sum Problem)

  • 조휘연;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권4호
    • /
    • pp.259-267
    • /
    • 2018
  • 부분집합 합 문제는 유한개의 정수로 이루어진 집합이 있을 때 이 집합의 부분집합 중에서 그 집합의 원소들의 합이 특정 값이 되는 경우가 있는지를 알아내는 문제로, 잘 알려진 다항식 시간 내에 풀기 어려운 NP-완비 문제이다. 유전 알고리즘은 선택과 교차, 돌연변이 등의 연산을 통해 주어진 문제의 최적해를 구하는 알고리즘이다. 동적 계획법은 주어진 문제를 풀기 위해서 문제를 하나 또는 여러 개의 하위 문제로 나누어 풀이하는 방법이다. 본 논문에서는 부분집합 합 문제를 풀이하는 유전 알고리즘을 설계 및 구현하고, 답을 찾는 데까지 걸리는 시간 성능을 동적 계획법의 경우와 실험적으로 비교하였다. 양의 정수인 원소 63 개를 가진 집합에서 '쉬움'과 '어려움'의 난이도를 고려하여 총 17 개의 문제를 선정하고, 이 문제들을 풀이하는 두 알고리즘의 성능을 비교하는 실험을 진행하였다. 17 개의 문제 중 13 개의 문제에서 본 논문에서 제시한 유전 알고리즘은 동적 계획법과 비교하여 약 84%가 우수한 시간 성능을 보였다.

표본크기가 다른 정규모집단의 평균에 대한 부분집합선택절차론의 성질과 비교연구 (Comparisons of some subset selection procedures for K normal populations with unequal sample size)

  • 손중권;김소연;김영훈
    • 응용통계연구
    • /
    • 제3권1호
    • /
    • pp.79-87
    • /
    • 1990
  • 표본의 크기가 동일하지 않으면서 등분산이 기지 또는 미지인 경우 k개의 정규모집단의 평균에 대한 부분집합선택절차론은 여러 사람들에 연구되었으나 제안된 부분집합선택절차들의 성질과 효율성을 비교한 결과가 미흡하다. 본 고에서는 제안된 특성을 조사하고 여러 가지 형태에서 효율성을 비교하였다.

  • PDF

On a Robust Subset Selection Procedure for the Slopes of Regression Equations

  • Song, Moon-Sup;Oh, Chang-Hyuck
    • Journal of the Korean Statistical Society
    • /
    • 제10권
    • /
    • pp.105-121
    • /
    • 1981
  • The problem of selection of a subset containing the largest of several slope parameters of regression equations is considered. The proposed selection procedure is based on the weighted median estimators for regression parameters and the median of rescaled absolute residuals for scale parameters. Those estimators are compared with the classical least squares estimators by a simulation study. A Monte Carlo comparison is also made between the new procedure based on the weighted median estiamtors and the procedure based on the least squares estimators. The results show that the proposed procedure is quite robust with respect to the heaviness of distribution tails.

  • PDF

Feature Selection Using Submodular Approach for Financial Big Data

  • Attigeri, Girija;Manohara Pai, M.M.;Pai, Radhika M.
    • Journal of Information Processing Systems
    • /
    • 제15권6호
    • /
    • pp.1306-1325
    • /
    • 2019
  • As the world is moving towards digitization, data is generated from various sources at a faster rate. It is getting humungous and is termed as big data. The financial sector is one domain which needs to leverage the big data being generated to identify financial risks, fraudulent activities, and so on. The design of predictive models for such financial big data is imperative for maintaining the health of the country's economics. Financial data has many features such as transaction history, repayment data, purchase data, investment data, and so on. The main problem in predictive algorithm is finding the right subset of representative features from which the predictive model can be constructed for a particular task. This paper proposes a correlation-based method using submodular optimization for selecting the optimum number of features and thereby, reducing the dimensions of the data for faster and better prediction. The important proposition is that the optimal feature subset should contain features having high correlation with the class label, but should not correlate with each other in the subset. Experiments are conducted to understand the effect of the various subsets on different classification algorithms for loan data. The IBM Bluemix BigData platform is used for experimentation along with the Spark notebook. The results indicate that the proposed approach achieves considerable accuracy with optimal subsets in significantly less execution time. The algorithm is also compared with the existing feature selection and extraction algorithms.

최고의 정규 모집단을 뽑기 위한 부분집합선택절차론의 운용특성에 관한 연구 (Operating characteristics of a subset selection procedure for selecting the best normal population with common unknown variance)

  • 손중권
    • 응용통계연구
    • /
    • 제3권1호
    • /
    • pp.59-78
    • /
    • 1990
  • 지난 30여년간 급격히 발전해 온 다중결정이론 중 부분집합선택론은 매우 중요한 위치를 차지하고 있다. 특히 여러가지 형태의 부분집합선택절차론 중에서 최초로 소개된 Gupta형 선택절차론은 모든 절차론들의 기본이 되어 오고 있음으로 그 중요성은 널리 인식되고 있다. 더우기 응용부문에 있어서도 가장 많이 사용되고 있는 선택절차론들 중의 하나이기도 하다. 따라서 Gupta형 선책절차론에 대한 일반적인 성질들도 많이 규명되어 왔다. 특히 결정론적 측면에서나 베이스 이론적 측면에서의 최적성 및 점근적 효율성에 있어서는 Gupta와 Hsu(1978), Bj$\phi$rnstad(1980), 그리고 Bickel과 Yahav(1982)가 성질 들을 규명내지는 다른 형의 부분집합선택절차론들과 특정분포에 대해 비교 검토하였다. 또한 수집된 자료가 선택절차론의 근본 가정들을 위반할 경우가 실제로 다반사로 일어난다. 따라서 근본가정이 위배될 경우 선택절차론의 강건력에 대해서도 연구가 부분적으로 진행되었다. Gupta형 선택절차론과 중앙값 선택절차론과의 비교도 Gupta와 Singh(1980)과 Sohn(1985)에 의해 진행되었으며, 특히 스피리지 배치에서 점근적 효율성을 연구하였다. 하지만 부분집합선택절차론이 차지하는 중요성에 비해 그 자체에 대한 여러 측면에 있어서의 성질 및 운용특성에 대한 포괄적이고 일반적인 연구는 미흡한 편이다.

  • PDF