• 제목/요약/키워드: Subset selection

검색결과 203건 처리시간 0.022초

On an Optimal Bayesian Variable Selection Method for Generalized Logit Model

  • Kim, Hea-Jung;Lee, Ae Kuoung
    • Communications for Statistical Applications and Methods
    • /
    • 제7권2호
    • /
    • pp.617-631
    • /
    • 2000
  • This paper is concerned with suggesting a Bayesian method for variable selection in generalized logit model. It is based on Laplace-Metropolis algorithm intended to propose a simple method for estimating the marginal likelihood of the model. The algorithm then leads to a criterion for the selection of variables. The criterion is to find a subset of variables that maximizes the marginal likelihood of the model and it is seen to be a Bayes rule in a sense that it minimizes the risk of the variable selection under 0-1 loss function. Based upon two examples, the suggested method is illustrated and compared with existing frequentist methods.

  • PDF

Feature Selection Based on Bi-objective Differential Evolution

  • Das, Sunanda;Chang, Chi-Chang;Das, Asit Kumar;Ghosh, Arka
    • Journal of Computing Science and Engineering
    • /
    • 제11권4호
    • /
    • pp.130-141
    • /
    • 2017
  • Feature selection is one of the most challenging problems of pattern recognition and data mining. In this paper, a feature selection algorithm based on an improved version of binary differential evolution is proposed. The method simultaneously optimizes two feature selection criteria, namely, set approximation accuracy of rough set theory and relational algebra based derived score, in order to select the most relevant feature subset from an entire feature set. Superiority of the proposed method over other state-of-the-art methods is confirmed by experimental results, which is conducted over seven publicly available benchmark datasets of different characteristics such as a low number of objects with a high number of features, and a high number of objects with a low number of features.

Effective Multi-label Feature Selection based on Large Offspring Set created by Enhanced Evolutionary Search Process

  • Lim, Hyunki;Seo, Wangduk;Lee, Jaesung
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권9호
    • /
    • pp.7-13
    • /
    • 2018
  • Recent advancement in data gathering technique improves the capability of information collecting, thus allowing the learning process between gathered data patterns and application sub-tasks. A pattern can be associated with multiple labels, demanding multi-label learning capability, resulting in significant attention to multi-label feature selection since it can improve multi-label learning accuracy. However, existing evolutionary multi-label feature selection methods suffer from ineffective search process. In this study, we propose a evolutionary search process for the task of multi-label feature selection problem. The proposed method creates large set of offspring or new feature subsets and then retains the most promising feature subset. Experimental results demonstrate that the proposed method can identify feature subsets giving good multi-label classification accuracy much faster than conventional methods.

인지무선 시스템의 상관채널에서 공간 상관 행렬 사영을 이용한 안테나 선택기법 (Projection of Spatial Correlation-Based Antenna Selection for Cognitive Radio Systems in Correlated Channels)

  • 조재범;장성진;정원식;김재명
    • 한국통신학회논문지
    • /
    • 제37권1A호
    • /
    • pp.8-16
    • /
    • 2012
  • 최근에 인지무선시스템에서 부사용자의 성능을 향상시키기 위해서 다중 안테나 기술을 사용하는 연구가 많이 진행되고 있다. 이런 다중 안테나 시스템에서는 안테나 수가 증가할수록 복잡성이나 시스템 가격 등의 문제가 발생한다. 이러한 문제들을 해결하기 위해 이용 가능한 안테나의 부분집합을 찾아 일부 안테나만 사용하는 안테나 선택기법이 사용된다. 본 논문에서는 IEEE 802.11n을 기반으로 시스템을 구축하였으며 인지무선 시스템의 상관채널에서의 안테나 선택기법을 제안한다. 수신 안테나보다 송신안테나가 많은 다중안테나 시스템을 고려하여 송신 안테나를 수신안테나와 같은 수로 선택하여 준다. 안테나 선택에서 모든 안테나 조합을 고려하는 것은 비현실적이다. 따라서 채널 상관 행렬의 벡터 사영 값을 이용한 크기 값을 안테나 선택 기준으로 해준다. 이 알고리즘은 우선사용자에게 미치는 간섭은 줄여주면서 부사용자의 통신 성능은 향상시켜준다.

MDA에서 판별변수 선택을 위한 베이즈 기준 (A Bayes Criterion for Selecting Variables in MDA)

  • 김혜중;유희경
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.435-449
    • /
    • 1998
  • 본 연구는 다중판별분석(MDA)에서 필요한 변수선택기준을 베이즈접근법으로 제안하였다. 이 베이즈판별변수 선택기준은 여러 정규모집단분포의 평균벡터에 대한 동질성 검정에 필요한 디폴터형태의 베이즈요인을 객관적 베이즈방법으로 유도하여 설정하였다. 디폴트베이즈요인(default Bayes factor)은 Spiegelhalter와 Smith (1982)가 계발한 가상적트레이닝표본법(imaginary training sample method)을 사용하여서 도출하였다. 또한 제안된 베이즈판별변수선택 기준이 지닌 분포의 성질을 이용하여, 추가 판별변수(또는 변수군)가 MDA에 기여하는 부가적인 판별력에 대한 검정법 및 추가판별변수(또는 변수군)의 선택 기준에 대해서도 논하였다. 본 연구에서 새로이 얻은 변수선택기준은 최적부분집합선택법(optimal subset selection method)뿐 아니라 각 단계적방법(stepwise method)의 변수선택기준으로 사용될 수 있으며, 두 그룹 판별분석에도 사용이 가능하다는 점에서 표본이론에 의해 여러 형태로 개발된 기존의 판별변수 선택 기준들을 하나로 통합시킬 수 있는 기능을 지니고 있다. 모의실험을 실시하여 최적 부분집합선택법과 단계적방법하에서 제안된 판별변수선택 기준이 가진 효용성을 평가하였다.

  • PDF

부분집합 합 문제에서의 유전 알고리즘과 동적 계획법의 성능 비교 (Performance Comparison between Genetic Algorithms and Dynamic Programming in the Subset-Sum Problem)

  • 조휘연;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권4호
    • /
    • pp.259-267
    • /
    • 2018
  • 부분집합 합 문제는 유한개의 정수로 이루어진 집합이 있을 때 이 집합의 부분집합 중에서 그 집합의 원소들의 합이 특정 값이 되는 경우가 있는지를 알아내는 문제로, 잘 알려진 다항식 시간 내에 풀기 어려운 NP-완비 문제이다. 유전 알고리즘은 선택과 교차, 돌연변이 등의 연산을 통해 주어진 문제의 최적해를 구하는 알고리즘이다. 동적 계획법은 주어진 문제를 풀기 위해서 문제를 하나 또는 여러 개의 하위 문제로 나누어 풀이하는 방법이다. 본 논문에서는 부분집합 합 문제를 풀이하는 유전 알고리즘을 설계 및 구현하고, 답을 찾는 데까지 걸리는 시간 성능을 동적 계획법의 경우와 실험적으로 비교하였다. 양의 정수인 원소 63 개를 가진 집합에서 '쉬움'과 '어려움'의 난이도를 고려하여 총 17 개의 문제를 선정하고, 이 문제들을 풀이하는 두 알고리즘의 성능을 비교하는 실험을 진행하였다. 17 개의 문제 중 13 개의 문제에서 본 논문에서 제시한 유전 알고리즘은 동적 계획법과 비교하여 약 84%가 우수한 시간 성능을 보였다.

DESIGN OF A BINARY DECISION TREE FOR RECOGNITION OF THE DEFECT PATTERNS OF COLD MILL STRIP USING GENETIC ALGORITHM

  • Lee, Byung-Jin;Kyoung Lyou;Park, Gwi-Tae;Kim, Kyoung-Min
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.208-212
    • /
    • 1998
  • This paper suggests the method to recognize the various defect patterns of cold mill strip using binary decision tree constructed by genetic algorithm automatically. In case of classifying the complex the complex patterns with high similarity like the defect patterns of cold mill strip, the selection of the optimal feature set and the structure of recognizer is important for high recognition rate. In this paper genetic algorithm is used to select a subset of the suitable features at each node in binary decision tree. The feature subset of maximum fitness is chosen and the patterns are classified into two classes by linear decision function. After this process is repeated at each node until all the patterns are classified respectively into individual classes. In this way , binary decision tree classifier is constructed automatically. After construction binary decision tree, the final recognizer is accomplished by the learning process of neural network using a set of standard p tterns at each node. In this paper, binary decision tree classifier is applied to recognition of the defect patterns of cold mill strip and the experimental results are given to show the usefulness of the proposed scheme.

  • PDF

Two dimensional reduction technique of Support Vector Machines for Bankruptcy Prediction

  • Ahn, Hyun-Chul;Kim, Kyoung-Jae;Lee, Ki-Chun
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.608-613
    • /
    • 2007
  • Prediction of corporate bankruptcies has long been an important topic and has been studied extensively in the finance and management literature because it is an essential basis for the risk management of financial institutions. Recently, support vector machines (SVMs) are becoming popular as a tool for bankruptcy prediction because they use a risk function consisting of the empirical error and a regularized term which is derived from the structural risk minimization principle. In addition, they don't require huge training samples and have little possibility of overfitting. However. in order to Use SVM, a user should determine several factors such as the parameters ofa kernel function, appropriate feature subset, and proper instance subset by heuristics, which hinders accurate prediction results when using SVM In this study, we propose a novel hybrid SVM classifier with simultaneous optimization of feature subsets, instance subsets, and kernel parameters. This study introduces genetic algorithms (GAs) to optimize the feature selection, instance selection, and kernel parameters simultaneously. Our study applies the proposed model to the real-world case for bankruptcy prediction. Experimental results show that the prediction accuracy of conventional SVM may be improved significantly by using our model.

  • PDF

An ADHD Diagnostic Approach Based on Binary-Coded Genetic Algorithm and Extreme Learning Machine

  • Sachnev, Vasily;Suresh, Sundaram
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.111-117
    • /
    • 2016
  • An accurate approach for diagnosis of attention deficit hyperactivity disorder (ADHD) is presented in this paper. The presented technique efficiently classifies three subtypes of ADHD (ADHD-C, ADHD-H, ADHD-I) and typically developing control (TDC) by using only structural magnetic resonance imaging (MRI). The research examines structural MRI of the hippocampus from the ADHD-200 database. Each available MRI has been processed by a region-of-interest (ROI) to build a set of features for further analysis. The presented ADHD diagnostic approach unifies feature selection and classification techniques. The feature selection technique based on the proposed binary-coded genetic algorithm searches for an optimal subset of features extracted from the hippocampus. The classification technique uses a chosen optimal subset of features for accurate classification of three subtypes of ADHD and TDC. In this study, the famous Extreme Learning Machine is used as a classification technique. Experimental results clearly indicate that the presented BCGA-ELM (binary-coded genetic algorithm coupled with Extreme Learning Machine) efficiently classifies TDC and three subtypes of ADHD and outperforms existing techniques.