• 제목/요약/키워드: Subset selection

검색결과 203건 처리시간 0.027초

Discretization Method Based on Quantiles for Variable Selection Using Mutual Information

  • CHa, Woon-Ock;Huh, Moon-Yul
    • Communications for Statistical Applications and Methods
    • /
    • 제12권3호
    • /
    • pp.659-672
    • /
    • 2005
  • This paper evaluates discretization of continuous variables to select relevant variables for supervised learning using mutual information. Three discretization methods, MDL, Histogram and 4-Intervals are considered. The process of discretization and variable subset selection is evaluated according to the classification accuracies with the 6 real data sets of UCI databases. Results show that 4-Interval discretization method based on quantiles, is robust and efficient for variable selection process. We also visually evaluate the appropriateness of the selected subset of variables.

4G 통신시스템 기반의 Pre-coding과 Antenna Subset Selection, AMC 기법을 적용한 각 MIMO-OFDM 기법의 성능 분석 및 비교 (The Performance Analysis and Comparison of The MIMO-OFDM Scheme Applied to Pre-coding, Antenna Subset Selection and AMC for 4G Communication System)

  • 조인식;서창우;윤길상;이정환;황인태
    • 대한전자공학회논문지TC
    • /
    • 제47권3호
    • /
    • pp.31-38
    • /
    • 2010
  • 본 논문에서는 MIMO-OFDM 시스템에 여러 MIMO 기법을 적용한 후 모의실험을 통하여 성능을 비교 및 분석하였고, 또한 Pre-coding, Antenna Subset Selection, AMC 기법을 적용하여 시스템을 분석하였다. 그리고 최종적으로 제안한 Adaptive-MCM(Adaptive-MIMO-Coding-Modulation) 기법의 성능을 분석하였다. 그 결과 4세대 이동통신 시스템에서 요구되고 있는 최대 전송률과 고품질 서비스의 Trade-off 관계를 개선할 수 있음을 확인하였다.

A two-stage damage detection approach based on subset selection and genetic algorithms

  • Yun, Gun Jin;Ogorzalek, Kenneth A.;Dyke, Shirley J.;Song, Wei
    • Smart Structures and Systems
    • /
    • 제5권1호
    • /
    • pp.1-21
    • /
    • 2009
  • A two-stage damage detection method is proposed and demonstrated for structural health monitoring. In the first stage, the subset selection method is applied for the identification of the multiple damage locations. In the second stage, the damage severities of the identified damaged elements are determined applying SSGA to solve the optimization problem. In this method, the sensitivities of residual force vectors with respect to damage parameters are employed for the subset selection process. This approach is particularly efficient in detecting multiple damage locations. The SEREP is applied as needed to expand the identified mode shapes while using a limited number of sensors. Uncertainties in the stiffness of the elements are also considered as a source of modeling errors to investigate their effects on the performance of the proposed method in detecting damage in real-life structures. Through a series of illustrative examples, the proposed two-stage damage detection method is demonstrated to be a reliable tool for identifying and quantifying multiple damage locations within diverse structural systems.

Performance analysis of precoding-aided differential spatial modulation systems with transmit antenna selection

  • Kim, Sangchoon
    • ETRI Journal
    • /
    • 제44권1호
    • /
    • pp.117-124
    • /
    • 2022
  • In this paper, the performance of precoding-aided differential spatial modulation (PDSM) systems with optimal transmit antenna subset (TAS) selection is examined analytically. The average bit error rate (ABER) performance of the optimal TAS selection-based PDSM systems using a zero-forcing (ZF) precoder is evaluated using theoretical upper bound and Monte Carlo simulations. Simulation results validate the analysis and demonstrate a performance penalty < 2.6 dB compared with precoding-aided spatial modulation (PSM) with optimal TAS selection. The performance analysis reveals a transmit diversity gain of (NT-NR+1) for the ZF-based PDSM (ZF-PDSM) systems that employ TAS selection with NT transmit antennas, NS selected transmit antennas, and NR receive antennas. It is also shown that reducing the number of activated transmit antennas via optimal TAS selection in the ZF-PDSM systems degrades ABER performance. In addition, the impacts of channel estimation errors on the performance of the ZF-PDSM system with TAS selection are evaluated, and the performance of this system is compared with that of ZF-based PSM with TAS selection.

A Bayesian Method for Narrowing the Scope of Variable Selection in Binary Response Logistic Regression

  • Kim, Hea-Jung;Lee, Ae-Kyung
    • 품질경영학회지
    • /
    • 제26권1호
    • /
    • pp.143-160
    • /
    • 1998
  • This article is concerned with the selection of subsets of predictor variables to be included in bulding the binary response logistic regression model. It is based on a Bayesian aproach, intended to propose and develop a procedure that uses probabilistic considerations for selecting promising subsets. This procedure reformulates the logistic regression setup in a hierarchical normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. It is done by use of the fact that cdf of logistic distribution is a, pp.oximately equivalent to that of $t_{(8)}$/.634 distribution. The a, pp.opriate posterior probability of each subset of predictor variables is obtained by the Gibbs sampler, which samples indirectly from the multinomial posterior distribution on the set of possible subset choices. Thus, in this procedure, the most promising subset of predictors can be identified as that with highest posterior probability. To highlight the merit of this procedure a couple of illustrative numerical examples are given.

  • PDF

신경망의 민감도 분석을 이용한 귀납적 학습기법의 변수 부분집합 선정 (Feature Subset Selection in the Induction Algorithm using Sensitivity Analysis of Neural Networks)

  • 강부식;박상찬
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 데이터로부터 학습하여 룰을 추출하는 귀납적 학습기법은 데이터 마이닝의 주요 도구 중 하나이다. 귀납적 학습 기법은 불필요한 변수나 잡음이 섞인 변수를 포함하여 학습하는 경우 생성된 룰의 예측 성능이 떨어지고 불필요하게 룰이 복잡하게 구성될 수 있다. 따라서 귀납적 학습 기법의 예측력을 높이고 룰의 구성도 간단하게 할 수 있는 주요 변수 부분집합을 선정하는 방안이 필요하다. 귀납적 학습에서 예측력을 높이기 위해 많이 사용되는 부분집합 선정을 위한 포장 기법은 최적의 부분집합을 찾기 위해 전체 부분집합을 탐색한다. 이때 전체 변수의 수가 많아지면 부분집합의 탐색 공간이 너무 커져서 탐색하기 어려운 문제가 된다. 본 연구에서는 포장 기법에 신경망 민감도 분석을 결합한 귀납적 학습 기법의 변수 부분집합 선정 방안을 제시한다. 먼저, 신경망의 민감도 분석 기법을 이용하여 전체 변수를 중요도 순으로 순서화 한다. 다음에 순서화된 정보를 이용하여 귀납적 학습 기법의 예측력을 높일 수 있는 부분집합을 찾아 나간다. 제안된 방법을 세 데이터 셋에 적용한 결과 일정한 반복 회수 이내에 예측력이 향상된 부분집합을 얻을 수 있음을 볼 수 있다.

  • PDF

특징 선택을 이용한 소프트웨어 재사용의 성공 및 실패 요인 분류 정확도 향상 (Improvement of Classification Accuracy on Success and Failure Factors in Software Reuse using Feature Selection)

  • 김영옥;권기태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.219-226
    • /
    • 2013
  • 특징 선택은 기계 학습 및 패턴 인식 분야에서 중요한 이슈 중 하나로, 분류 정확도를 향상시키기 위해 원본 데이터가 주어졌을 때 가장 좋은 성능을 보여줄 수 있는 데이터의 부분집합을 찾아내는 방법이다. 즉, 분류기의 분류 목적에 가장 밀접하게 연관되어 있는 특징들만을 추출하여 새로운 데이터를 생성하는 것이다. 본 논문에서는 소프트웨어 재사용의 성공 요인과 실패 요인에 대한 분류 정확도를 향상시키기 위해 특징 부분 집합을 찾는 실험을 하였다. 그리고 기존 연구들과 비교 분석한 결과 본 논문에서 찾은 특징 부분 집합으로 분류했을 때 가장 좋은 분류 정확도를 보임을 확인하였다.

Neighborhood 러프집합 모델을 활용한 유방 종양의 진단적 특징 선택 (A Diagnostic Feature Subset Selection of Breast Tumor Based on Neighborhood Rough Set Model)

  • 손창식;최락현;강원석;이종하
    • 한국산업정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.13-21
    • /
    • 2016
  • 특징선택은 데이터 마이닝, 기계학습 분야에서 가장 중요한 이슈 중 하나로, 원본 데이터에서 가장 좋은 분류 성능을 보여줄 수 있는 특징들을 찾아내는 방법이다. 본 논문에서는 정보 입자성을 기반으로 한 neighborhood 러프집합 모델을 이용한 특징선택 방법을 제안한다. 제안된 방법의 효과성은 5,252명의 유방 초음파 영상으로부터 추출된 298가지의 특징들 중에서 유방 종양의 진단과 관련된 유용한 특징들을 선택하는 문제에 적용되었다. 실험결과 19가지의 진단적 특징을 찾을 수 있었고, 이때에 평균 분류 정확성은 97.6%를 보였다.

Microblog User Geolocation by Extracting Local Words Based on Word Clustering and Wrapper Feature Selection

  • Tian, Hechan;Liu, Fenlin;Luo, Xiangyang;Zhang, Fan;Qiao, Yaqiong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.3972-3988
    • /
    • 2020
  • Existing methods always rely on statistical features to extract local words for microblog user geolocation. There are many non-local words in extracted words, which makes geolocation accuracy lower. Considering the statistical and semantic features of local words, this paper proposes a microblog user geolocation method by extracting local words based on word clustering and wrapper feature selection. First, ordinary words without positional indications are initially filtered based on statistical features. Second, a word clustering algorithm based on word vectors is proposed. The remaining semantically similar words are clustered together based on the distance of word vectors with semantic meanings. Next, a wrapper feature selection algorithm based on sequential backward subset search is proposed. The cluster subset with the best geolocation effect is selected. Words in selected cluster subset are extracted as local words. Finally, the Naive Bayes classifier is trained based on local words to geolocate the microblog user. The proposed method is validated based on two different types of microblog data - Twitter and Weibo. The results show that the proposed method outperforms existing two typical methods based on statistical features in terms of accuracy, precision, recall, and F1-score.

Subset Selection Procedures Based on Some Robust Estimators

  • Song, Moon-Sub;Chung, Han-Yeong;Bae, Wha-Soo
    • Journal of the Korean Statistical Society
    • /
    • 제11권2호
    • /
    • pp.109-117
    • /
    • 1982
  • In this paper, a preliminary study is performed on the subset selection procedures which are based on the trimmed means and the Hodges-Lehmann estimator derived from the Wilcoxon test. The proposed procedures are compared to the Gupta's rule through a small smaple Monte Carlo study. The results show that the procedures based on the robust estimators are successful in terms of efficiency and robustness.

  • PDF