• Title/Summary/Keyword: Subset selection

검색결과 203건 처리시간 0.03초

On a Subset Selection Procedure Based on Hodges-Lehmann Estimators

  • Song, Moon-Sup;Kim, Soon-Ock
    • Journal of the Korean Statistical Society
    • /
    • 제16권1호
    • /
    • pp.26-36
    • /
    • 1987
  • In this paper, we study on a subset selection procedure based on Hodges-Lehmann estimators derived from the Wilcoxon test. To estimate the standard error of the Hodges-Lehmann estimators, the biweight A-estimator of scale is used. The Pitman efficiency of the proposed rule is compared with the Gupta's rule and the trimmed-means rule through a small-sample Monte Carlo study. The results show that the proposed rule satisfies the $P^*$-condition and is very efficient in various heavy-tailed distributions.

  • PDF

구조손상 탐색을 위한 부 집합 선택에 의한 정규화 방법 (Regularization Method by Subset Selection for Structural Damage Detection)

  • 윤군진;한봉구
    • 한국전산구조공학회논문집
    • /
    • 제21권1호
    • /
    • pp.73-82
    • /
    • 2008
  • 본 논문에서는 구조손상 탐색을 위해 매개변수 부 집합 선택에 의한 새로운 정규화 방법을 제안하였다. Residual function을 위해 동적 residual force 벡터를 이용하였다. 과거에는 Residual function으로서 기본 동적 특성치(고유치와 고유모드)를 이용하여 단일구조손상은 탐색할 수 있었지만 다중구조손상 위치를 탐색하기에는 한계가 있었을 뿐 아니라 고유모드와 고유치의 상이한 기여도 때문에 가중치를 적용해야 하는 어려움이 있었다. 본 논문에서 제안된 방법은 고유모드의 불완전한 계측을 보완하기 위하여 모델 확장법을 적용하였다. 제안된 구조손상 탐색법은 다중구조손상 위치를 동시에 찾아 낼 수 있는 장점을 가지고 있다. 2차원 평면 트러스 구조를 이용하여 제안된 방법의 효용성을 검증하였다.

Variable Selection in Linear Random Effects Models for Normal Data

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제27권4호
    • /
    • pp.407-420
    • /
    • 1998
  • This paper is concerned with selecting covariates to be included in building linear random effects models designed to analyze clustered response normal data. It is based on a Bayesian approach, intended to propose and develop a procedure that uses probabilistic considerations for selecting premising subsets of covariates. The approach reformulates the linear random effects model in a hierarchical normal and point mass mixture model by introducing a set of latent variables that will be used to identify subset choices. The hierarchical model is flexible to easily accommodate sign constraints in the number of regression coefficients. Utilizing Gibbs sampler, the appropriate posterior probability of each subset of covariates is obtained. Thus, In this procedure, the most promising subset of covariates can be identified as that with highest posterior probability. The procedure is illustrated through a simulation study.

  • PDF

표본크기가 다른 정규모집단의 평균에 대한 부분집합선택절차론의 성질과 비교연구 (Comparisons of some subset selection procedures for K normal populations with unequal sample size)

  • 손중권;김소연;김영훈
    • 응용통계연구
    • /
    • 제3권1호
    • /
    • pp.79-87
    • /
    • 1990
  • 표본의 크기가 동일하지 않으면서 등분산이 기지 또는 미지인 경우 k개의 정규모집단의 평균에 대한 부분집합선택절차론은 여러 사람들에 연구되었으나 제안된 부분집합선택절차들의 성질과 효율성을 비교한 결과가 미흡하다. 본 고에서는 제안된 특성을 조사하고 여러 가지 형태에서 효율성을 비교하였다.

  • PDF

Feature Selection Algorithm for Intrusions Detection System using Sequential Forward Search and Random Forest Classifier

  • Lee, Jinlee;Park, Dooho;Lee, Changhoon
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.5132-5148
    • /
    • 2017
  • Cyber attacks are evolving commensurate with recent developments in information security technology. Intrusion detection systems collect various types of data from computers and networks to detect security threats and analyze the attack information. The large amount of data examined make the large number of computations and low detection rates problematic. Feature selection is expected to improve the classification performance and provide faster and more cost-effective results. Despite the various feature selection studies conducted for intrusion detection systems, it is difficult to automate feature selection because it is based on the knowledge of security experts. This paper proposes a feature selection technique to overcome the performance problems of intrusion detection systems. Focusing on feature selection, the first phase of the proposed system aims at constructing a feature subset using a sequential forward floating search (SFFS) to downsize the dimension of the variables. The second phase constructs a classification model with the selected feature subset using a random forest classifier (RFC) and evaluates the classification accuracy. Experiments were conducted with the NSL-KDD dataset using SFFS-RF, and the results indicated that feature selection techniques are a necessary preprocessing step to improve the overall system performance in systems that handle large datasets. They also verified that SFFS-RF could be used for data classification. In conclusion, SFFS-RF could be the key to improving the classification model performance in machine learning.

단변량 분석과 LVF 알고리즘을 결합한 하이브리드 속성선정 방법 (A Hybrid Feature Selection Method using Univariate Analysis and LVF Algorithm)

  • 이재식;정미경
    • 지능정보연구
    • /
    • 제14권4호
    • /
    • pp.179-200
    • /
    • 2008
  • 본 연구에서는 사례기반 추론 기법을 대상으로 효율성과 효과성을 함께 증진시킬 수 있는 속성선정 방법을 개발하였다. 기본적으로, 본 연구에서 개발한 속성선정 방법은 기존에 개발된 단변량 분석 방법과 LVF 알고리즘을 통합하는 것이다. 먼저, 단변량 분석 방법 중 선택효과를 사용하여 전체 속성 중에서 예측력이 우수하다고 판단되는 일부분의 속성들을 추려낸다. 이 속성들로부터 생성해낼 수 있는 모든 가능한 부분집합을 생성해낸 후에, LVF 알고리즘을 이용하여 이 부분집합들이 가지는 불일치 비율을 평가함으로써 최종적으로 속성 부분집합을 선정한다. 본 연구에서 개발한 속성선정 방법을 UCI에서 제공하는 데이터 집합들에 적용하여 성능을 측정한 후, 기존 기법의 성능들과 비교한 결과, 본 연구에서 개발된 속성선정 방법이 선정된 속성의 개수도 만족할만하고 적중률도 향상되어서, 효율성과 효과성 모두의 측면에서 우수함을 보였다.

  • PDF

AMC와 MIMO 선택 기법이 결합된 통신 시스템의 설계 및 성능 분석 (Design and Performance Analysis of a Communication System with AMC and MIMO Mode Selection Scheme)

  • 이정환;윤길상;조인식;서창우;셰를리;황인태
    • 대한전자공학회논문지TC
    • /
    • 제47권3호
    • /
    • pp.22-30
    • /
    • 2010
  • 본 논문은 AMC(Adaptive Modulation and Coding)와 MIMO(Multiple Input Multiple Output)를 결합하여 전송률 및 전송 신뢰도 향상을 가져오는 통신 시스템을 구현한다. 또한 Precoding과 Antenna Subset Selection을 효율적으로 적용하고 MIMO 선택 기법을 결합하여, 최종적으로 AMC와 MIMO 선택 기법이 결합된 통신 시스템을 설계하고 성능을 분석한다. 모의 실험 환경은 안테나 간 상관성이 존재하지 않는 주파수비 선택적 레일리 페이딩 채널을 고려하였으며, 확산인자는 16을 적용하였다. 그 외의 여러 모의 실험 환경은 HSDPA(High Speed Downlink Packet Access) 표준에 근거하여 구성하도록 노력하였다. 본 논문에서 제안한 "AMC와 MIMO 선택 기볍이 결합된 시스템"은 기존의 "AMC와 각 MIMO의 결합 시스템들" 보다 높은 보여주었으며, 열악한 채널 환경에서도 안정적인 전송률을 확보해 주었다. 제안된 시스템은 약 8dB에서 최대 전송률을 나타내었으며, 제안된 시스템과 동일한 최대 전송률올 갖눈 기종의 "AMC와 D-STTD $4{\times}2$ 결합 시스템"과 비교하였을 때 약 6dB 정도 먼저 최대 전송률을 나타냈다. 또한 최대 전송률에 이르기 전까지 거의 모든 SNR(Signal to Noise Ratio)서 기존의 시스템보다 약 2배 정도 높은 전송률을 보였다. 구체적으로 SNR이 2dB인 지점에서 기존의 시스템은 약 2.5Mbps의 전송률을 나타냈으며, 제안된 시스템은 그 2배가 넘는 약 6.4MBps의 전송률을 나타냈다. 또한 SNR이 2dB인 지점에서는 각각 약 7.5Mbps와 15.3Mbps의 전송률을 나타내어 역시 2배에 가까운 차이가 나는 것을 확인할 수 있었다. 제안된 시스템은 AMC 기법을 사용하는 주 목적인 전송률의 향상에 크게 기여하였으며, 특히 평균 전송률의 향상에 효과적임을 확인하였다.

On a Robust Subset Selection Procedure for the Slopes of Regression Equations

  • Song, Moon-Sup;Oh, Chang-Hyuck
    • Journal of the Korean Statistical Society
    • /
    • 제10권
    • /
    • pp.105-121
    • /
    • 1981
  • The problem of selection of a subset containing the largest of several slope parameters of regression equations is considered. The proposed selection procedure is based on the weighted median estimators for regression parameters and the median of rescaled absolute residuals for scale parameters. Those estimators are compared with the classical least squares estimators by a simulation study. A Monte Carlo comparison is also made between the new procedure based on the weighted median estiamtors and the procedure based on the least squares estimators. The results show that the proposed procedure is quite robust with respect to the heaviness of distribution tails.

  • PDF

A Bayesian Method for Narrowing the Scope fo Variable Selection in Binary Response t-Link Regression

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제29권4호
    • /
    • pp.407-422
    • /
    • 2000
  • This article is concerned with the selecting predictor variables to be included in building a class of binary response t-link regression models where both probit and logistic regression models can e approximately taken as members of the class. It is based on a modification of the stochastic search variable selection method(SSVS), intended to propose and develop a Bayesian procedure that used probabilistic considerations for selecting promising subsets of predictor variables. The procedure reformulates the binary response t-link regression setup in a hierarchical truncated normal mixture model by introducing a set of hyperparameters that will be used to identify subset choices. In this setup, the most promising subset of predictors can be identified as that with highest posterior probability in the marginal posterior distribution of the hyperparameters. To highlight the merit of the procedure, an illustrative numerical example is given.

  • PDF

의미 기반 유전 알고리즘을 사용한 특징 선택 (Semantic-based Genetic Algorithm for Feature Selection)

  • 김정호;인주호;채수환
    • 인터넷정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-10
    • /
    • 2012
  • 본 논문은 문서 분류의 전처리 단계인 특징 선택을 위해 의미를 고려한 최적의 특징 선택 방법을 제안한다. 특징 선택은 불필요한 특징을 제거하고 분류에 필요한 특징을 추출하는 작업으로 분류 작업에서 매우 중요한 역할을 한다. 특징 선택 기법으로 특징의 의미를 파악하여 특징을 선택하는 LSA(Latent Semantic Analysis) 기법을 사용하지만 기본 LSA는 분류 작업에 특성화 된 기법이 아니므로 지도적 학습을 통해 분류에 적합하도록 개선된 지도적 LSA를 사용한다. 지도적 LSA를 통해 선택된 특징들로부터 최적화 기법인 유전 알고리즘을 사용하여 더 최적의 특징들을 추출한다. 마지막으로, 추출한 특징들로 분류할 문서를 표현하고 SVM (Support Vector Machine)을 이용한 특정 분류기를 사용하여 분류를 수행하였다. 지도적 LSA를 통해 의미를 고려하고 유전 알고리즘을 통해 최적의 특징 집합을 찾음으로써 높은 분류 성능과 효율성을 보일 것이라 가정하였다. 인터넷 뉴스 기사를 대상으로 분류 실험을 수행한 결과 적은 수의 특징들로 높은 분류 성능을 확인할 수 있었다.