• 제목/요약/키워드: Subset selection

검색결과 203건 처리시간 0.024초

Subset Selection Procedures for Weibull Populations

  • 김우철;최지훈;김동기
    • 품질경영학회지
    • /
    • 제11권2호
    • /
    • pp.18-24
    • /
    • 1983
  • 본 논문에서는 합동 추정방법을 이용하여, 형상모수가 마지인 다수의 와이블 분포중에서 최소의 척도 모수를 갖는 분포의 선택방법에 관해 연구하였다. 제안된 선택방법의 실용화를 위한 수표를 작성하고, 기존방법과의 효율성올 비교 함으로써, 제안된 방법이 효율적임을 밝혔다. 또한 형상모수가기지인 경우의 선택방법에 대하여 고찰하였다.

  • PDF

Detection and quantification of structural damage under ambient vibration environment

  • Yun, Gun Jin
    • Structural Engineering and Mechanics
    • /
    • 제42권3호
    • /
    • pp.425-448
    • /
    • 2012
  • In this paper, a new damage detection and quantification method has been presented to perform detection and quantification of structural damage under ambient vibration loadings. To extract modal properties of the structural system under ambient excitation, natural excitation technique (NExT) and eigensystem realization algorithm (ERA) are employed. Sensitivity matrices of the dynamic residual force vector have been derived and used in the parameter subset selection method to identify multiple damaged locations. In the sequel, the steady state genetic algorithm (SSGA) is used to determine quantified levels of the identified damage by minimizing errors in the modal flexibility matrix. In this study, performance of the proposed damage detection and quantification methodology is evaluated using a finite element model of a truss structure with considerations of possible experimental errors and noises. A series of numerical examples with five different damage scenarios including a challengingly small damage level demonstrates that the proposed methodology can efficaciously detect and quantify damage under noisy ambient vibrations.

Nonparametric Selection Procedures and Their Efficiency Comparisons

  • Sohn, Joong-K.;Shanti S.Gupta;Kim, Heon-Joo
    • Communications for Statistical Applications and Methods
    • /
    • 제1권1호
    • /
    • pp.41-51
    • /
    • 1994
  • We consider nonparametric procedures for the selection and ranking problems. Tukey's generalized lambda distribution is condidered as the distribution for the score function because the distribution can approximate many well-known contionuous distributions. Also we compare these procedures in terms of efficiency, defined by the ratio of a probability of a correct selection divided by the expected selected subset size.

  • PDF

분산이 미지인 정규모집단의 평균에 대한 베이즈-P* 선택방법에 관한 연구+ (A Bayes-P* Selection Procedure for Normal Means with Common Unknown Variance+)

  • 김우철;전종우;한경수
    • 응용통계연구
    • /
    • 제3권2호
    • /
    • pp.79-89
    • /
    • 1990
  • 정규분포를 가정한 통상적인 일원배치모형에서 모평균들을 비교하는 부분집합 선택방법으로서 베이즈-$P^*$ 선택방법을 제시하고 기존의 방법과의 관계를 알아보고, 그 운용특성에 대한 모의실험의 결과를 고찰하였다.

  • PDF

다중선형회귀모형에서의 변수선택기법 평가 (Evaluating Variable Selection Techniques for Multivariate Linear Regression)

  • 류나현;김형석;강필성
    • 대한산업공학회지
    • /
    • 제42권5호
    • /
    • pp.314-326
    • /
    • 2016
  • The purpose of variable selection techniques is to select a subset of relevant variables for a particular learning algorithm in order to improve the accuracy of prediction model and improve the efficiency of the model. We conduct an empirical analysis to evaluate and compare seven well-known variable selection techniques for multiple linear regression model, which is one of the most commonly used regression model in practice. The variable selection techniques we apply are forward selection, backward elimination, stepwise selection, genetic algorithm (GA), ridge regression, lasso (Least Absolute Shrinkage and Selection Operator) and elastic net. Based on the experiment with 49 regression data sets, it is found that GA resulted in the lowest error rates while lasso most significantly reduces the number of variables. In terms of computational efficiency, forward/backward elimination and lasso requires less time than the other techniques.

최상부분집합이 고려된 능형회귀를 적용한 현장관입지수에 대한 통계적 예측기법 개발 및 적용 (Development and implementation of statistical prediction procedure for field penetration index using ridge regression with best subset selection)

  • 이항로;송기일;김경열
    • 한국터널지하공간학회 논문집
    • /
    • 제19권6호
    • /
    • pp.857-870
    • /
    • 2017
  • 사회기반시설의 지중화로 인하여 쉴드 TBM 적용이 점차 확대되고 있는 추세다. 합리적인 공기기간 및 공사비 산정을 위해 쉴드 TBM의 실굴진율을 정확하게 예측하는 것은 매우 중요한 사안이라 할 수 있다. 이러한 이유로 국내에서는 지반의 물성을 합리적으로 반영한 쉴드 TBM의 실굴진율 예측모델이 필요한 상황이다. 본 연구는 쉴드 TBM의 순굴진율 산정을 위해 현장 데이터베이스를 기반으로 현장관입지수의 통계적 예측절차를 모듈화 하였다. 출력인자로 현장관입지수를 선정하였고, 비정상치 제거 및 전처리 그리고 최상 부분집합선택이 고려된 능형회귀를 적용한 예측시스템을 모듈에 포함하였다. 또한 현장 굴진 데이터를 활용하여 예측모델의 적용성을 확인하였다.

Comparison of Feature Selection Processes for Image Retrieval Applications

  • Choi, Young-Mee;Choo, Moon-Won
    • 한국멀티미디어학회논문지
    • /
    • 제14권12호
    • /
    • pp.1544-1548
    • /
    • 2011
  • A process of choosing a subset of original features, so called feature selection, is considered as a crucial preprocessing step to image processing applications. There are already large pools of techniques developed for machine learning and data mining fields. In this paper, basically two methods, non-feature selection and feature selection, are investigated to compare their predictive effectiveness of classification. Color co-occurrence feature is used for defining image features. Standard Sequential Forward Selection algorithm are used for feature selection to identify relevant features and redundancy among relevant features. Four color spaces, RGB, YCbCr, HSV, and Gaussian space are considered for computing color co-occurrence features. Gray-level image feature is also considered for the performance comparison reasons. The experimental results are presented.

머신러닝 기반 사회인구학적 특징을 이용한 고혈압 예측모델 (Prediction Model of Hypertension Using Sociodemographic Characteristics Based on Machine Learning)

  • 이범주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.541-546
    • /
    • 2021
  • 최근 전 세계적으로 인공지능과 머신러닝을 기반으로 임상정보를 활용한 다양한 고혈압 식별 및 예측 모델이 개발되고 있다. 그러나 고혈압 관련 모델에 대한 대부분의 선행연구는 침습적 및 고가의 분석비용을 통한 변수들이 대부분 사용되었고, 인종과 국가의 특징에 대한 고려가 충분히 제시되지 않았다. 따라서 이 연구의 목적은 일반적인 사회인구 통계학적 변수만을 사용하여 쉽게 이해할 수 있는 한국인 성인 고혈압 예측 모델을 제시하는 것이다. 이 연구에서 사용된 데이터는 질병관리청 국민건강영양조사 (2018년)를 이용하였다. 남성에서, wrapper-based feature subset selection 메소드와 naive Bayes를 이용한 모델이 가장 높은 예측 성능 (ROC = 0.790, kappa = 0.396)을 보였다. 여성의 경우, correlation-based feature subset selection 메소드와 naive Bayes를 사용한 모델이 가장 높은 예측 성능(ROC = 0.850, kappa = 0.495)을 나타내었다. 또한 모든 모델들에서 사회인구 통계학적 변수들만을 이용한 고혈압의 예측 성능이 남성보다 여성에게서 더 높게 나타나는 것을 발견하였다. 본 연구의 결과인 machine learning 기반 고혈압 예측 모델은 한국인에 대한 단순한 사회인구학적 특성만을 사용하였기 때문에 향후 공중 보건 및 역학 분야에서 쉽게 사용될 수 있을 것으로 예상된다.

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

An Improved Sample Balanced Genetic Algorithm and Extreme Learning Machine for Accurate Alzheimer Disease Diagnosis

  • Sachnev, Vasily;Suresh, Sundaram
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.118-127
    • /
    • 2016
  • An improved sample balanced genetic algorithm and Extreme Learning Machine (iSBGA-ELM) was designed for accurate diagnosis of Alzheimer disease (AD) and identification of biomarkers associated with AD in this paper. The proposed AD diagnosis approach uses a set of magnetic resonance imaging scans in Open Access Series of Imaging Studies (OASIS) public database to build an efficient AD classifier. The approach contains two steps: "voxels selection" based on an iSBGA and "AD classification" based on the ELM. In the first step, the proposed iSBGA searches for a robust subset of voxels with promising properties for further AD diagnosis. The robust subset of voxels chosen by iSBGA is then used to build an AD classifier based on the ELM. A robust subset of voxels keeps a high generalization performance of AD classification in various scenarios and highlights the importance of the chosen voxels for AD research. The AD classifier with maximum classification accuracy is created using an optimal subset of robust voxels. It represents the final AD diagnosis approach. Experiments with the proposed iSBGA-ELM using OASIS data set showed an average testing accuracy of 87%. Experiments clearly indicated the proposed iSBGA-ELM was efficient for AD diagnosis. It showed improvements over existing techniques.