• 제목/요약/키워드: Selection procedures

검색결과 488건 처리시간 0.031초

AutoFe-Sel: A Meta-learning based methodology for Recommending Feature Subset Selection Algorithms

  • Irfan Khan;Xianchao Zhang;Ramesh Kumar Ayyasam;Rahman Ali
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권7호
    • /
    • pp.1773-1793
    • /
    • 2023
  • Automated machine learning, often referred to as "AutoML," is the process of automating the time-consuming and iterative procedures that are associated with the building of machine learning models. There have been significant contributions in this area across a number of different stages of accomplishing a data-mining task, including model selection, hyper-parameter optimization, and preprocessing method selection. Among them, preprocessing method selection is a relatively new and fast growing research area. The current work is focused on the recommendation of preprocessing methods, i.e., feature subset selection (FSS) algorithms. One limitation in the existing studies regarding FSS algorithm recommendation is the use of a single learner for meta-modeling, which restricts its capabilities in the metamodeling. Moreover, the meta-modeling in the existing studies is typically based on a single group of data characterization measures (DCMs). Nonetheless, there are a number of complementary DCM groups, and their combination will allow them to leverage their diversity, resulting in improved meta-modeling. This study aims to address these limitations by proposing an architecture for preprocess method selection that uses ensemble learning for meta-modeling, namely AutoFE-Sel. To evaluate the proposed method, we performed an extensive experimental evaluation involving 8 FSS algorithms, 3 groups of DCMs, and 125 datasets. Results show that the proposed method achieves better performance compared to three baseline methods. The proposed architecture can also be easily extended to other preprocessing method selections, e.g., noise-filter selection and imbalance handling method selection.

ON THE SELECTION Of INPUT VARIABLES TO BE RETAINED IN A REDUCED_ORDER MODEL

  • Lee, Kun-Yong
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(I)
    • /
    • pp.198-200
    • /
    • 1987
  • This paper presents the choice of appropriate sets of input variables for large-scale linear multivariable systems. It is shown that the selection of a good set of input variables for control may become important when both strong and weak input variables are available. The transmission of information from the inputs to the outputs is investigated and appropriate scaling procedures to derive a scaled input matrix are proposed. Singular value decomposition methods facilitate the quantification of the systems excitation stemming from the various input variables, and thus the selection of an appropriately strong and orthogonal set of input variables. The need for and the implementation and benefits of reducing the number of input variables are illustrated by a large-scale steam generator model of a real process.

  • PDF

CBM+ 적용을 위한 설계초기단계 센서선정 추론 연구 (A Study of Sensor Reasoning for the CBM+ Application in the Early Design Stage)

  • 신백천;허장욱
    • 시스템엔지니어링학술지
    • /
    • 제18권1호
    • /
    • pp.84-89
    • /
    • 2022
  • For system maintenance optimization, it is necessary to establish a state information system by CBM+ including CBM and RCM, and sensor selection for CBM+ application requires system process for function model analysis at the early design stage. The study investigated the contents of CBM and CBM+, analyzed the function analysis tasks and procedures of the system, and thus presented a D-FMEA based sensor selection inference methodology at the early stage of design for CBM+ application, and established it as a D-FMEA based sensor selection inference process. The D-FMEA-based sensor inference methodology and procedure in the early design stage were presented for diesel engine sub assembly.

교육용 기록정보콘텐츠 개발 절차에 관한 연구 (A Study on developing procedures of an archival contents for education)

  • 이은영
    • 기록학연구
    • /
    • 제29호
    • /
    • pp.129-173
    • /
    • 2011
  • 교육과정에 기반한 교육용 기록정보콘텐츠는 역사적 사고력 함양에 가장 효과적인 교수 학습 도구라 할 수 있다. 본 논문은 교육용 기록정보콘텐츠의 개발 방법론을 제안함으로써 국립 기관인 국가기록원이 본격적인 교육용 기록정보콘텐츠 서비스를 제공함에 있어 이론적 지침이 되고자 하였다. 본 논문에서 제안한 교육용 기록정보콘텐츠의 개발 절차는 e-러닝 콘텐츠의 개발 단계인 '기획-분석-설계-개발-평가'의 단계를 거친다. 구체적으로는 교육용 기록정보콘텐츠로서의 특성을 띤 교육과정 분석과 컬렉션 분석, 교수 학습 목표를 효과적으로 달성할 수 있는 구조화된 형태로 설계하기 위한 세부 단계를 거친다. 교육과정 분석에선 일차 사료를 활용한 학습이 가능한 주제 항목을 설정하고 이를 검색을 위한 키워드로 도출하는 절차와 일차 사료별 교수 학습 활동에 적용할 수 있는 교수 학습 방법을 분석하였다. 컬렉션 분석에선 키워드별로 기록 검색을 실시한 뒤 일차 사료의 선별 기준에 따라 최종적인 기록을 선정하는 과정을 제안하였다. 분석의 결과를 토대로 설계 단계에서는 콘텐츠의 제목 및 내용 구조를 결정하고, 학습 흐름도를 기반으로 스토리보드를 작성하여야 한다. 개발 시엔 일차 사료의 질감을 원본에 최대한 가깝게 제작하는 것이 핵심이며, 평가 단계에선 콘텐츠의 교수 학습 내용이 학습 목표를 효과적으로 성취할 수 있도록 개발되었는지를 평가하고 실제 콘텐츠 서비스 운영 후 이용자 만족도 조사에 의한 평가 결과를 새로운 콘텐츠 개발이나 콘텐츠 업데이트에 반영하도록 하였다.

학습근로자의 학업성취도에 미치는 영향 (Factors Influencing the Academic Achievement of Student Workers)

  • 명재규
    • 실천공학교육논문지
    • /
    • 제16권2호
    • /
    • pp.227-239
    • /
    • 2024
  • 본 연구는 학위연계형 일학습병행제를 통해 직업능력향상을 위한 교육훈련을 받고 있는 학습근로자의 학습성과에 미치는 영향을 분석하기 위해 대학 학위과정 입학과 선발 단계에서 고려할 수 있는 다양한 요인들과 입학 이후 대학의 평점평균점수와의 인과관계를 찾아보는데 그 목적이 있다. 이를 위하여 국내 K대학교의 학위연계형 일학습병행제의 모델인 일학습병행대학의 3개 학부과정생 976명의 역사적 입학자료와 평점평균자료를 통해 회귀분석과 분산분석을 진행했다. 분석의 질을 확보하기 위하여 추가로 공개된 기업정보 데이터베이스에서 학습근로자의 학점에 영향을 미칠 것으로 추정되는 기업정보를 포함했다. 분석 결과 출신고등학교의 분류, 성별, 가정환경요소, 고등학교 교과목별 등급, 회사의 재직기간, 입학당시의 연령 등 다양한 요소에서 유의미한 인과관계를 찾을 수 있었으며 이를 바탕으로 동일한 학위과정을 운용하는 대학에서는 학습근로자 선발절차의 업그레이드를 할 수 있으리라 기대한다. 추가로 본 연구결과는 향후 학위연계형 일학습병행제의 정책적 제언을 위한 기초자료로 활용될 수 있을 것이다.

패밀리 레스토랑 및 패스트푸드 레스토랑의 선택속성과 대학생 고객이 지각한 만족도에 관한 연구 (Research on selection attribution and customer satisfaction by family restaurants and fast-food restaurants)

  • 손일락
    • 한국산학기술학회논문지
    • /
    • 제10권10호
    • /
    • pp.2864-2872
    • /
    • 2009
  • 본 연구는 다음과 같이 진행된다. 첫째, 청주지역 대학생들이 지각하는 패밀리 레스토랑과 패스트푸드 레스토랑의 선택속성을 살펴본다. 둘째, 청주지역 대학생들이 레스토랑 이용 후 지각하는 패밀리 레스토랑과 패스트푸드 레스토랑의 만족도를 조사한다. 셋째, 패밀리 레스토랑과 패스트푸드 레스토랑의 선택속성에 대해 요인분석을 실시, 어떠한 선택속성 요인이 만족도에 유의한 영향을 미치는지 가설검증을 실시한다. 연구가설은 다음과 같다. HI: 패밀리 레스토랑의 선택속성요인은 고객의 만족도에 유의한 영향을 미칠 것이다. H2: 패스트푸드 레스토랑의 선택속성요인은 고객의 만족도에 유의한 영향을 미칠 것이다. 가설 검증 결과 가설 1, 2는 모두 부분적으로 채택되었다. 본 연구 결과를 통하여 패밀리 레스토랑과 패스트푸드 레스토랑 경영자들은 마케팅적 시사점을 얻을 수 있을 것으로 기대되며, 극심한 경쟁환경을 극복할 대안을 탐색하고, 후속연구를 위한 기초자료를 획득할 수 있을 것으로 판단된다.

설명책임정보 선별 및 관리기준 수립의 절차와 방법 (The Procedures and Methods for Selecting and Establishing Control Criteria for Accountability Information)

  • 임진희;전용호
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.145-168
    • /
    • 2009
  • 공공설명책임성(Public Accountability) 관계를 유지하는 기본은 국민대중이 공공기관의 정보에 접근할 수 있도록 하는 공적 권리이다. 우리나라의 공공기관은 다양한 공공설명책임성 관계 속에 견제를 받고 있으며, 설명책임을 묻기 위해 공공기관에 정보 제공을 요청하는 이해당사자들의 요구는 지속적으로 증가하고 있다. 기관이 공공설명책임성을 효과적이고 효율적으로 완수하기 위해서는 정보관리 체계를 설명책임 지향의 설정(Accountability-oriented setting)으로 정비하는 것이 요구된다. 이 연구에서는 (1) 기관이 설명책임을 완수하기 위해 이해당사자들에게 제공할 '설명책임정보'를 기관의 중요 관리대상 정보로 선별하는 절차와 방법을 제시하고, (2) 선별된 설명책임정보를 설명책임 관계에 적합하도록 관리하기 위한 기준을 수립하는 절차와 방법을 제시하고 있다. 또한, (3) 제시한 각 절차와 방법을 대학의 정보공시 맥락에 적용하여 예시를 보여주고 있다. 이 연구에서 제시된 절차와 방법은 설명책임정보의 관리체계 수립을 위한 컨설팅의 관점에서 기술되었다.

Multivariate Procedure for Variable Selection and Classification of High Dimensional Heterogeneous Data

  • Mehmood, Tahir;Rasheed, Zahid
    • Communications for Statistical Applications and Methods
    • /
    • 제22권6호
    • /
    • pp.575-587
    • /
    • 2015
  • The development in data collection techniques results in high dimensional data sets, where discrimination is an important and commonly encountered problem that are crucial to resolve when high dimensional data is heterogeneous (non-common variance covariance structure for classes). An example of this is to classify microbial habitat preferences based on codon/bi-codon usage. Habitat preference is important to study for evolutionary genetic relationships and may help industry produce specific enzymes. Most classification procedures assume homogeneity (common variance covariance structure for all classes), which is not guaranteed in most high dimensional data sets. We have introduced regularized elimination in partial least square coupled with QDA (rePLS-QDA) for the parsimonious variable selection and classification of high dimensional heterogeneous data sets based on recently introduced regularized elimination for variable selection in partial least square (rePLS) and heterogeneous classification procedure quadratic discriminant analysis (QDA). A comparison of proposed and existing methods is conducted over the simulated data set; in addition, the proposed procedure is implemented to classify microbial habitat preferences by their codon/bi-codon usage. Five bacterial habitats (Aquatic, Host Associated, Multiple, Specialized and Terrestrial) are modeled. The classification accuracy of each habitat is satisfactory and ranges from 89.1% to 100% on test data. Interesting codon/bi-codons usage, their mutual interactions influential for respective habitat preference are identified. The proposed method also produced results that concurred with known biological characteristics that will help researchers better understand divergence of species.

최고의 정규 모집단을 뽑기 위한 부분집합선택절차론의 운용특성에 관한 연구 (Operating characteristics of a subset selection procedure for selecting the best normal population with common unknown variance)

  • 손중권
    • 응용통계연구
    • /
    • 제3권1호
    • /
    • pp.59-78
    • /
    • 1990
  • 지난 30여년간 급격히 발전해 온 다중결정이론 중 부분집합선택론은 매우 중요한 위치를 차지하고 있다. 특히 여러가지 형태의 부분집합선택절차론 중에서 최초로 소개된 Gupta형 선택절차론은 모든 절차론들의 기본이 되어 오고 있음으로 그 중요성은 널리 인식되고 있다. 더우기 응용부문에 있어서도 가장 많이 사용되고 있는 선택절차론들 중의 하나이기도 하다. 따라서 Gupta형 선책절차론에 대한 일반적인 성질들도 많이 규명되어 왔다. 특히 결정론적 측면에서나 베이스 이론적 측면에서의 최적성 및 점근적 효율성에 있어서는 Gupta와 Hsu(1978), Bj$\phi$rnstad(1980), 그리고 Bickel과 Yahav(1982)가 성질 들을 규명내지는 다른 형의 부분집합선택절차론들과 특정분포에 대해 비교 검토하였다. 또한 수집된 자료가 선택절차론의 근본 가정들을 위반할 경우가 실제로 다반사로 일어난다. 따라서 근본가정이 위배될 경우 선택절차론의 강건력에 대해서도 연구가 부분적으로 진행되었다. Gupta형 선택절차론과 중앙값 선택절차론과의 비교도 Gupta와 Singh(1980)과 Sohn(1985)에 의해 진행되었으며, 특히 스피리지 배치에서 점근적 효율성을 연구하였다. 하지만 부분집합선택절차론이 차지하는 중요성에 비해 그 자체에 대한 여러 측면에 있어서의 성질 및 운용특성에 대한 포괄적이고 일반적인 연구는 미흡한 편이다.

  • PDF

Challenges of Recruitment and Selection Process of Librarians in Federal University Libraries in South-South, Nigeria

  • Ufuoma, Eruvwe;Omekwu, Charles Obiora
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제12권2호
    • /
    • pp.29-40
    • /
    • 2022
  • The study investigated the challenges of recruitment and selection process of librarians in federal university libraries in South-South, Nigeria. The study adopted a descriptive survey. The population of the study consists of 108 librarians. 95 copies of the questionnaire were filled and returned. The questionnaire was used in collecting data. The overall reliability of the instrument yielded 0.95 with the use of Cronbach Alpha Coefficient. Standard deviation and mean was used to generate the data that was gathered. The rating scale of 4 points was subjected to an estimation procedure using SPSS version 17.0. A mean score of 2.5 and above on any item was accepted. The findings revealed that the librarians identified the challenges to include ethnicity influence; favouritisms; recruitment based on godfatherism; dwindling budgetary allocation. The librarians also identified some of the strategies to include performance at interview as benchmark; equity and fairness as benchmark; recruitment should be done according to relevant discipline; and having channels for reporting cases of corruption during recruitment. Based on the above findings the study recommended among others that recruitment and selection of qualified librarians should be done according to the laid down procedures.