• Title/Summary/Keyword: 변수 중요도

Search Result 4,988, Processing Time 0.03 seconds

Correlated variable importance for random forests (랜덤포레스트를 위한 상관예측변수 중요도)

  • Shin, Seung Beom;Cho, Hyung Jun
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.177-190
    • /
    • 2021
  • Random forests is a popular method that improves the instability and accuracy of decision trees by ensembles. In contrast to increasing the accuracy, the ease of interpretation is sacrificed; hence, to compensate for this, variable importance is provided. The variable importance indicates which variable plays a role more importantly in constructing the random forests. However, when a predictor is correlated with other predictors, the variable importance of the existing importance algorithm may be distorted. The downward bias of correlated predictors may reduce the importance of truly important predictors. We propose a new algorithm remedying the downward bias of correlated predictors. The performance of the proposed algorithm is demonstrated by the simulated data and illustrated by the real data.

Comparison of Variable Importance Measures in Tree-based Classification (나무구조의 분류분석에서 변수 중요도에 대한 고찰)

  • Kim, Na-Young;Lee, Eun-Kyung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.5
    • /
    • pp.717-729
    • /
    • 2014
  • Projection pursuit classification tree uses a 1-dimensional projection with the view of the most separating classes in each node. These projection coefficients contain information distinguishing two groups of classes from each other and can be used to calculate the importance measure of classification in each variable. This paper reviews the variable importance measure with increasing interest in line with growing data size. We compared the performances of projection pursuit classification tree with those of classification and regression tree(CART) and random forest. Projection pursuit classification tree are found to produce better performance in most cases, particularly with highly correlated variables. The importance measure of projection pursuit classification tree performs slightly better than the importance measure of random forest.

Evaluation of Uncertainty Importance Measure for Monotonic Function (단조함수에 대한 불확실성 중요도 측도의 평가)

  • Cho, Jae-Gyeun
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.15 no.5
    • /
    • pp.179-185
    • /
    • 2010
  • In a sensitivity analysis, an uncertainty importance measure is often used to assess how much uncertainty of an output is attributable to the uncertainty of an input, and thus, to identify those inputs whose uncertainties need to be reduced to effectively reduce the uncertainty of output. A function is called monotonic if the output is either increasing or decreasing with respect to any of the inputs. In this paper, for a monotonic function, we propose a method for evaluating the measure which assesses the expected percentage reduction in the variance of output due to ascertaining the value of input. The proposed method can be applied to the case that the output is expressed as linear and nonlinear monotonic functions of inputs, and that the input follows symmetric and asymmetric distributions. In addition, the proposed method provides a stable uncertainty importance of each input by discretizing the distribution of input to the discrete distribution. However, the proposed method is computationally demanding since it is based on Monte Carlo simulation.

Adaptive Importance Sampling Method with Response Surface Technique (응답면기법을 이용한 적응적 중요표본추출법)

  • 나경웅;김상효;이상호
    • Computational Structural Engineering
    • /
    • v.11 no.4
    • /
    • pp.309-320
    • /
    • 1998
  • 중요표본추출기법중에서도 층화표본추출법을 이용한 적응적 중요표본추출기법이 일반적으로 가장 합리적인 것으로 알려져 있다. 그러나 확률장 유한요소모형문제와 같이 기본 확률변수의 규모가 큰 경우에는 층화표본추출법에서 요구되는 기본적인 표본점의 규모가 급증하여 효율성이 떨어지게 된다. 본 연구에서는 이러한 한계성을 극복하기 위하여 층화표본추출에서 기본확률변수를 사용하는 대신에 기본확률변수들의 함수이며 새로운 확률변수인 응답값을 이용하는 방법을 개발하였다. 여기에서 응답값은 일반적인 함수형태로 표시되지 않으며, 한 번의 응답계산에 많은 계산량이 소요되므로 이러한 문제점을 해결하기 위하여 응답면식을 이용한 층화표본추출법을 개발하였다. 개발된 기법에서는 기본확률변수의 모의발생규모는 기본의 기본확률변수를 이용한 층화표본추출법에서 보다 증가하지만 매우 많은 계산량을 요구하는 실제응답해석규모는 응답면식을 이용함으로써 획기적으로 감소되었다. 특히 본 기법은 기본확률변수의 규모가 크고 대상한계상태의 파괴확률이 낮을수록 기존의 방법과 비교해 효율성이 증대되는 것으로 분석되었다.

  • PDF

A Comparative Study on the Methodology of Failure Detection of Reefer Containers Using PCA and Feature Importance (PCA 및 변수 중요도를 활용한 냉동컨테이너 고장 탐지 방법론 비교 연구)

  • Lee, Seunghyun;Park, Sungho;Lee, Seungjae;Lee, Huiwon;Yu, Sungyeol;Lee, Kangbae
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.3
    • /
    • pp.23-31
    • /
    • 2022
  • This study analyzed the actual frozen container operation data of Starcool provided by H Shipping. Through interviews with H's field experts, only Critical and Fatal Alarms among the four failure alarms were defined as failures, and it was confirmed that using all variables due to the nature of frozen containers resulted in cost inefficiency. Therefore, this study proposes a method for detecting failure of frozen containers through characteristic importance and PCA techniques. To improve the performance of the model, we select variables based on feature importance through tree series models such as XGBoost and LGBoost, and use PCA to reduce the dimension of the entire variables for each model. The boosting-based XGBoost and LGBoost techniques showed that the results of the model proposed in this study improved the reproduction rate by 0.36 and 0.39 respectively compared to the results of supervised learning using all 62 variables.

Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis (단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발)

  • Jeong, Min-Eui;Yu, Song-Jin
    • Journal of KIISE:Software and Applications
    • /
    • v.41 no.8
    • /
    • pp.598-604
    • /
    • 2014
  • In this paper, we develop stepwise regression data envelopment model to select important variables. We formulate null hypothesis to understand the importance of each variable and use Kruskal-Wallis test for this purpose. If the Kruskal-Wallis test does reject the null hypothesis this will imply there is significant fluctuation in the efficiency score relative to base model. And therefore we have to further check the pair of variables that causes the fluctuation in order to determine its importance using Conover-Inman test. The proposed models helps understand the extent of misclassification decision making units as efficient/inefficient when variables are retained or discarded alongside provides useful managerial prescription to make improvement strategies.

Evaluation on Applicability of On/Off-line Parameter Calibration Techniques in Rainfall-Runoff Modeling (온·오프라인 매개변수 보정기법에 따른 강우-유출해석 적용성 평가)

  • Lee, Dae Eop;Kim, Yeon Su;Yu, Wan Sik;Lee, Gi Ha
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.34-34
    • /
    • 2017
  • 유역에 대한 유출해석은 지속가능한 수자원 관리 및 수재해 예방을 위한 가장 기본적이지만 중요한 과제이며, 우리나라와 같이 홍수와 가뭄의 재해에 의해 많은 영향을 받는 지역에서는 더욱 중요한 문제로 이러한 유출현상을 물리적으로 표현하기 위해 다양한 모형들을 활용하여 강우-유출해석을 수행하게 된다. 모형을 통한 유출해석에 있어 매개변수 추정은 유출해석 결과에 지대한 영향을 주기에 최적 매개변수를 추정하는 것은 예측결과의 성능 향상에 매우 중요한 사항이며 보다 효율적인 매개변수의 추정을 위해 추정방법간의 비교 및 검토를 통해 적용성을 판단하는 과정이 필요하다. 이를 위해 본 연구에서는 개념적 집중형 수문모형의 매개변수 보정을 위해 오프라인과 온라인의 매개변수 자동보정기법을 이용하여 매개변수를 추정하였으며, 기법별로 추정된 매개변수를 이용한 수문해석 결과의 비교 검토를 통해 각 기법의 장 단점 분석 및 적용성 평가를 수행하였다. 연구대상지역으로 용담댐 상류 천천 유역을 선정하고, 강우유출 모의를 위해 저류함수모형을 선정하였으며, 매개변수 보정을 위한 자동보정기법으로 오프라인 방법으로는 SCE-UA, 온라인 방법으로는 PF 기법을 선정하여 적용하였으며, 총 9개의 강우사상에 대해 강우-유출 모의를 수행하였다. 본 연구의 결과는 강우-유출해석을 위한 사용자의 목적에 맞는 매개변수 자동보정기법의 선정에 있어 유용할 것으로 판단되며, 시간단계 또는 사상별 최적화된 매개변수를 유역에 대한 최적 매개변수로 변환 또는 전이하기 위한 연구가 추가적으로 필요할 것으로 판단된다.

  • PDF

Effect of Aging Parameters on Seismic Response of RC Shear Wall by Sensitivity Analysis (민감도해석을 이용한 철근콘크리트 전단벽 열화변수의 지진응답 영향)

  • Park, Jun-Hee;Choun, Young-Sun;Choi, In-Kil
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2011.04a
    • /
    • pp.665-668
    • /
    • 2011
  • 철근콘크리트 구조물은 타설 후 시간이 경과함에 따라 물리적인 요인과 화학적인 요인으로 인하여 열화가 발생한다. 열화를 고려한 구조해석에서 모든 열화 관련 변수를 고려하는 것은 비효율적이다. 따라서 구조물의 거동과 밀접한 관련이 있는 중요열화변수를 정의하는 것이 필요하다. 본 연구에서는 철근콘크리트 전단벽의 경년열화 해석시 중요변수를 고려하기 위하여 민감도해석을 수행하였다. 해석결과에 의하면 재료의 경화와 관련한 변수들이 열화와 관련한 변수들보다 지진응답이 민감하게 나타났다. 해석모델의 낮은 철근비로 인하여 콘크리트의 탈락에 의한 지진응답의 변화보다 철근의 단면손실에 의한 지진응답의 변화가 크게 나타났다. 만약 원전과 같이 철근비가 높은 전단벽에서는 철근의 단면손실도 지진응답에 대한 중요변수가 될 수 있을 것으로 사료된다.

  • PDF

웹 기반 협동학습 시스템 사용의도에 미치는 영향요인에 관한 연구: Decomposed TPB 모형중심

  • Lee, Dong-Hun;Lee, Sang-Gon;Lee, Ji-Yeon
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2010.05a
    • /
    • pp.310-316
    • /
    • 2010
  • 본 연구는 정보기술의 사용(Usage)과 수용(Adoption)을 예상하는 목적보다는 웹 기반 협동합습 시스템사용 의도와 사용행위에 영향을 미치는 변수들을 폭 넓게 이해하고, 실질적으로 활용 할 수 있는 변수를 찾는데 목적이 있기 때문에 분해된 계획 행동 이론(Decomposed TPB)을 기반 하였고, 분해된 변수들 중 일부분(지각된 유용성, 지각된 용이성, 명시적 영향, 암시적 영향)과 웹 환경의 중요 요소인 '흥미성' 을 포함하여 사용의도(Use Intention)에 영향을 미치는 변수들을 2개 대학의 대학생 256명을 대상으로 자료를 수집하여 실증 분석하였다. 연구결과 다차원으로 분해된 일부 변수들 중 태도적 믿음 변수인 '지각된 용이성'을 제외하고 분해된 모든 변수가 사용의도에 긍정적 강한 영향을 미치고 있음을 알 수 있었고, 특히 주관적 규범(명시적 영향, 암시적 영향)변수는 준거집단을 통해서 웹기반 협동학습 시스템에 대한 행동의도나 인지에 영향을 줄 수 있는 중요 변수로 나타났다. 이러한 결과는 준거인이 되는 팀장은 팀원 및 학습자들과의 상호작용(협동학습을 통한 화상토론, 게시판정활동, 오프라인 정기 모임, 동영상 동시 시청)과 팀원 관리 및 운영하는 역할이기 때문에 새로운 정보 기술 및 시스템 사용 권유를 하거나, 직접 기술사용을 하는 주변 분위기는 협동합습에 참여한 학습자들에게 조금이나마 영향을 줄 수 있음을 추측 해 볼 수 있고 영향력 있는 중요변수임을 제시하였다.

  • PDF

Exploratory Study on Buyer-Supplier Relationship in Dongdaemun Market: From Buyer Perspectives of Fashion Stores (동대문시장의 구매자-공급자 관계에 관한 탐색적 연구: 동대문 패션 점포의 구매자적 시각을 중심으로)

  • Jung, Ji-Wook;Choo, Ho-Jung;Chung, Ihn-Hee
    • Journal of Global Scholars of Marketing Science
    • /
    • v.17 no.1
    • /
    • pp.51-75
    • /
    • 2007
  • Dongdaemun fashion market has been successfully positioned as a main hub for non-brand fashion product distribution in Korea. One of important competitive advantages of Dongdaemun market often quoted by retail researchers is an efficiently managed network system among supply chain members. This study aimed to examine the importance of buyer-supplier relationship elements and supplier properties from buyers' perspectives (small & very small-sized fashion stores in Dongdaemun market), and to identify the determinants of the relationship length between suppliers and buyers. Survey responses of 233 stores were analyzed using EQS 6.1 for Window and SPSSWIN 10.0. The findings could be summarized as follows: First, fashion stores perceived that right delivery as the most important factor, and geographically closeness, design capability, quality, and lower price followed in order. Second, the characteristics of stores such as location, wholesaling versus retailing focusing, monthly sales, and total business length all affected the perceived importance of buyer-supplier relationship. Third, design capacity, communication, power was identified as determinants of actual relationship length with a supplier, while communication and trust were found to be determinants of future expected relationship length.

  • PDF