• 제목/요약/키워드: Interpretability

검색결과 88건 처리시간 0.03초

대표적인 의사결정나무 알고리즘의 해석력 비교 (Interpretability Comparison of Popular Decision Tree Algorithms)

  • 홍정식;황근성
    • 산업경영시스템학회지
    • /
    • 제44권2호
    • /
    • pp.15-23
    • /
    • 2021
  • Most of the open-source decision tree algorithms are based on three splitting criteria (Entropy, Gini Index, and Gain Ratio). Therefore, the advantages and disadvantages of these three popular algorithms need to be studied more thoroughly. Comparisons of the three algorithms were mainly performed with respect to the predictive performance. In this work, we conducted a comparative experiment on the splitting criteria of three decision trees, focusing on their interpretability. Depth, homogeneity, coverage, lift, and stability were used as indicators for measuring interpretability. To measure the stability of decision trees, we present a measure of the stability of the root node and the stability of the dominating rules based on a measure of the similarity of trees. Based on 10 data collected from UCI and Kaggle, we compare the interpretability of DT (Decision Tree) algorithms based on three splitting criteria. The results show that the GR (Gain Ratio) branch-based DT algorithm performs well in terms of lift and homogeneity, while the GINI (Gini Index) and ENT (Entropy) branch-based DT algorithms performs well in terms of coverage. With respect to stability, considering both the similarity of the dominating rule or the similarity of the root node, the DT algorithm according to the ENT splitting criterion shows the best results.

NIIRS ESTIMATION USING THE GENERAL IMAGE-QUALITY EQUATION FOR MONITORING IMAGE DEGRADATION

  • Kim, Dong-Wook;Kim, Tae-Jung;Kim, Hee-Seob
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 International Symposium on Remote Sensing
    • /
    • pp.53-56
    • /
    • 2008
  • Generally, the quality of satellite images is expressed by GSD (Ground Sample Distance), MTF (Modulation Transfer Function) and SNR (Signal to Noise Ratio). However, these factors are technology-oriented and do not explain interpretability of satellite images. We need a standardized index which shows standard of interpretability. In this study, we estimated NIIRS (National Imagery Interpretability Rating Scale) through the GIQE (General Image Quality Equation) which is able to judge image interpretability with the standardized index. Traditionally, NIIRS has been determined manually by specialized image analysts. We used the GIQE in order to reduce inefficiency and high costs cause by manual interpretation and to produce accurate NIIRS. For monitoring image degradation, we estimated GIQE physical parameters from image analysis and carried out time series analysis about the quality of the KOMPSAT-1 images. On all of the tests, we were able to identify the image degradation due to the changing time. This indicates that NIIRS derived from GIQE will be used for image degradation indicator.

  • PDF

ANFIS에서 생성된 규칙의 해석용이성 평가 (Evaluation of Interpretability for Generated Rules from ANFIS)

  • 송희석;김재경
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.123-140
    • /
    • 2009
  • 퍼지신경망 모형은 인공신경망의 네트워크 구조 표현방법 및 학습알고리듬과 퍼지시스템의 추론방법을 통합한 모형으로 제어 및 예측분야에 성공적으로 적용되고 있다. 본 연구에서는 퍼지신경망 모형 중 우수한 예측정확도로 인해 최근 각광받고 있는 ANFIS (Adaptive Network-based Fuzzy Inference System) 모형에서 생성된 퍼지규칙의 해석용이성을 평가하였다. ANFIS모형은 인간 전문가와 상호작용하면서 규칙을 정제해 나갈 수 있다. 특히 인간전문가의 사전지식을 이용하여 초기 퍼지규칙을 만들고 난 후 모형을 학습하면 최적에 수렴하는 시간을 단축할 뿐 아니라, 전역 최적치 도달가능성이 높아진다고 보고되고 있다. 이러한 관점에서 볼 때 규칙의 해석용이성은 인간 전문가와의 상호작용을 위해 매우 중요한 이슈가 될 수 있다. 본 연구에서는 ANFIS모형과 의사결정나무 모형에서 생성된 규칙을 해석용이성 관점에서 비교하기 위한 측도를 제안하고 각 규칙들을 비교하였다. 본 연구에서 제안된 해석용이성 측도들은 규칙을 생성하는 다양한 기계학습 모형의 규칙생성 능력을 평가하는 기준으로도 활용될 수 있을 것이다.

  • PDF

Form-finding of lifting self-forming GFRP elastic gridshells based on machine learning interpretability methods

  • Soheila, Kookalani;Sandy, Nyunn;Sheng, Xiang
    • Structural Engineering and Mechanics
    • /
    • 제84권5호
    • /
    • pp.605-618
    • /
    • 2022
  • Glass fiber reinforced polymer (GFRP) elastic gridshells consist of long continuous GFRP tubes that form elastic deformations. In this paper, a method for the form-finding of gridshell structures is presented based on the interpretable machine learning (ML) approaches. A comparative study is conducted on several ML algorithms, including support vector regression (SVR), K-nearest neighbors (KNN), decision tree (DT), random forest (RF), AdaBoost, XGBoost, category boosting (CatBoost), and light gradient boosting machine (LightGBM). A numerical example is presented using a standard double-hump gridshell considering two characteristics of deformation as objective functions. The combination of the grid search approach and k-fold cross-validation (CV) is implemented for fine-tuning the parameters of ML models. The results of the comparative study indicate that the LightGBM model presents the highest prediction accuracy. Finally, interpretable ML approaches, including Shapely additive explanations (SHAP), partial dependence plot (PDP), and accumulated local effects (ALE), are applied to explain the predictions of the ML model since it is essential to understand the effect of various values of input parameters on objective functions. As a result of interpretability approaches, an optimum gridshell structure is obtained and new opportunities are verified for form-finding investigation of GFRP elastic gridshells during lifting construction.

NIIRS 추정을 위한 자연표적 기반의 에지분석기법 개발 (Development of a Natural Target-based Edge Analysis Method for NIIRS Estimation)

  • 김재인;김태정
    • 대한원격탐사학회지
    • /
    • 제27권5호
    • /
    • pp.587-599
    • /
    • 2011
  • NIIRS(National Imagery Interpretability Rating Scale)는 영상의 판독력을 설명하는 품질 지표로 고해상도 위성영상의 품질을 나타내는데 널리 사용되어 왔다. 이는 MTF(Modulation Transfer Function), SNR(Signal to Noise Ratio), 또는 GSD(Ground Sampling Distance)와는 달리 객관적이고, 직관적으로 영상의 전반적인 품질을 설명할 수 있다는 점에서, 그 활용도가 매우 크다고 할 수 있다. NIIRS는 전문 판독가에 의해 육안으로 직접 측정되거나, 영상의 에지 분석(Edge analysis)을 통해 정확하게 추정할 수 있다. 일반적으로 에지 분석에는 품질 측정을 위해 특별히 제작된 인공의 표적이 사용된다. 이 인공표적의 일례로 특정 크기의 반사율 차이를 가지는 흑백 패턴의 천막 형태가 있으며, 이러한 인공표적은 인공위성의 촬영경로 상에 설치되어 진다. 이 때문에 인공표적을 이용하는 방식은 표적의 설치와 관련하여 많은 비용이 지출될 뿐 아니라, 수시로 수행될 수 없다는 문제점을 가지게 된다. 이에 본 논문에서는 영상에서 쉽게 관측될 수 있는 자연표적들로부터 정확한 NIIRS 추정이 가능한 새로운 방식의 에지 분석법을 제안하였다. 이 방법은 임의의 성질을 가지는 자연표적의 특성을 반영하기 위해 알고리즘의 강인성이 강조되었으며, 다양한 실험들을 통해 성능이 평가되었다. 실험 결과는 제안 알고리즘이 기존 방식의 대안으로서 충분히 활용 가능함을 보여 주었다.

위성영상을 위한 NIIRS(Natinal Image Interpretability Rating Scales) 자동 측정 알고리즘 (Automatic National Image Interpretability Rating Scales (NIIRS) Measurement Algorithm for Satellite Images)

  • 김재희;이찬구;박종원
    • 한국멀티미디어학회논문지
    • /
    • 제19권4호
    • /
    • pp.725-735
    • /
    • 2016
  • High-resolution satellite images are used in the fields of mapping, natural disaster forecasting, agriculture, ocean-based industries, infrastructure, and environment, and there is a progressive increase in the development and demand for the applications of high-resolution satellite images. Users of the satellite images desire accurate quality of the provided satellite images. Moreover, the distinguishability of each image captured by an actual satellite varies according to the atmospheric environment and solar angle at the captured region, the satellite velocity and capture angle, and the system noise. Hence , NIIRS must be measured for all captured images. There is a significant deficiency in professional human resources and time resources available to measure the NIIRS of few hundred images that are transmitted daily. Currently, NIIRS is measured every few months or even few years to assess the aging of the satellite as well as to verify and calibrate it [3]. Therefore, we develop an algorithm that can measure the national image interpretability rating scales (NIIRS) of a typical satellite image rather than an artificial target satellite image, in order to automatically assess its quality. In this study, the criteria for automatic edge region extraction are derived based on the previous works on manual edge region extraction [4][5], and consequently, we propose an algorithm that can extract the edge region. Moreover, RER and H are calculated from the extracted edge region for automatic edge region extraction. The average NIIRS value was measured to be 3.6342±0.15321 (2 standard deviations) from the automatic measurement experiment on a typical satellite image, which is similar to the result extracted from the artificial target.

On Generating Fuzzy Systems based on Pareto Multi-objective Cooperative Coevolutionary Algorithm

  • Xing, Zong-Yi;Zhang, Yong;Hou, Yuan-Long;Jia, Li-Min
    • International Journal of Control, Automation, and Systems
    • /
    • 제5권4호
    • /
    • pp.444-455
    • /
    • 2007
  • An approach to construct multiple interpretable and precise fuzzy systems based on the Pareto Multi-objective Cooperative Coevolutionary Algorithm (PMOCCA) is proposed in this paper. First, a modified fuzzy clustering algorithm is used to construct antecedents of fuzzy system, and consequents are identified separately to reduce computational burden. Then, the PMOCCA and the interpretability-driven simplification techniques are executed to optimize the initial fuzzy system with three objectives: the precision performance, the number of fuzzy rules and the number of fuzzy sets; thus both the precision and the interpretability of the fuzzy systems are improved. In order to select the best individuals from each species, we generalize the NSGA-II algorithm from one species to multi-species, and propose a new non-dominated sorting technique and collaboration mechanism for cooperative coevolutionary algorithm. Finally, the proposed approach is applied to two benchmark problems, and the results show its validity.

Experimental Analysis of Bankruptcy Prediction with SHAP framework on Polish Companies

  • Tuguldur Enkhtuya;Dae-Ki Kang
    • International journal of advanced smart convergence
    • /
    • 제12권1호
    • /
    • pp.53-58
    • /
    • 2023
  • With the fast development of artificial intelligence day by day, users are demanding explanations about the results of algorithms and want to know what parameters influence the results. In this paper, we propose a model for bankruptcy prediction with interpretability using the SHAP framework. SHAP (SHAPley Additive exPlanations) is framework that gives a visualized result that can be used for explanation and interpretation of machine learning models. As a result, we can describe which features are important for the result of our deep learning model. SHAP framework Force plot result gives us top features which are mainly reflecting overall model score. Even though Fully Connected Neural Networks are a "black box" model, Shapley values help us to alleviate the "black box" problem. FCNNs perform well with complex dataset with more than 60 financial ratios. Combined with SHAP framework, we create an effective model with understandable interpretation. Bankruptcy is a rare event, then we avoid imbalanced dataset problem with the help of SMOTE. SMOTE is one of the oversampling technique that resulting synthetic samples are generated for the minority class. It uses K-nearest neighbors algorithm for line connecting method in order to producing examples. We expect our model results assist financial analysts who are interested in forecasting bankruptcy prediction of companies in detail.

위성영상의 해상력에 따른 지리정보의 판독 - 판독가능성과 프랙탈 차원을 중심으로 (The Resolution Effects of the Satellite images on the Interpretability of Geographic Informations - Laying Emphasis on the Interpretability and the Fractal Dimension)

  • 김용일;서병준;구본철
    • 대한공간정보학회지
    • /
    • 제8권2호
    • /
    • pp.61-69
    • /
    • 2000
  • 최근까지 위성 영상을 이용한 지리정보의 추출은 기존의 항공사진과 비교하여 공간 해상력의 한계로 인하여 많은 제약조건들을 지니고 있었다. 그러나, 공간 해상력이 약 1m 정도인 고해상도 위성들의 발사 계획이 앞으로의 많은 활용가능성을 제시하고 있다 최근에는, 지리정보시스템을 구축하기 위해서 그 기반이 되는 기본도의 수치화사업이 진행되고 있다. 따라서, 본 연구에서는 다양한 위성 영상의 해상도에 따라 지리정보의 판독과 검출가능성을 시험해보았으며 실험을 통하여 서로 다른 해상력을 지닌 6개의 영상에 대해서 6개의 범주로 나눈 46가지의 지형지물에 대한 해석과 검출가능성을 시험하여 보았다. 그 다음으로, 우리는 질감 정보의 정확도 평가를 위해 프랙탈 분석법을 시행하였다. 또한, 프랙탈 분석법을 통해서, 영상의 공간해상력이 증가할수록 질감정보와 구분가능성이 증가하는 것을 알 수 있었다. 이러한 실험결과를 통해서 본 연구에서는 특정 대상물의 판독에 적절한 공간 해상력을 검토해 봄으로써 위성 영상을 이용한 지리정보시스템 데이터베이스의 갱신 및 구축의 가능성을 제시해보고자 하였다.

  • PDF

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.