• 제목/요약/키워드: Explainable Deep Learning

검색결과 36건 처리시간 0.024초

설명 가능한 인공지능 기술을 활용한 가스누출과 고혈압의 연관 분석 (Explainable analysis of the Relationship between Hypertension with Gas leakages)

  • 홍고르출;조겨리;김미혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.55-56
    • /
    • 2022
  • Hypertension is a severe health problem and increases the risk of other health issues, such as heart disease, heart attack, and stroke. In this research, we propose a machine learning-based prediction method for the risk of chronic hypertension. The proposed method consists of four main modules. In the first module, the linear interpolation method fills missing values of the integration of gas and meteorological datasets. In the second module, the OrdinalEncoder-based normalization is followed by the Decision tree algorithm to select important features. The prediction analysis module builds three models based on k-Nearest Neighbors, Decision Tree, and Random Forest to predict hypertension levels. Finally, the features used in the prediction model are explained by the DeepSHAP approach. The proposed method is evaluated by integrating the Korean meteorological agency dataset, natural gas leakage dataset, and Korean National Health and Nutrition Examination Survey dataset. The experimental results showed important global features for the hypertension of the entire population and local components for particular patients. Based on the local explanation results for a randomly selected 65-year-old male, the effect of hypertension increased from 0.694 to 1.249 when age increased by 0.37 and gas loss increased by 0.17. Therefore, it is concluded that gas loss is the cause of high blood pressure.

긴꼬리 분포의 광간섭 단층촬영 데이터세트에 대한 다중 레이블 이미지 분류 (Multi-Label Image Classification on Long-tailed Optical Coherence Tomography Dataset)

  • ;정경희;;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.541-543
    • /
    • 2022
  • In recent years, retinal disorders have become a serious health concern. Retinal disorders develop slowly and without obvious signs. To avoid vision deterioration, early detection and treatment are critical. Optical coherence tomography (OCT) is a non-invasive and non-contact medical imaging technique used to acquire informative and high-resolution image of retinal area and underlying layers. Disease signs are difficult to detect because OCT images have many areas which are not related to any disease. In this paper, we present a deep learning-based method to perform multi-label classification on a long-tailed OCT dataset. Our method first extracts the region of interest and then performs the classification task. We achieve 98% accuracy, 92% sensitivity, and 99% specificity on our private OCT dataset. Using the heatmap generated from trained convolutional neural network, our method is more robust and explainable than previous approaches because it focuses on areas that contain disease signs.

XAI 기법을 이용한 리뷰 유용성 예측 결과 설명에 관한 연구 (Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction)

  • 류동엽;이흠철;김재경
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.35-56
    • /
    • 2023
  • 정보통신 기술의 발전에 따라 웹 사이트에는 수많은 리뷰가 지속적으로 게시되고 있다. 이로 인해 정보 과부하 문제가 발생하여 사용자들은 본인이 원하는 리뷰를 탐색하는데 어려움을 겪고 있다. 따라서, 이러한 문제를 해결하여 사용자에게 유용하고 신뢰성 있는 리뷰를 제공하기 위해 리뷰 유용성 예측에 관한 연구가 활발히 진행되고 있다. 기존 연구는 주로 리뷰에 포함된 특성을 기반으로 리뷰 유용성을 예측하였다. 그러나, 예측한 리뷰가 왜 유용한지 근거를 제시할 수 없다는 한계점이 존재한다. 따라서 본 연구는 이러한 한계점을 해결하기 위해 리뷰 유용성 예측 모델에 eXplainable Artificial Intelligence(XAI) 기법을 적용하는 방법론을 제안하였다. 본 연구는 Yelp.com에서 수집한 레스토랑 리뷰를 사용하여 리뷰 유용성 예측에 관한 연구에서 널리 사용되는 6개의 모델을 통해 예측 성능을 비교하였다. 그 다음, 예측 성능이 가장 우수한 모델에 XAI 기법을 적용하여 설명 가능한 리뷰 유용성 예측 모델을 제안하였다. 따라서 본 연구에서 제안한 방법론은 사용자의 구매 의사결정 과정에서 유용한 리뷰를 추천할 수 있는 동시에 해당 리뷰가 왜 유용한지에 대한 해석을 제공할 수 있다.

딥 러닝 기반 코로나19 흉부 X선 판독 기법 (A COVID-19 Chest X-ray Reading Technique based on Deep Learning)

  • 안경희;엄성용
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.789-795
    • /
    • 2020
  • 전 세계적으로 유행하는 코로나19로 인해 많은 사망자가 보고되고 있다. 코로나19의 추가 확산을 막기 위해서는 의심 환자에 대해 신속하고 정확한 영상판독을 한 후, 적절한 조치를 취해야 한다. 이를 위해 본 논문은 환자의 감염 여부를 의료진에게 제공해 영상판독을 보조할 수 있는 딥 러닝 기반 코로나19 흉부 X선 판독 기법을 소개한다. 우선 판독모델을 학습하기 위해서는 충분한 데이터셋이 확보되어야 하는데, 현재 제공하는 코로나19 오픈 데이터셋은 학습의 정확도를 보장하기에 그 영상 데이터 수가 충분하지 않다. 따라서 누적 적대적 생성 신경망(StackGAN++)을 사용해 인공지능 학습 성능을 저하하는 영상 데이터 수적 불균형 문제를 해결하였다. 다음으로 판독모델 개발을 위해 증강된 데이터셋을 사용하여 DenseNet 기반 분류모델 학습을 진행하였다. 해당 분류모델은 정상 흉부 X선과 코로나 19 흉부 X선 영상을 이진 분류하는 모델로, 실제 영상 데이터 일부를 테스트데이터로 사용하여 모델의 성능을 평가하였다. 마지막으로 설명 가능한 인공지능(eXplainable AI, XAI) 중 하나인 Grad-CAM을 사용해 입력 영상의 질환유무를 판단하는 근거를 제시하여 모델의 신뢰성을 확보하였다.

LIME과 SHAP 모델 공유에 의한 모델 해석 (Model Interpretation through LIME and SHAP Model Sharing)

  • 김용길
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.177-184
    • /
    • 2024
  • 데이터가 빠른 속도로 증가하고 있는 가운데 가능한 최고의 정확도를 달성하기 위해 모든 종류의 복잡한 앙상블 및 딥 러닝 알고리즘이 사용되고 있다. 그렇지만, 이러한 모델이 알 수 없는 데이터를 예측/분류/인식/추적하는 방법과 관련하여 예측, 분류, 인식, 추적이 항상 신뢰할 수 있는 것은 아니다. 데이터 부족, 불균형 데이터 세트, 편향된 데이터 세트 등과 같은 다양한 이유가 학습 모델에 의해 포착되는 결정에 영향을 미칠 수 있다. 이와 관련하여 현재 모델의 설명 가능성에 관한 연구가 관심을 끌고 있다. 현재 설명 가능성 기법과 관련하여 LIME과 SHAP가 보편적으로 사용되고 있지만, 출력 결과들은 다소 상이한 측면을 나타내고 있다. 이에 본 연구에서는 LIME과 SHAP을 결합하는 방식을 소개하고, 데모와 관련해서 IEEE CIS 데이터 세트에서 거래를 사기로 분류할 때 LightGBM 및 Keras 모델이 내린 결정에 대한 설명 가능성을 분석한다.

베이지안 확률 및 폐쇄 순차패턴 마이닝 방식을 이용한 설명가능한 로그 이상탐지 시스템 (An Interpretable Log Anomaly System Using Bayesian Probability and Closed Sequence Pattern Mining)

  • 윤지영;신건윤;김동욱;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.77-87
    • /
    • 2021
  • 인터넷과 개인용 컴퓨터가 발달하면서 다양하고 복잡한 공격들이 등장하기 시작했다. 공격들이 복잡해짐에 따라 기존에 사용하던 시그니처 기반의 탐지 방식으로 탐지가 어려워졌으며 이를 해결하기 위해 행위기반의 탐지를 위한 로그 이상탐지에 대한 연구가 주목 받기 시작했다. 최근 로그 이상탐지에 대한 연구는 딥러닝을 활용해 순서를 학습하는 방식으로 이루어지고 있으며 좋은 성능을 보여준다. 하지만 좋은 성능에도 불구하고 판단에 대한 근거를 제공하지 못한다는 한계점을 지닌다. 판단에 대한 근거 및 설명을 제공하지 못할 경우, 데이터가 오염되거나 모델 자체에 결함이 발생해도 이를 발견하기 어렵다는 문제점을 지닌다. 결론적으로 사용자의 신뢰성을 잃게 된다. 이를 해결하기 위해 본 연구에서는 설명가능한 로그 이상탐지 시스템을 제안한다. 본 연구는 가장 먼저 로그 파싱을 진행해 로그 전처리를 수행한다. 이후 전처리된 로그들을 이용해 베이지안 확률 기반 순차 규칙추출을 진행한다. 결과적으로 "If 조건 then 결과, 사후확률(θ)" 형식의 규칙집합을 추출하며 이와 매칭될 경우 정상, 매칭되지 않을 경우, 이상행위로 판단하게 된다. 실험으로는 HDFS 로그 데이터셋을 활용했으며, 그 결과 F1score 92.7%의 성능을 나타내었다.