• Title/Summary/Keyword: 설명모델

Search Result 2,468, Processing Time 0.046 seconds

Interpretable Deep Learning Based On Prototype Generation (프로토타입 생성 기반 딥 러닝 모델 설명 방법)

  • Park, Jae-hun;Kim, Kwang-su
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.23-26
    • /
    • 2022
  • 딥 러닝 모델은 블랙 박스 (Black Box) 모델로 예측에 대한 근거를 제시하지 못해 신뢰성이 떨어지는 단점이 존재한다. 이를 해결하기 위해 딥 러닝 모델에 설명력을 부여하는 설명 가능한 인공지능 (XAI) 분야 연구가 활발하게 이루어지고 있다. 본 논문에서는 모델 예측을 프로토타입을 통해 설명하는 딥 러닝 모델을 제시한다. 즉, "주어진 이미지는 티셔츠인데, 그 이유는 티셔츠를 대표하는 모양의 프로토타입과 닮았기 때문이다."의 형태로 딥 러닝 모델을 설명한다. 해당 모델은 Encoder, Prototype Layer, Classifier로 구성되어 있다. Encoder는 Feature를 추출하는 데 활용하고 Classifier를 통해 분류 작업을 수행한다. 모델이 제시하는 분류 결과를 설명하기 위해 Prototype Layer에서 가장 유사한 프로토타입을 찾아 설명을 제시한다. 실험 결과 프로토타입 생성 기반 설명 모델은 기존 이미지 분류 모델과 유사한 예측 정확도를 보였고, 예측에 대한 설명력까지 확보하였다.

  • PDF

Performance Analysis of Explainers for Sentiment Classifiers of Movie Reviews (영화평 감성 분석기를 대상으로 한 설명자의 성능 분석)

  • Park, Cheon-Young;Lee, Kong Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.563-568
    • /
    • 2020
  • 본 연구에서는 블랙박스로 알려진 딥러닝 모델에 설명 근거를 제공할 수 있는 설명자 모델을 적용해 보았다. 영화평 감성 분석을 위해 MLP, CNN으로 구성된 딥러닝 모델과 결정트리의 앙상블인 Gradient Boosting 모델을 이용하여 감성 분류기를 구축하였다. 설명자 모델로는 기울기(gradient)을 기반으로 하는 IG와 레이어 사이의 가중치(weight)을 기반으로 하는 CAM, 그리고 설명가능한 대리 모델을 이용하는 LIME과 입력 속성에 대한 선형모델을 추정하는 SHAP을 사용하였다. 설명자 모델의 특성을 보기 위하여 히트맵과 관련성 높은 N개의 속성을 추출해 보았다. 설명자가 제공하는 기여도에 따라 입력 속성을 제거해 가며 분류기 성능 변화를 측정하는 정량적 평가도 수행하였다. 또한, 사람의 판단 근거와의 일치도를 살펴볼 수 있는 '설명 근거 정확도'라는 새로운 평가 방법을 제안하여 적용해 보았다.

  • PDF

Interpretable Visual Question Answering via Explain Sentence Generation (설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델 분석)

  • Kim, Danil;Han, Bohyung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.359-362
    • /
    • 2020
  • 본 연구에서는 설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델을 설계하고 학습 방법을 제시한다. 설명 문장은 시각적 질의응답 모델이 응답을 예측하는 데에 필요한 이미지 및 질문 정보와 적절한 논리적인 정보의 조합 및 정답 추론 과정이 함의되어 있을 것으로 기대한다. 설명 문장 생성 과정이 포함된 시각적 질의응답의 기본적인 모델을 기반으로 여러 가지 학습방법을 통해 설명 문장 생성 과정과 응답 예측 과정간의 상호관계를 분석한다. 이러한 상호작용을 적극적으로 활용할 수 있는 보다 개선 시각적 질의응답 모델을 제안한다. 또한 학습한 결과를 바탕으로 설명 문장의 특성을 활용하여 시각적 질의응답 추론 과정을 개선함으로써 시각적 질의응답 모델의 발전 방향을 논의한다. 본 실험을 통해서 응답 예측에 적절한 설명 문장을 제시하는 해석 가능한 시각적 질의응답 모델을 제공한다.

  • PDF

A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis (회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델)

  • Kim, Chaehyeon;Ryoo, Euirim;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.

A Research on Explainability of the Medical AI Model based on Attention and Attention Flow Graph (어텐션과 어텐션 흐름 그래프를 활용한 의료 인공지능 모델의 설명가능성 연구)

  • Lee, You-Jin;Chae, Dong-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.520-522
    • /
    • 2022
  • 의료 인공지능은 특정 진단에서 높은 정확도를 보이지만 모델의 신뢰성 문제로 인해 활발하게 쓰이지 못하고 있다. 이에 따라 인공지능 모델의 진단에 대한 원인 설명의 필요성이 대두되었고 설명가능한 의료 인공지능에 관한 연구가 활발히 진행되고 있다. 하지만 MRI 등 의료 영상 인공지능 분야에서 주로 진행되고 있으며, 이미지 형태가 아닌 전자의무기록 데이터 (Electronic Health Record, EHR) 를 기반으로 한 모델의 설명가능성 연구는 EHR 데이터 자체의 복잡성 때문에 활발하게 진행 되지 않고 있다. 본 논문에서는 전자의무기록 데이터인 MIMIC-III (Medical Information Mart for Intensive Care) 를 전처리 및 그래프로 표현하고, GCT (Graph Convolutional Transformer) 모델을 학습시켰다. 학습 후, 어텐션 흐름 그래프를 시각화해서 모델의 예측에 대한 직관적인 설명을 제공한다.

SHAP-based Explainable Photovoltaic Power Forecasting Scheme Using LSTM (LSTM을 사용한 SHAP 기반의 설명 가능한 태양광 발전량 예측 기법)

  • Park, Sungwoo;Noh, Yoona;Jung, Seungmin;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.845-848
    • /
    • 2021
  • 최근 화석연료의 급격한 사용에 따른 자원고갈이나 환경오염과 같은 문제들이 심각해짐에 따라 화석연료를 대체할 수 있는 신재생에너지에 대한 관심이 높아지고 있다. 태양광 에너지는 다른 에너지원에 비해 고갈의 우려가 없고, 부지 선정의 제약이 크지 않아 수요가 증가하고 있다. 태양광 발전 시스템에서 생산된 전력을 효과적으로 사용하기 위해서는 태양광 발전량에 대한 정확한 예측 모델이 필요하다. 이를 위한 다양한 딥러닝 기반의 예측 모델들이 제안되었지만, 이러한 모델들은 모델 내부에서 일어나는 의사결정 과정을 들여다보기가 어렵다. 의사결정에 대한 설명이 없다면 예측 모델의 결과를 완전히 신뢰하고 사용하는 데 제약이 따른다. 이런 문제를 위해서 최근 주목을 받는 설명 가능한 인공지능 기술을 사용한다면, 예측 모델의 결과 도출에 대한 해석을 제공할 수 있어 모델의 신뢰성을 확보할 수 있을 뿐만 아니라 모델의 성능 향상을 기대할 수도 있다. 이에 본 논문에서는 Long Short-Term Memory(LSTM)을 사용하여 모델을 구성하고, 모델에서 어떻게 예측값이 도출되었는지를 SHapley Additive exPlanation(SHAP)을 통하여 설명하는 태양광 발전량 예측 기법을 제안한다.

갱신이론과 전산모사를 통한 비고전적 단일 효소 반응시간 분포와 고분자 특이 수송 현상의 정량적 이해

  • Kim, Dae-Hyeon;Jeong, In-Chun;Song, Sang-Geun;Kim, Ji-Hyeon;Seong, Jae-Yeong
    • Proceeding of EDISON Challenge
    • /
    • 2015.03a
    • /
    • pp.24-31
    • /
    • 2015
  • 효소는 생명 현상을 구현하는 단백질 촉매인데 그 동안 효소의 촉매 반응 속도는 Michaelis-Menten(MM) 모델로 대부분 설명되어 왔다. 그러나 MM 모델은 실험으로 측정된 단일 효소 반응시간의 확률분포 모양을 설명할 수 없다. MM 모델에 반응계수의 정적 무질서 개념을 도입한 효소 반응 모델도 기질 농도에 따라 변화하는 효소 반응시간의 통계적 요동을 설명하지 못한다. 우리는 단일 효소 반응시간의 통계적 요동이 기질에 따라 변화하는 양상을 설명하기 위해 효소 반응을 구성하는 개별 화학반응을 단순히 푸아송 과정이 아닌 갱신과정(renewal process)으로 확장한 효소 반응 모델을 제안한다. 우리는 이 단일 효소 반응 모델과 기질에 따른 효소 반응시간 분산 변화 데이터를 비교하여 효소-기질 복합체의 지속시간 분포를 간단한 형태로 얻어내었다. 또한, 이 정보를 토대로 전산모사를 수행하여 효소 반응시간의 확률분포를 얻어내고, 실제 실험 결과 및 기존 이론들과 비교하였다. 뿐만 아니라 단일 효소 반응시간의 확률분포를 연속 시간 임의의 보행자(continuous time random walker)의 대기시간 확률분포(waiting time distribution)로 대응하면, 평균 제곱 변위가 시간에 따라 단순히 증가 하지 않는 고분자의 특이 수송(anomalous diffusion) 현상도 정량적으로 설명할 수 있었다.

  • PDF

Factors influencing the acceptance and usage of university portal websites (대학포탈 웹사이트 수용 및 사용에 영향을 미치는 요인)

  • 박관희
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2004.05a
    • /
    • pp.304-315
    • /
    • 2004
  • 본 연구는 인터넷 환경 하에서 Davis의 기술수용모델(TAM)을 확장한 것이다. 본래의 TAM 모델에서는 인지된 사용용이성(perceived ease of use) 및 인지된 사용편이성(perceived usefulness)이 시스템 사용을 설명할 때 가장 중요한 요인이라고 제안하고 있다. 그러나 TAM 모델은 실제 시스템 사용의 약 $40\%$만 설명하고 있어 이 모델의 확장이 필요한 편이다. 본 연구에서는 기존의 TAM 모델에, Flow 이론에서 언급된 "인지된 즐거움 (perceived enjoyment)" 및 혁신확산이론(IDT)에서 언급된 "일치성(compatibility)"을 추가하여 TAM 모델을 확장하여 사용하였다. 본 연구자가 근무하는 대학의 대학포탈(university portals) 웹사이트를 사용하여 이 모델을 평가하였다.

  • PDF

Manufacturing Progress with Embodied Technological Change

  • Shin, Dong-Wook
    • Journal of Technology Innovation
    • /
    • v.1 no.1
    • /
    • pp.84-99
    • /
    • 1993
  • 오래도록 생산성향상곡선 (또는 학습곡선), 생산함수, 그리고 대체곡선 등은, 서로 관련이 없는 별개의, 그리고 순전히 경험적인 (empirical) 현상들인 것들로서 이해되어 왔었다. 그러나 1980년대 중반에 발표된 Muth 교수의 탐색이론 (Search Theory)의 생산성향상곡선에서 관찰된 제반현상들을 모두 설명함으로써 이들 현상은 하나의 통합이론체계에 의하여 일관되게 설명되게 되었다. 이 이론의 초기형태는 그 보편성을 구속하는 네 가지 가설 위에 설립되었었으나 점차적으로 이들 가설들이 완화되면서 (relaxed) 이 이론은 또한 해독 력에서 뿐만 아니라 일반성에 있어서도 계속 강화되어 왔다. 본 논문의 목적은, 이들 네 가지 가설들 중 유일하게 아직 완화되지 못하고 있는, 실제 현상과 다분히 유리된, 두 번째 가설, 즉$\ulcorner$생산성향상을 위한 탐색과정에서 새로이 발견된 개량 신기술 (또는 생산방식) 은 즉각적으로 채택될 것$\lrcorner$이라는 가설을 완화함으로써, 보다 현실에 대한 해석력과 일반성 면에서 개선된 모델을 제시하는 데 있다. 이를 위하여 제시된 모델은 Muth 교수의 탐색이론모델에 두가지 변수를 더함으로써 확장하여 만든 모델이다. 이 두 변수는 신기술의 채택 (또는 획득)을 위하여 지불하여야 하는 투자비변수와 탐색과정을 통하여 발견은 되었으나 아직 채택은 되지 않은, 유보상태 신기술의 운영비용 변수(또는 수익성변수)등이다. 이 모델의 내용은, 생산성향상은 신기술이 구현된 (embodied) 장비 (equipment)를 사용함으로써 실현되며, 따라서 창의적 활동의 이득은 이들 장비에 대한 투자행위로서 실현된다는 것이다. 이 모델은 보다 나은 신기술이 또 발견될 것이라는 기대 하에, 현재 발견된 최신기술을 채택하지 않는 투자지연현상을 예측.설명해 주며 따라서 이로 인한 기술적 비효율성의 존재이유를 제시한다. 또한 이 모델은 생산성 향상곡선의 초기굴곡현상, 정체현상, 그리고 도약현상 등을 모두 설명해 준다.

  • PDF

An Integrated Extension to On-line Commerce Acceptance: A Combination of Trust and Affect into the Technology Acceptance Model (온라인 상거래 수용에 관한 통합적 확장:기술수용모델에 대한 신뢰와 감정의 결합)

  • 임양환;박세훈
    • Asia Marketing Journal
    • /
    • v.6 no.1
    • /
    • pp.57-86
    • /
    • 2004
  • 인터넷관련 혁신의 수용을 설명하려는 많은 연구들에서 정보기술수용모델(TAM)이 적용되었지만, 온라인 상거래의 수용을 정확히 설명하기 위해서는 인터넷을 통해 상거래를 할 때 발생하는 특성을 반영해야 한다. 본 연구에서는 온라인 상거래관련 기존 연구들을 바탕으로 TAM을 확장하는 변수로 신뢰와 감정을 추가하고 변수들의 영향 관계를 통합적으로 구조화하였다. 이러한 확장 구조를 통해, 온라인 상거래 수용을 설명하는데 TAM의 원형을 그대로 적용하거나 신뢰 혹은 감정만을 고려한 기존 연구들이 갖는 설명의 제한점을 극복하고자 하였다. 그리고 온라인 상거래의 수용에 대한 전체적인 틀을 파악하고, 소비자가 온라인 상거래를 수용하는 측면에서 온라인 상거래의 성공을 결정짓는 주요한 변수들의 관계를 명확히 하였다. 신뢰, 감정, 사용의 용이함이 유용성을 지각하고 사이트 사용의도를 갖고 상거래 행동을 하는데 영향을 주며 이들 변수들간에도 영향관계가 있다는 모델을 제안하였고, 대안적으로 감정을 태도의 요소로 보는 모델과 신뢰가 감정이 전혀 관계가 없다는 모델을 제시하였다. 모델들을 비교한 결과 제안모델이 가장 우수하다고 판단할 수 있었다. 각 변수들의 경로계수에 의해 가설을 검증한 결과, 감정과 사용의 용이함은 유용성에 정적으로 유의하게 영향을 주었고 신뢰는 어느 정도 영향을 주었다. 그리고 신뢰와 사용의 용이함은 감정에도 유의하게 영향을 주었다. 그렇지만 사이트 사용의도에 유의하게 영향을 미치는 변수는 사용의 용이함 뿐이었다. 실증연구를 바탕으로, 온라인 상거래가 사용자 수용 측면에서 성공을 할 수 있기 위해서는 사용의 용이함과 함께 신뢰와 감정이 중요하게 고려되어야 함을 알 수 있다.

  • PDF