• 제목/요약/키워드: 설명모델

검색결과 2,474건 처리시간 0.032초

프로토타입 생성 기반 딥 러닝 모델 설명 방법 (Interpretable Deep Learning Based On Prototype Generation)

  • 박재훈;김광수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.23-26
    • /
    • 2022
  • 딥 러닝 모델은 블랙 박스 (Black Box) 모델로 예측에 대한 근거를 제시하지 못해 신뢰성이 떨어지는 단점이 존재한다. 이를 해결하기 위해 딥 러닝 모델에 설명력을 부여하는 설명 가능한 인공지능 (XAI) 분야 연구가 활발하게 이루어지고 있다. 본 논문에서는 모델 예측을 프로토타입을 통해 설명하는 딥 러닝 모델을 제시한다. 즉, "주어진 이미지는 티셔츠인데, 그 이유는 티셔츠를 대표하는 모양의 프로토타입과 닮았기 때문이다."의 형태로 딥 러닝 모델을 설명한다. 해당 모델은 Encoder, Prototype Layer, Classifier로 구성되어 있다. Encoder는 Feature를 추출하는 데 활용하고 Classifier를 통해 분류 작업을 수행한다. 모델이 제시하는 분류 결과를 설명하기 위해 Prototype Layer에서 가장 유사한 프로토타입을 찾아 설명을 제시한다. 실험 결과 프로토타입 생성 기반 설명 모델은 기존 이미지 분류 모델과 유사한 예측 정확도를 보였고, 예측에 대한 설명력까지 확보하였다.

  • PDF

영화평 감성 분석기를 대상으로 한 설명자의 성능 분석 (Performance Analysis of Explainers for Sentiment Classifiers of Movie Reviews)

  • 박천용;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.563-568
    • /
    • 2020
  • 본 연구에서는 블랙박스로 알려진 딥러닝 모델에 설명 근거를 제공할 수 있는 설명자 모델을 적용해 보았다. 영화평 감성 분석을 위해 MLP, CNN으로 구성된 딥러닝 모델과 결정트리의 앙상블인 Gradient Boosting 모델을 이용하여 감성 분류기를 구축하였다. 설명자 모델로는 기울기(gradient)을 기반으로 하는 IG와 레이어 사이의 가중치(weight)을 기반으로 하는 CAM, 그리고 설명가능한 대리 모델을 이용하는 LIME과 입력 속성에 대한 선형모델을 추정하는 SHAP을 사용하였다. 설명자 모델의 특성을 보기 위하여 히트맵과 관련성 높은 N개의 속성을 추출해 보았다. 설명자가 제공하는 기여도에 따라 입력 속성을 제거해 가며 분류기 성능 변화를 측정하는 정량적 평가도 수행하였다. 또한, 사람의 판단 근거와의 일치도를 살펴볼 수 있는 '설명 근거 정확도'라는 새로운 평가 방법을 제안하여 적용해 보았다.

  • PDF

설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델 분석 (Interpretable Visual Question Answering via Explain Sentence Generation)

  • 김단일;한보형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.359-362
    • /
    • 2020
  • 본 연구에서는 설명 문장 생성을 통한 해석 가능한 시각적 질의응답 모델을 설계하고 학습 방법을 제시한다. 설명 문장은 시각적 질의응답 모델이 응답을 예측하는 데에 필요한 이미지 및 질문 정보와 적절한 논리적인 정보의 조합 및 정답 추론 과정이 함의되어 있을 것으로 기대한다. 설명 문장 생성 과정이 포함된 시각적 질의응답의 기본적인 모델을 기반으로 여러 가지 학습방법을 통해 설명 문장 생성 과정과 응답 예측 과정간의 상호관계를 분석한다. 이러한 상호작용을 적극적으로 활용할 수 있는 보다 개선 시각적 질의응답 모델을 제안한다. 또한 학습한 결과를 바탕으로 설명 문장의 특성을 활용하여 시각적 질의응답 추론 과정을 개선함으로써 시각적 질의응답 모델의 발전 방향을 논의한다. 본 실험을 통해서 응답 예측에 적절한 설명 문장을 제시하는 해석 가능한 시각적 질의응답 모델을 제공한다.

  • PDF

회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델 (A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis)

  • 김채현;류의림;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.

어텐션과 어텐션 흐름 그래프를 활용한 의료 인공지능 모델의 설명가능성 연구 (A Research on Explainability of the Medical AI Model based on Attention and Attention Flow Graph)

  • 이유진;채동규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.520-522
    • /
    • 2022
  • 의료 인공지능은 특정 진단에서 높은 정확도를 보이지만 모델의 신뢰성 문제로 인해 활발하게 쓰이지 못하고 있다. 이에 따라 인공지능 모델의 진단에 대한 원인 설명의 필요성이 대두되었고 설명가능한 의료 인공지능에 관한 연구가 활발히 진행되고 있다. 하지만 MRI 등 의료 영상 인공지능 분야에서 주로 진행되고 있으며, 이미지 형태가 아닌 전자의무기록 데이터 (Electronic Health Record, EHR) 를 기반으로 한 모델의 설명가능성 연구는 EHR 데이터 자체의 복잡성 때문에 활발하게 진행 되지 않고 있다. 본 논문에서는 전자의무기록 데이터인 MIMIC-III (Medical Information Mart for Intensive Care) 를 전처리 및 그래프로 표현하고, GCT (Graph Convolutional Transformer) 모델을 학습시켰다. 학습 후, 어텐션 흐름 그래프를 시각화해서 모델의 예측에 대한 직관적인 설명을 제공한다.

LSTM을 사용한 SHAP 기반의 설명 가능한 태양광 발전량 예측 기법 (SHAP-based Explainable Photovoltaic Power Forecasting Scheme Using LSTM)

  • 박성우;노윤아;정승민;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.845-848
    • /
    • 2021
  • 최근 화석연료의 급격한 사용에 따른 자원고갈이나 환경오염과 같은 문제들이 심각해짐에 따라 화석연료를 대체할 수 있는 신재생에너지에 대한 관심이 높아지고 있다. 태양광 에너지는 다른 에너지원에 비해 고갈의 우려가 없고, 부지 선정의 제약이 크지 않아 수요가 증가하고 있다. 태양광 발전 시스템에서 생산된 전력을 효과적으로 사용하기 위해서는 태양광 발전량에 대한 정확한 예측 모델이 필요하다. 이를 위한 다양한 딥러닝 기반의 예측 모델들이 제안되었지만, 이러한 모델들은 모델 내부에서 일어나는 의사결정 과정을 들여다보기가 어렵다. 의사결정에 대한 설명이 없다면 예측 모델의 결과를 완전히 신뢰하고 사용하는 데 제약이 따른다. 이런 문제를 위해서 최근 주목을 받는 설명 가능한 인공지능 기술을 사용한다면, 예측 모델의 결과 도출에 대한 해석을 제공할 수 있어 모델의 신뢰성을 확보할 수 있을 뿐만 아니라 모델의 성능 향상을 기대할 수도 있다. 이에 본 논문에서는 Long Short-Term Memory(LSTM)을 사용하여 모델을 구성하고, 모델에서 어떻게 예측값이 도출되었는지를 SHapley Additive exPlanation(SHAP)을 통하여 설명하는 태양광 발전량 예측 기법을 제안한다.

갱신이론과 전산모사를 통한 비고전적 단일 효소 반응시간 분포와 고분자 특이 수송 현상의 정량적 이해

  • 김대현;정인춘;송상근;김지현;성재영
    • EDISON SW 활용 경진대회 논문집
    • /
    • 제4회(2015년)
    • /
    • pp.24-31
    • /
    • 2015
  • 효소는 생명 현상을 구현하는 단백질 촉매인데 그 동안 효소의 촉매 반응 속도는 Michaelis-Menten(MM) 모델로 대부분 설명되어 왔다. 그러나 MM 모델은 실험으로 측정된 단일 효소 반응시간의 확률분포 모양을 설명할 수 없다. MM 모델에 반응계수의 정적 무질서 개념을 도입한 효소 반응 모델도 기질 농도에 따라 변화하는 효소 반응시간의 통계적 요동을 설명하지 못한다. 우리는 단일 효소 반응시간의 통계적 요동이 기질에 따라 변화하는 양상을 설명하기 위해 효소 반응을 구성하는 개별 화학반응을 단순히 푸아송 과정이 아닌 갱신과정(renewal process)으로 확장한 효소 반응 모델을 제안한다. 우리는 이 단일 효소 반응 모델과 기질에 따른 효소 반응시간 분산 변화 데이터를 비교하여 효소-기질 복합체의 지속시간 분포를 간단한 형태로 얻어내었다. 또한, 이 정보를 토대로 전산모사를 수행하여 효소 반응시간의 확률분포를 얻어내고, 실제 실험 결과 및 기존 이론들과 비교하였다. 뿐만 아니라 단일 효소 반응시간의 확률분포를 연속 시간 임의의 보행자(continuous time random walker)의 대기시간 확률분포(waiting time distribution)로 대응하면, 평균 제곱 변위가 시간에 따라 단순히 증가 하지 않는 고분자의 특이 수송(anomalous diffusion) 현상도 정량적으로 설명할 수 있었다.

  • PDF

딥러닝 모델을 이용한 2D 레고 조립 설명서 생성 (Generating 2D LEGO Instruction Manual Using Deep Learning Model)

  • 안종석;이승현;김철희;강동희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.481-484
    • /
    • 2024
  • 본 논문에서는 레고(LEGO®) 조립 설명서를 생성하기 위해 딥러닝을 이용한 조립 및 설명서 생성 시스템을 제안한다. 이 시스템은 사용자가 제공한 단일 이미지를 기반으로 레고 조립 설명서를 자동 생성한다. 해당 시스템은 딥러닝 기반 이미지 분할 기술을 활용하여 물체를 배경으로부터 분리하고 이를 통해 조립 설명서를 생성하는 과정을 포함하며, 조립을 위한 알고리즘을 새로 설계하였다. 이 시스템은 기존 레고 제품의 한계를 극복하고, 사용자에게 주어진 부품으로 다양한 모델을 자유롭게 조립할 수 있게 한다. 또한, 복잡한 레고 조립 과정을 간소화하고, 조립의 장벽을 낮추는 데 도움을 준다.

  • PDF

대학포탈 웹사이트 수용 및 사용에 영향을 미치는 요인 (Factors influencing the acceptance and usage of university portal websites)

  • 박관희
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2004년도 춘계학술대회
    • /
    • pp.304-315
    • /
    • 2004
  • 본 연구는 인터넷 환경 하에서 Davis의 기술수용모델(TAM)을 확장한 것이다. 본래의 TAM 모델에서는 인지된 사용용이성(perceived ease of use) 및 인지된 사용편이성(perceived usefulness)이 시스템 사용을 설명할 때 가장 중요한 요인이라고 제안하고 있다. 그러나 TAM 모델은 실제 시스템 사용의 약 $40\%$만 설명하고 있어 이 모델의 확장이 필요한 편이다. 본 연구에서는 기존의 TAM 모델에, Flow 이론에서 언급된 "인지된 즐거움 (perceived enjoyment)" 및 혁신확산이론(IDT)에서 언급된 "일치성(compatibility)"을 추가하여 TAM 모델을 확장하여 사용하였다. 본 연구자가 근무하는 대학의 대학포탈(university portals) 웹사이트를 사용하여 이 모델을 평가하였다.

  • PDF

Manufacturing Progress with Embodied Technological Change

  • Shin, Dong-Wook
    • 기술혁신연구
    • /
    • 제1권1호
    • /
    • pp.84-99
    • /
    • 1993
  • 오래도록 생산성향상곡선 (또는 학습곡선), 생산함수, 그리고 대체곡선 등은, 서로 관련이 없는 별개의, 그리고 순전히 경험적인 (empirical) 현상들인 것들로서 이해되어 왔었다. 그러나 1980년대 중반에 발표된 Muth 교수의 탐색이론 (Search Theory)의 생산성향상곡선에서 관찰된 제반현상들을 모두 설명함으로써 이들 현상은 하나의 통합이론체계에 의하여 일관되게 설명되게 되었다. 이 이론의 초기형태는 그 보편성을 구속하는 네 가지 가설 위에 설립되었었으나 점차적으로 이들 가설들이 완화되면서 (relaxed) 이 이론은 또한 해독 력에서 뿐만 아니라 일반성에 있어서도 계속 강화되어 왔다. 본 논문의 목적은, 이들 네 가지 가설들 중 유일하게 아직 완화되지 못하고 있는, 실제 현상과 다분히 유리된, 두 번째 가설, 즉$\ulcorner$생산성향상을 위한 탐색과정에서 새로이 발견된 개량 신기술 (또는 생산방식) 은 즉각적으로 채택될 것$\lrcorner$이라는 가설을 완화함으로써, 보다 현실에 대한 해석력과 일반성 면에서 개선된 모델을 제시하는 데 있다. 이를 위하여 제시된 모델은 Muth 교수의 탐색이론모델에 두가지 변수를 더함으로써 확장하여 만든 모델이다. 이 두 변수는 신기술의 채택 (또는 획득)을 위하여 지불하여야 하는 투자비변수와 탐색과정을 통하여 발견은 되었으나 아직 채택은 되지 않은, 유보상태 신기술의 운영비용 변수(또는 수익성변수)등이다. 이 모델의 내용은, 생산성향상은 신기술이 구현된 (embodied) 장비 (equipment)를 사용함으로써 실현되며, 따라서 창의적 활동의 이득은 이들 장비에 대한 투자행위로서 실현된다는 것이다. 이 모델은 보다 나은 신기술이 또 발견될 것이라는 기대 하에, 현재 발견된 최신기술을 채택하지 않는 투자지연현상을 예측.설명해 주며 따라서 이로 인한 기술적 비효율성의 존재이유를 제시한다. 또한 이 모델은 생산성 향상곡선의 초기굴곡현상, 정체현상, 그리고 도약현상 등을 모두 설명해 준다.

  • PDF