• 제목/요약/키워드: 설명 가능성

검색결과 1,106건 처리시간 0.025초

데이터웨어하우스 환경에서의 설명기반 데이터마이닝 (Explanation-Based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 지능정보연구
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF

LIME과 SHAP 모델 공유에 의한 모델 해석 (Model Interpretation through LIME and SHAP Model Sharing)

  • 김용길
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.177-184
    • /
    • 2024
  • 데이터가 빠른 속도로 증가하고 있는 가운데 가능한 최고의 정확도를 달성하기 위해 모든 종류의 복잡한 앙상블 및 딥 러닝 알고리즘이 사용되고 있다. 그렇지만, 이러한 모델이 알 수 없는 데이터를 예측/분류/인식/추적하는 방법과 관련하여 예측, 분류, 인식, 추적이 항상 신뢰할 수 있는 것은 아니다. 데이터 부족, 불균형 데이터 세트, 편향된 데이터 세트 등과 같은 다양한 이유가 학습 모델에 의해 포착되는 결정에 영향을 미칠 수 있다. 이와 관련하여 현재 모델의 설명 가능성에 관한 연구가 관심을 끌고 있다. 현재 설명 가능성 기법과 관련하여 LIME과 SHAP가 보편적으로 사용되고 있지만, 출력 결과들은 다소 상이한 측면을 나타내고 있다. 이에 본 연구에서는 LIME과 SHAP을 결합하는 방식을 소개하고, 데모와 관련해서 IEEE CIS 데이터 세트에서 거래를 사기로 분류할 때 LightGBM 및 Keras 모델이 내린 결정에 대한 설명 가능성을 분석한다.

디지털 유지관리를 위한 데이터 기반 교량 신축이음 유간 평가 (Evaluation of Data-based Expansion Joint-gap for Digital Maintenance )

  • 박종호;신유성
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권2호
    • /
    • pp.1-8
    • /
    • 2024
  • 신축이음 장치는 교량 상부구조의 신축량을 수용할 목적으로 설치되며 공용중 충분한 유간을 확보하여야 한다. 안전점검 및 정밀안전진단 수행 시 유간부족 및 유간과다에 대한 손상을 명시하고 있으나, 유간에 따른 교량의 이상 거동을 판별하기 위한 기준이 미흡하다. 본 연구에서는 동일 신축이음부의 유간 데이터를 지속적으로 추적하여 데이터 기반의 유지관리 방안을 제시하였다. 689개소의 신축이음 장치에서 계절별 영향을 고려하여 총 2,756개의 유간 데이터를 수집하였다. 동일 위치에서 4개 이상의 데이터를 통해 신축거동을 분석할 수 있는 유간 변화 평가 방안을 마련하였으며, 신축거동에 영향을 미치는 인자를 분류하고 딥러닝과 설명 가능한 AI를 통해 각 인자의 영향도를 분석하였다. 유간 평가 그래프를 통해 교량 상부구조의 이상 거동을 협착 및 기능 고장으로 분류하였다. 이론적 거동을 보이고 있다하더라도 협착 가능성이 나타날 수 있는 사례 및 하절기 협착 가능성이 매우 높게 나타난 사례가 도출되었다. 협착 가능성은 낮으나 교량 상부구조에 기능상 문제점이 발생했을 가능성이 높은 사례와 시공오류에 따라 신축이음 장치가 재시공된 사례도 도출되었다. 딥러닝 및 설명 가능한 AI를 통한 영향인자 분석은 기존의 신축유간 계산식 및 교량 설계에 따른 결과로 설명 가능하여 신뢰 가능한 수준으로 판단되어 추후 모델의 개선을 통해 유지관리를 위한 가이드를 제시할 수 있을 것이라 판단된다.

21세기 공공도서관의 발전방향

  • 현규섭
    • 한국비블리아학회:학술대회논문집
    • /
    • 한국비블리아학회 2002년도 발표논집 제7집
    • /
    • pp.7-23
    • /
    • 2002
  • 공공도서관의 미래는 전자화된 정보의 통신 체계 확립과 확산된 컴퓨터의 보급으로 인하여 급격한 변화를 마지하게 될 것이다. 변화의 핵심에는 "텍스트성의 종언"과 "가상세계의 공유된 환각"의 가능성이 역동적인 작용력으로 잠복되어 있다. 공공도서관은 이들 두 가지의 변인이 초래하는 시대에 어떻게 존재하여야 하는지를 고찰하여 보려한다. 먼저 탈 구조주의이론이 제기하는 "텍스트성의 종언"이라는 명제를 살펴보고자 한다. 다음으로 사이버 스페이스의 무한 가능성에 대한 이해를 설명한다. 이를 통하여 공공도서관이 있어야 할 존재양식을 제시하고자 한다. 이러한 시도는 무모한 모험이 될 것이다. 그러나 장래에 대비하기 위한 방향을 설정하는 데에는 유용한 관찰이 될 수 있을것이다.향을 설정하는 데에는 유용한 관찰이 될 수 있을것이다.

  • PDF

기술현황분석 - 나노제품의 안전성 설계 절차

  • 김재현;김광섭;이학주
    • 기계와재료
    • /
    • 제25권3호
    • /
    • pp.68-85
    • /
    • 2013
  • 나노제품의 안전성은, 나노제품에 사용된 나노물질의 독성과 나노물질의 노출가능성을 동시에 고려함으로써 평가할 수 있다. 본 문서는 나노물질의 독성 데이터는 이미 확보된 것으로 가정하고, 나노제품의 안전성을 향상시키는 설계 절차에 대하여 기술한다. 나노제품에서 나노물질이 노출되는 정도를 기계적인 손상의 관점에서 평가함으로써 노출 가능성을 추정하고, 이 추정치를 나노물질의 독성값 및 노출 한계와 비교함으로써 나노제품의 안전성을 평가하거나 예측한다. 나노제품의 설계 단계에서 이러한 안전성 평가 및 예측 방안을 적용하는 방법을 설명한다.

  • PDF

BC유의 국제벙커링과 수출 가격 차이에 대한 실증 분석 (An Empirical Analysis on the Price Difference between International Bunkering and Export for Bunker-C)

  • 김영덕;한현옥
    • 자원ㆍ환경경제연구
    • /
    • 제16권2호
    • /
    • pp.239-273
    • /
    • 2007
  • 해외 판매 BC유의 국제벙커링과 수출의 경우에는 거의 유사한 품질에도 불구하고 서로 다른 가격으로 판매되고 있으며, 이 두 시장에서의 가격 차이는 2002년 이후에 크게 확대되는 모습을 보이고 있다. 실증 분석을 통하여 한국에서의 벙커링 가격과 수출 가격의 차이가 2002년 6월을 기점으로 구조적인 변화가 발생하였을 가능성이 있으며, 2002년 6월까지는 두 가격의 차이를 설명하지 못하였던 싱가포르에서의 벙커링과 연료유 가격 차이가 2002년 7월부터는 한국에서 두 가격의 차이를 설명하는 요인으로 나타나고 있음을 확인하였다. 또한, 미래 유가 상승을 기대하게 하는 전기 시차의 국제 원유가격의 상승률도 한국에서 벙커링과 수출 가격의 차이를 설명하는 요인임을 알 수 있었다. 이러한 추정 결과는 한국에서의 국제벙커링과 수출의 가격 차이가 가격차별에 의해서 설명될 가능성을 배제하지는 않는 결과이다.

  • PDF

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

데이터 웨어하우스 환경에서의 설명기반 데이터 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터 마이닝 기법들이 연구되어왔다. 특히 데이터 웨어하우스의 등장은 이러한 데이터 마이닝에 있어 필요한 데이터 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성 없는(trivial, spurious and irrelevant)내용만 무수히 쏟아낼 수 있다. 그러므로 데이터 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라도 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문에서는 데이터 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이터 웨어하우스로부터 연관규칙을 검증하는 일련의 아텍쳐(architecture)를 제시하고다 한다. 먼저 데이터 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이터 웨어하우스와 데이터 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이터 웨어하우스으 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기위한 지식표현 방법으로 Relational Predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이터 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 도메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이터 마이닝 접근을 제시하였다는데 있다.

  • PDF

페미니스트 관점에 근거한 소녀비행 요인의 검증을 통한 성-특성적 이론의 모색 (Search of Gender-Specific Theory through Empirical Testing of Factors of Girls' Delinquency based on Feministic Perspectives)

  • 김지연;조현빈
    • 한국콘텐츠학회논문지
    • /
    • 제10권1호
    • /
    • pp.275-285
    • /
    • 2010
  • 지금까지 일반적인 청소년비행을 설명하는 이론들은 많은 발전을 이루었지만, 여성 특히 여자청소년의 비행에 관련되는 요인들을 설명하는 이론들은 극히 소수이고, 대표적인 청소년비행 이론들은 성 중립적인 사회이론으로 소년들의 비행을 설명하는데 적합한 것들이다. 따라서 여성의 특수하고 독특한 경험을 반영하는 여자청소년의 비행에 보다 설득력 있는 요인을 도출해낼 수 있는 성-특성적(gender-specific) 이론이 필요하다고 본다. 이러한 문제에 관심을 가졌던 페미니스트 학자들은 여자청소년의 비행을 설명하는 성 특성적 요인들의 검증을 수행하였고, 소녀들의 비행을 설명하는데 적절한 요인들에 대한 학자들 간에 일치가 이루어지지는 않고 있지만, 일부 요인들은 소년들보다는 소녀들의 비행을 설명하는데 보다 적절하다는데 합의하였다. 이에 이 연구에서는 여자청소년의 비행을 설명하는데 적절한 성 특성적 요인들로 알려진 요인들로서 개인적 상황에 대한 불만, 스스로의 일탈적 낙인과 주위의 일탈적 낙인, 자존감, 부모로부터의 학대나 주변 사람으로부터의 범죄 피해 경험 등의 요인과 비행의 관계를 한국청소년 패널조사(KYPS) 자료를 이용하여 검증하였다. 연구결과 선행연구 결과와 완전히 일치하지는 않지만, 대부분의 요인들이 소년들의 비행 보다는 소녀들의 비행을 설명하는데 설명력이 높은 것으로 나타나 이러한 요인들에 대한 후속연구의 수행을 통해 성-특성적 이론의 가능성을 고려해 볼 수 있다는 점에서 의미 있는 연구라고 생각된다.

물리 외 교과서에 제시된 물리적 현상 설명이 학생들의 물리 개념 형성에 미치는 영향 (Effects of the Explanations of Physical Phenomena Given in Non-Physics Textbooks on the Formation of Students' Physical Conceptions)

  • 박미진;김영민
    • 한국과학교육학회지
    • /
    • 제23권2호
    • /
    • pp.155-164
    • /
    • 2003
  • 본 연구의 목적은 물리 외 교과서의 물리 내용 설명이 학생들의 물리개념 형성에 미치는 영향에 대하여 조사하는 것이다. 본 연구를 위해 부산에 있는 두 중학교에서 각 39명의 학생들로 구성된 한 학급씩을 선정하였으며, 학생들의 개념 조사를 위해 두 종류의 검사 도구를 개발하였다. 검사 도구는 A는 물리 외 교과서의 물리 내용에 관한 설명을 읽은 후에 학생들의 개념을 조사하기 위한 것이고, 검사 도구는 B는 똑같은 물리적 현상에 대해 물리 교육 전문가에 의해서 물리학적으로 이해가 가능하도록 다시 진술한 설명을 읽은 후에 학생들의 개념을 조사하기 위한 것이다. 각 학급에 두 검사 도구 모두를 적용시켰다. 이때 공평한 조사를 위해 한 학급에는 검사 도구 A를 적용한 후 검사 도구 B를 적용하였고, 다른 학급에는 검사 도구 B를 적용한 후 검사도구 A를 적용하였다. 본 연구의 결과는 다음과 같다. 두 학급 모두에서 물리 교육 전문가에 의해서 재진술된 설명에 대한 학생들의 이해도가 물리 외 교과서의 설명에 대한 이해도 보다 더 높게 나타났다(p< .01). 이것은 물리 외 교과서에서의 모호하고 바르지 못한 물리 개념의 설명이 학생들의 오개념을 유발할 가능성이 있으며, 적절치 못한 문장의 표현 및 용어의 선택, 애매한 문장의 문법적인 구조가 물리 개념을 올바르게 이해하는데 방해가 됨을 알 수 있다. 또한 적절치 못한 예와 잘못된 그림을 제시하는 것이 오개념을 형성시킬 가능성이 높다고 볼 수 있다. 그리고 물리 교과서에 사용하는 용어와 물리 외 교과서에서 사용하는 용어가 다른 것이 학생들의 혼동을 야기 시킬 수 있다는 것을 알 수 있다.