• 제목/요약/키워드: 신뢰도 추론

검색결과 272건 처리시간 0.024초

신뢰 값 기반의 대용량 OWL Horst 온톨로지 추론 (Confidence Value based Large Scale OWL Horst Ontology Reasoning)

  • 이완곤;박현규;바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.553-561
    • /
    • 2016
  • 웹으로부터 얻어진 데이터를 통해 자동적으로 온톨로지를 확장하는 많은 기계학습 방법들이 존재한다. 또한 대용량 온톨로지 추론에 대한 관심이 증가하고 있다. 하지만 웹으로부터 얻어진 다양한 데이터의 신뢰성 문제를 고려하지 않으면, 불확실성을 내포하는 추론결과를 초래하는 문제점이 있다. 현재 대용량 온톨로지의 신뢰도를 반영하는 추론에 대한 연구가 부족하기 때문에 신뢰 값 기반의 대용량 온톨로지 추론 방법론이 요구되고 있다. 본 논문에서는 인메모리 기반의 분산 클러스터 프레임워크인 스파크 환경에서 신뢰 값 기반의 대용량 OWL Horst 추론 방법에 대해서 설명한다. 기존의 연구들의 문제점인 중복 추론된 데이터의 신뢰 값을 통합하는 방법을 제안한다. 또한 추론의 성능을 저하시키는 문제를 해결할 수 있는 분산 병렬 추론 알고리즘을 설명한다. 본 논문에서 제안하는 신뢰 값 기반의 추론 방법의 성능을 평가하기 위해 LUBM3000을 대상으로 실험을 진행했고, 기존의 추론엔진인 WebPIE에 비해 약 2배 이상의 성능을 얻었다.

신뢰값 기반 대용량 트리플 처리를 위한 스파크 환경에서의 RDFS 온톨로지 추론 (Spark based Scalable RDFS Ontology Reasoning over Big Triples with Confidence Values)

  • 박현규;이완곤;바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.87-95
    • /
    • 2016
  • 최근 인터넷과 디바이스의 발전으로 지식 정보의 양이 방대해 지면서 대용량 온톨로지를 이용한 추론 연구가 활발히 진행되고 있다. 일반적으로 트리플로 표현되는 빅데이터는 기계학습 프로그램이나 지식 공학자가 각 트리플의 신뢰도를 측정하여 제공한다. 하지만 수집된 데이터는 불확실한 데이터를 포함하고 있으며, 이러한 데이터를 추론하는 것은 불확실성을 내포한 추론 결과를 초래할 수 있다. 본 논문에서는 불확실성 문제를 해결하기 위해 수집된 데이터에 대한 신뢰의 정도를 나타내는 신뢰값(Confidence Value)를 이용한 RDFS 규칙 추론 방법에 대하여 설명하고, 메모리 기반의 분산 클러스터 프레임워크인 스파크(Spark)를 기반으로 데이터의 불확실성에 대한 고려를 하지 않는 기존의 추론 방법과 달리 신뢰값 계산에 대한 방법을 응용하여 RDFS 규칙을 통해 추론되는 새로운 데이터의 신뢰값을 계산하며, 계산된 신뢰값은 추론된 데이터에 대한 불확실성을 나타낸다. 제안하는 추론 방법의 성능을 검증하기 위해 온톨로지 추론과 검색 속도를 평가할 때 활용되는 공식 데이터인 LUBM을 대상으로 신뢰값을 추가하여 실험을 수행하였으며, 가장 큰 데이터인 LUBM3000을 수행하였을 때 1179초의 추론시간이 소요되었고, 초당 350K 트리플을 처리할 수 있는 성능을 보였다.

지능형 전자 상거래 시스템 구축을 위한 친밀도 기반 신뢰도 추론방법 (An Intimacy-based Trust Reasoning Method for Intelligent Ecommerce Systems)

  • 권오병;박광호
    • 한국전자거래학회지
    • /
    • 제18권2호
    • /
    • pp.1-26
    • /
    • 2013
  • 전자상거래에서 신뢰도는 전자상거래 서비스 제공업체의 비가시성이나 그들의 평판으로 인한 소비자의 우려를 완화시켜주기 때문에 사용자의 신뢰수준을 추정하는 것은 전자상거래의 지속적 사용에 있어 중요한 기술이다. 기존의 신뢰도 측정법은 주로 전자상거래 시스템에서 사용된 정책과 평판기반의 추론에 근거한 사용자들의 초기 경험에 중심을 두었다. 그러나, 보다 성숙된 단계의 전자상거래 시스템 지속사용 가능성 추정을 위한 신뢰도 측정에 대해서는 별다른 대안이 없었다. 따라서 본 연구에서는 성숙단계에서의 전자상거래 시스템에 알맞은 신뢰도 추론방법을 제안한다. 특히, 친밀도는 평판뿐 아니라 신뢰도와도 깊이 관계하고 있기 때문에 사용자의 입력을 강제하지 않는 친밀도 측정 방법을 새롭게 개발하였다. 성과 측정을 위한 실험에서는 제안된 방법이 유효하고, 평판기반의 신뢰도 추론과 함께 사용할 수 있는 것으로 나타났다.

Natural Language Explanations 에 기반한 한국어 자연어 추론 (Korean Natural Language Inference with Natural Langauge Explanations)

  • 윤준호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2022
  • 일반적으로 대규모 언어 모델들은 다량의 데이터를 오랜시간 사전학습하면서 레이블을 예측하기 위한 성능을 높여왔다. 최근 언어 모델의 레이블 예측에 대한 정확도가 높아지면서, 언어 모델이 왜 해당 결정을 내렸는지 이해하기 위한 신뢰도 높은 Natural Language Explanation(NLE) 을 생성하는 것이 시간이 지남에 따라 주요 요소로 자리잡고 있다. 본 논문에서는 높은 레이블 정확도를 유지하면서 동시에 언어 모델의 예측에 대한 신뢰도 높은 explanation 을 생성하는 참신한 자연어 추론 시스템을 제시한 Natural-language Inference over Label-specific Explanations(NILE)[1] 을 소개하고 한국어 데이터셋을 이용해 NILE 과 NLE 를 활용하지 않는 일반적인 자연어 추론 태스크의 성능을 비교한다.

  • PDF

수학적 추론 능력 평가 기준에 관한 연구

  • 전평국;김은희;김원경
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제13권2호
    • /
    • pp.425-455
    • /
    • 2002
  • 본 연구는 수학교육에서 강조되고 있는 수학적 힘의 구성 요소 중의 하나인 수학적 추론 능력에 대한 교사들의 구체적인 이해를 돕고, 문제 해결 과정에서 학생들의 추론 능력을 분석하고 평가하는 데 도움을 주기 위해 문헌 연구 및 학생반응 분석결과에 기초하여 귀납적, 유비적, 연역적 추론능력에 대한 평가기준을 개발하였다. 또한, 개발된 평가기준을 구체적인 문제에 적용하였으며 이를 기초로 문제점을 수정 ${\cdot}$ 보완한 후, 전문가의 타당성 검증과 동일한 학생반응에 대한 채점결과의 일치도를 알아봄으로써 신뢰도 검증을 실시하였다.

  • PDF

로짓모형의 비모수적 추론의 비교 (Comparison of Some Nonparametric Statistical Inference for Logit Model)

  • 정형철;김대학
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.355-366
    • /
    • 2002
  • 범주형 자료의 구조파악에 주로 이용되는 로짓모형에서 비모수적 방법을 이용한 모수의 신뢰구간추정과 가설검정 등의 통계적 추론에 대하여 살펴보았다. 모수에 대한 통계적 추론에서 정규분포에 근거한 모수적 방법(Wald 방법)보다는 붓스트랩 방법이나 임의순열을 활용한 비모수적 방법이 많이 활용되고 있다. 본 연구에서는 로짓모형의 모수에 대한 비모수적 추론방법으로 붓스트랩(bootstrap)과 임의순열(random permutation)의 두 방법을 고려하고 모의실험을 통하여 가설검정의 검정력과 신뢰구간추정의 포함확률을 비교하였고 사례분석을 다루었다.

인과관계 지식 모델링을 위한 퍼지인식도와 베이지안 신뢰 네트워크의 비교 연구 (Fuzzy Cognitive Map and Bayesian Belief Network for Causal Knowledge Engineering: A Comparative Study)

  • ;김경윤;양형정;김수형;김정식
    • 정보처리학회논문지B
    • /
    • 제15B권2호
    • /
    • pp.147-158
    • /
    • 2008
  • 본 논문에서는 인과관계 지식의 표현과 추론에 가장 대표적으로 사용되는 퍼지인식도(FCM, Fuzzy Cognitive Map)와 베이지안 신뢰 네트워크(BBN, Bayesian Belief Network)를 구조적으로 분석한다. 퍼지인식도와 베이지안 신뢰 네트워크는 의사 결정을 지원하는데 중요한 인과관계 지식을 표현하고 추론하는데 사용되는 가장 대표적인 프레임워크이지만 인과관계 지식응용 영역에서 두 프레임워크의 역할에 대한 구조적 비교 연구는 이루어지지 않고 있다. 본 논문에서는 두 프레임워크의 구조적 비교를 통해 퍼지인식도와 베이지안 신뢰 네트워크의 중요한 특징들을 추출하고, 이를 통해 인과 지식 공학에서 어떻게 퍼지 인식도와 베이지안 신뢰 네트워크가 이용되어야 하는지를 보인다. 인과관계 지식의 표현과 추론의 과정을 평가하는데 비교 평가를 위한 항목으로서 본 논문에서는 사용성, 표현력, 추론능력, 정형화와 완결성이 사용되었다.

추론통계를 사용한 문헌정보학 연구에서 데이터 수집과 분석에 관한 비평적 고찰 (A Critical Review of the Use of Inferential Statistics in Library and Information Science Research in Korea)

  • 노정순
    • 한국문헌정보학회지
    • /
    • 제40권2호
    • /
    • pp.217-242
    • /
    • 2006
  • 본 연구는 국내 문헌정보학분야의 대표적인 4개 학술지에 2001부터 2004까지 발표된 792편의 연구논문 중 추론통계를 사용한 86편의 연구논문에서 활용한 데이터 수집방법과 추론통계기법을 비평적으로 고찰하였다. 표집방법별로 그리고 신뢰도검사와 가설과 모형의 검정에 사용된 통계기법별로 대표 연구논문을 소개하고, 사용된 기법으로 데이터를 수집하고 분석하는 과정에서 보인 문제점들을 논의하였다. 분석된 연구에서 표집방법으로는 확률표집보다는 비확률표집이 주로 사용되었으며, 질문지를 이용하여 데이터를 수집한 연구의 평균응답률은 74.47%로 분석되었으나, 응답률이 낮을 경우 무응답으로 인한 표집과정의 오류를 밝히려는 노력은 부족한 것으로 파악되었다. 추론통계기법 중 특히 신뢰도검사, 교차분석, 다중회귀분석, 요인분석, 다차원척도를 사용하는데 문제가 있는 것으로 분석되었다.

자동차보험 신뢰도 적용에 대한 베이지안 추론 방식 연구 (A study of Bayesian inference on auto insurance credibility application)

  • 김명준;김영화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.689-699
    • /
    • 2013
  • 본 연구는 가격 경쟁으로 인하여 최근 들어 요율 세분화가 심화되고 있는 자동차보험 시장에서, 부분 신뢰도의 적용 대상에 대한 경험적 사전분포 (empirical prior distribution) 함수 또는 무정보적 사전분포 (noninformative prior distribution) 정보의 가정을 통한 신뢰도 산출 방식에 대하여 살펴보았다. 요율 세분화의 확대로 가격 산출 단위의 수가 증가될 경우, 부분 신뢰도의 적용 대상은 점차 증가되게 될 것으로 판단되기 때문에, 기존에 제시된 신뢰도 적용 방식을 베이지안 프레임에서 적용, 추론함으로써 보다 다양하고 정교한 방식으로 그 활용 범위를 넓히고자 한다. 즉, 경험적으로 사용되는 사전 분포함수 또는 무정보적 사전 정보를 통하여 적절한 사후분포 (posterior distribution)함수를 도출하고 오차를 최소화하는 베이즈 통계량을 적용한 신뢰도를 추정하여 적용함으로써, 위험도 예측에 있어 기존에 제시된 방법과 비교하여 그 효용성을 입증하고자 한다. 현재 가장 많이 활용되는 제곱근 법칙 (square root rule)의 신뢰도 추정 방식에 베이지안 추론에서 도출된 통계량을 반영한 결과를 분석하여 실질적인 위험도에 수렴하는 수준을 비교하게 된다. 이는 이론적으로 위험도 예측에서 오차를 줄이는 방식에 대한 대안 제시와 더불어 신뢰도 적용 방식에 대한 추가적인 활용 대안을 보험업계에 제시함으로써 요율 세분화로 인한 부분 신뢰도 적용방식에 대한 그 이해와 활용의 폭을 넓히고자 한다.

우도에 기반한 임의효과에 대한 추론과 로지스틱 회귀모형에서의 응용 (Likelihood-Based Inference of Random Effects and Application in Logistic Regression)

  • 김광수
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.269-279
    • /
    • 2015
  • 본 논문에서는 임의효과에 대한 추론 문제가 다루어졌으며 이 추론에서 신뢰분포를 사용하는 것이 제안되었다. 신뢰분포를 이용한 방법은 표본의 크기가 작아도 임의절편들이 있는 로지스틱 회귀분석에서 좋은 결과를 보여주었으며, 자료분석을 통해서도 각 개체가 가지는 임의효과들에 대한 세밀한 분석이 가능함을 확인하였다.