• 제목/요약/키워드: 베이지안 분석

검색결과 467건 처리시간 0.024초

베이지안 네트워크와 신경망을 이용한 구매 패턴 분석 (A Purchase Pattern Analysis Using Bayesian Network and Neural Network)

  • 황정식;피수영;손창식;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.323-326
    • /
    • 2005
  • 실세계에서 일어나는 문제는 매우 복잡하고 다양하기 때문에 예측하기가 어렵고 다양한 상황들이 발생한다. 특히, 소비자의 구매에 따르는 행동을 분석하고 소비자의 다양한 기호를 예측하기 위해서는 구매자의 심리적 요인과 내적 요인이 많은 영향을 미치게 된다. 이러한 요인들은 직접적인 정보 처리가 어렵기 때문에 정보의 불확실성을 취급하는 기술이 필요하다. 따라서 본 논문에서는 상품 구매에 따르는 소비자의 구매행동 패턴을 분석하기 위해 판매자의 노하우와 소비자의 구매의식을 조사하여 이 데이터를 바탕으로 베이지안 네트워크를 구성하고 구매패턴을 분류하는 방법을 제안하였다. 특히, 베이지안 네트워크를 이용하여 불필요한 속성을 가진 데이터를 제거한 후 코호넨의 SOM을 이용하여 소비자의 구매 패턴을 분류하도록 하였다.

  • PDF

데이터마이닝의 베이지안 망 기법을 이용한 교통수단선택 모형의 설계 및 구축 (Design and Implementation of Travel Mode Choice Model Using the Bayesian Networks of Data Mining)

  • 김현기;김강수;이상민
    • 대한교통학회지
    • /
    • 제22권2호
    • /
    • pp.77-86
    • /
    • 2004
  • 데이터마이닝 (Data Mining)은 대용량의 데이터에 존재하는 관계, 패턴, 규칙 등을 효율적으로 탐색하여 이를 모형화함으로써, 유용한 정보로 추출 변환하는 일련의 과정이다. 특히 베이지안 망 (Bayesian Network)은 신경망, 유전자알고리즘 퍼지이론 등과 더불어 데이터마이닝의 중요한 기법 중의 하나로서 베이지안 통계 이론(Bayesian Statistics Theory)를 적용하여 변수들간의 확률적인 관계를 기호화함으로써, 설명변수들과 종속변수들간의 인과관계를 파악할 수 있다. 이 연구는 기존에 적용된 바가 없는 데이터마이닝의 베이지안 망을 이용하여 수도권 교통수단선택 모형을 구축한다. 2002년도 수도권 가구통행실태조사 자료의 사회 경제적 특성과 교통체계 특성을 반영하여 베이지안 망을 이용한 교통수단선택 모형을 설계 구축하여, 각 변수들간의 상관관계와 인과관계를 분석함으로써, 설명변수인 성과 연령의 구성비가 변하였을 때, 교통수단선택의 변화율(확률)을 예측한다. 이 연구를 통해 현실에서는 내재하나 설명변수간의 복잡한 상관성을 배제하고 설명변수들과 교통수단선택간의 단순한 직선관계를 가정하는 기존 교통수단선택 모형의 한계를 극복할 수 있는 가능성을 제시한다. 또한 선택되지 않은 교통수단에 대한 정보의 부족으로 인한 교통수단선택 모형 구축의 어려움을 극복한다. 또한 다양한 교통정책에 따른 교통수단선택의 변화를 실시간으로 시뮬레이션 할 수 있는 방법론을 개발한다.

베이지안 칼만 필터 기법의 훈련 기간에 따른 풍력 자원 예측 정확도 향상성 연구 (A Study of Improvement of a Prediction Accuracy about Wind Resources based on Training Period of Bayesian Kalman Filter Technique)

  • 이순환
    • 한국지구과학회지
    • /
    • 제38권1호
    • /
    • pp.11-23
    • /
    • 2017
  • 풍력 자원의 단기 예측 가능성은 풍력 발전 단지의 경제적 타당성을 평가하는 중요한 요소이다. 본 연구에서는 풍력 자원의 단기 예측 가능성을 향상시키는 방법의 하나로 베이지안 칼만 필터를 후처리 과정으로 적용하였다. 이때 추정된 모델과 관측 데이터의 상관관계를 평가하기 위하여 일정 시간 동안 베이지안 칼만 훈련 기간이 요구된다. 본 연구는 여러 훈련 기간에 따라 예측 특성을 정량적으로 분석하였다. 태백 지역에서는 3일 단기 베이지안 칼만 훈련으로 기온과 풍속을 예측하는 것이 다른 훈련 기간을 적용할 때보다 우수한 예측 성능을 보였다. 반면 이어도는 6일 이상의 베이지안 칼만 필터의 훈련 기간을 적용한 경우 가장 좋은 예측 성능을 나타낸다. WRF 예측 성능이 떨어지는 사례에서 베이지안 칼만 필터의 예측 성능향상이 뚜렷하게 나타나며, 반대로 WRF 예측이 정확한 지점에서는 필터적용에 따른 성능향상 정도가 약한 경향을 가진다.

베이지안 접근법과 모수불확실성을 반영한 보험위험 측정 모형 (Bayesian analysis of insurance risk model with parameter uncertainty)

  • 조재린;지혜수;이항석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.9-18
    • /
    • 2016
  • 모수불확실성을 반영하는 손실모형으로는 Heckman과 Meyers가 제안한 모형이 주로 인용되고 있다. 이 모형은 모수 자체가 어떤 확률분포를 따른다는 가정을 하고 있으며 IAA, Swiss Solvency Test, EU Solvency II 등에서 참고하고 있다. 반면 베이지안 기법을 이용한 연구는 모수에 대한 선험적 정보 즉, 사전분포를 이용하여 모수불확실성을 반영한다. 그러나 현실에서는 두 가지 방법을 동시에 고려해야 하는 상황이 빈번히 발생한다. 이에 본 연구는 Heckman-Meyers의 모형과 베이지안 접근법을 동시에 고려한 베이지안 H-M CRM모형을 제안하고 그 특성을 분석하였다.

베이지안 망 연결 구조에 대한 데이터 군집별 기여도의 정량화 방법에 대한 연구 (Quantitative Annotation of Edges, in Bayesian Networks with Condition-Specific Data)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.316-321
    • /
    • 2007
  • 본 연구에서는 베이지안 망 구조 학습에서, 학습 데이터의 특정 부분집합이 학습된 망의 각 연결 구조(edge)의 형성에 기여하는 정도를 정량화하는 방법을 제안한다. 생물학 정보의 분석 등에 베이지안 망 학습을 이용하는 경우, 제안된 방법은 망의 각 연결 구조의 형성에 특정 군집 데이터가 기여하는 정도의 정량화가 가능하다. 제안된 방법의 유효성을 보이기 위해, 벤치마크 베이지안 망을 이용하여 제안된 방법이 망 연결 구조에 대한 데이터 군집별 기여도를 효과적으로 정량화 할 수 있음을 보인다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

신뢰성분석 및 설계를 위한 베이지안 통계기법

  • 최주호
    • 기계저널
    • /
    • 제54권2호
    • /
    • pp.46-51
    • /
    • 2014
  • 최근 각종 공학문제의 해결을 위해 결정론적(Deterministic) 관점보다는 각종 불확실성을 고려한 확률적 (Probabilistic) 또는 추계적(Stochastic) 관점에서 분석 평가하려는 노력이 증가하고 있다. 이는 신뢰성분석 및 설계 측면에서 특히 중요하게 인식되고 있으며, 이를 구현하는 방법론으로 베이지안 통계기법(Bayesian Statistics)이 최근 많은 주목을 받고 있다. 이 글에서는 이러한 기법을 신뢰성 평가 및 고장예지에 어떻게 적용하고 있는지 사례를 중심으로 설명하고자 한다.

  • PDF

베이지안 접근법을 이용한 입력변수 및 근사모델 불확실성 하에서의 신뢰성 분석 (Reliability Analysis under Input Variable and Metamodel Uncertainty using Bayesian Approach)

  • 안다운;원준호;최주호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.97-100
    • /
    • 2009
  • 신뢰성 분석은 불확실성으로 인한 제품의 성능 변동을 안전확률이나 파괴확률로 정량화 하여 설계에 이용하기 위해 연구되어 왔다. 불확실성은, 데이터의 양에 따라-물질의 본질적인 특성으로서의 많은 데이터가 주어진 경우의 물리적 불확실성과 부족한 데이터에서의 인식론적 불확실성으로 구분되고, 불확실성을 갖는 대상에 따라-입력변수 및 근사모델 불확실성으로 구분된다. 물리적 불확실성에 대한 연구는 많이 진행되어 왔지만, 실제 산업현장에는 부족한 데이터로 인한 인식론적 불확실성이 지배적이며 이에 대한 연구는 최근에서야 진행되고 있다. 불확실성을 고려하는 신뢰성 기반 설계에는 효율성을 위해 실제모델을 대체하는 근사모델이 이용되는데, 근사모델법 자체에 대한 연구는 많이 진행되어 왔으나, 근사모델 이기 때문에 존재하는 불확실성을 고려한 연구는 최근에서야 연구되기 시작하였다. 본 연구에서는 베이지안 접근법에 기반하여 입력변수 및 근사모델 불확실성을 통합 고려하는 새로운 신뢰성 분석 기법을 제시하고 수치예제를 통해 타당성을 증명한 후, 이를 공학문제에 적용한다.

  • PDF

베이지안 공액 사전분포를 이용한 키워드 데이터 분석 (Keyword Data Analysis Using Bayesian Conjugate Prior Distribution)

  • 전성해
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-8
    • /
    • 2020
  • 빅데이터 분석에서 텍스트 데이터의 활용이 증가하고 있다. 따라서 텍스트 데이터의 분석 기법에 관한 많은 연구가 이루어지고 있다. 본 논문에서는 텍스트 데이터로부터 추출된 키워드 데이터의 분석을 위하여 공액사전분포 기반의 베이지안 학습 방법이 연구된다. 베이지안 통계학은 기존의 데이터에 새로운 데이터가 추가될 때마다 모수를 갱신하는 데이터 학습을 제공하기 때문에 시간에 따라 대용량의 데이터가 생성 및 추가되는 빅데이터 환경에서 효율적인 방법을 제공한다. 제안 방법의 성능과 적용 가능성을 보이기 위하여 실제 특허 빅데이터를 전처리하여 구축된 정형화된 키워드 데이터를 분석하는 사례연구를 수행한다.

베이지안 망에 기초한 불임환자 임상데이터의 분석 (Bayesian Network-Based Analysis on Clinical Data of Infertility Patients)

  • 정용규;김인철
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.625-634
    • /
    • 2002
  • 본 논문에서는 베이지안 망을 기초로 불임환자의 임상 데이터에 대한 다양한 분석 실험을 전개하였다. 이 실험을 통해 임신여부에 영향을 주는 요인들간의 상호의존성을 분석해보고, 또 NBN, BAN, GBN 등 제약조건이 다른 다양한 유형의 베이지안 망 분류기들의 분류성능을 서로 비교해보았다. 그리고 우리는 이와 같은 실험을 통해 임신가능여부(Clin)에 직접적인 영향을 미치는 중요한 요인들로 증상(IND), 약물치료법(stimulation), 여성의 나이(FA), 미세조작 난자의 수(ICT), Wallace 사용여부(ETM) 등 5개의 특성들을 가려낼 수 있었고, 이 요인들간의 상호 의존성도 찾아낼 수 있었다. 또 서로 다른 유형의 베이지안 망 분류기들 중에서 요인들간의 상호의존관계를 허용하는 좀 더 일반적인 BAN과 GBN 등이 그렇지 못한 NBN에 비해 상대적으로 더 높은 분류 성능을 보여준다는 것을 확인하였다. 또 결정트리와 k-최근접 이웃과 같은 다른 분류기들과의 성능 비교를 통해, 임상 데이터의 특성상 확률적 표현과 추론에 기초한 베이지안 망 분류기들이 보다 높은 성능을 보여준다는 사실도 확인할 수 있었다. 또 본 논문에서는 클래스 노드의 Markov blanket에 속한 특성들로 특성집합을 축소하는 것을 제안하고, 실험을 통해 이 특성 축소방법이 베이지안 망 분류기들의 성능을 높여 줄 수 있는지 알아보았다.