• 제목/요약/키워드: Bayesian 분석

검색결과 692건 처리시간 0.033초

망막 질환 진단을 위한 베이지안 네트워크에 기초한 데이터 분석 (Bayesian Network-based Data Analysis for Diagnosing Retinal Disease)

  • 김현미;정성환
    • 한국멀티미디어학회논문지
    • /
    • 제16권3호
    • /
    • pp.269-280
    • /
    • 2013
  • 본 논문에서 망막 질환 요인간의 의존도 분석을 위해 효율적인 분류기를 활용할 수 있는 방안을 제시하였다. 먼저 여러 베이지안 네트워크 중에서 TAN (Tree-Augmented Naive Bayesian Network), GBN(General Bayesian Network)과 Markov Blanket으로 특징축소된 GBN과의 분류성능과 예측정확률을 비교분석하였다. 그리고 처음으로, 높은 성능을 보인 TAN을 망막 질환 임상데이터의 의존도 분석에 적용하였다. 의존도 분석 결과, 망막 질환의 진단과 예후 예측에 활용의 가능성을 보였다.

Bayesian 기반 Multi-Segmented 곡선식을 활용한 수위-유량 곡선의 불확실성 분석 (A development of rating-curve using Bayesian Multi-Segmented model)

  • 김진영;김진국;이재철;권현한
    • 한국수자원학회논문집
    • /
    • 제49권3호
    • /
    • pp.253-262
    • /
    • 2016
  • 수위-유량 관계곡선(rating curve)은 수위표에서 관측된 수위 및 유량을 이용하여 만들어진 회귀분석식을 의미하며, 하천의 수위를 유량으로 환산하는 방법으로 일반적으로 활용되고 있다. 그러나 수위-유량 관계곡선식에서 저수위와 고수위와 분리 및 매개변수 추정에 있어 불확실성을 고려한 해석은 이루어지지 않고 있다. 이러한 이유로 본 연구에서는 수위-유량 관계곡선식에서 매개변수 추정 및 저 고수위 분리시 발생하는 문제점을 개선하기 위해 Bayesian 기법을 도입하였으며, 수위-유량 관계곡선식의 매개변수의 추정과 더불어 불확실성을 정량화 하는데 목적을 두었다. 이와 더불어 Bayesian 모형 기반 Multi-Segmented 수위-유량 관계곡선(Bayesian M-S)을 활용하여 저 고수위를 분리할 수 있는 새로운 수위-유량 관계곡선을 개발하고 기존 수위-유량 관계곡선과 비교 분석을 실시하였다. 그 결과 본 연구에서 개발한 Bayesian M-S 기법이 기존 수위-유량 관계곡선식 보다 개선된 결과를 도출할 수 있었으며, 수위-유량 관계곡선식의 신뢰구간을 제시하는데 유리한 것을 확인할 수 있었다.

효율적 구조 학습 알고리즘과 데이타 차원축소를 통한 베이지안망 기반의 마이크로어레이 데이타 분석법 (A Method for Microarray Data Analysis based on Bayesian Networks using an Efficient Structural learning Algorithm and Data Dimensionality Reduction)

  • 황규백;장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.775-784
    • /
    • 2002
  • DNA chip 기술에 의해 얻어지는 마이크로어레이(microarray) 데이타는 세포나 조직 내의 수천 개 유전자의 발현도(expression level)를 한번에 측정한 것으로, 유전자 발현 양상에 기반한 암의 진단, 유전자의 기능 예측 등에 이용되고 있다. 다양한 데이타 분석 기법들 중 베이지안망(Bayesian network)은 데이타의 각 속성들간의 관계를 그래프 형태로 표현할 수 있는 특징을 가지고 있다. 이는 마이크로어레이 데이타의 분석을 통해 여러 유전자와 조직의 특성(암의 종류 등) 사이의 관계를 밝히는데 유용하다 하지만 대부분의 마이크로어레이 데이타는 sparse data로 베이지안망을 비롯한 각종 분석 기법의 적용을 어렵게 하고 있다. 본 논문에서는 베이지안망에 기반한 마이크로어레이 데이타 분석을 위해 효율적 구조 학습 알고리즘과 데이타 차원 축소를 이용한다. 제시되는 분석법은 실제 마이크로어레이 데이타인 NC160 data set에 적용되었으며, 그 유용성은 데이타로부터 학습된 베이지안망이 실제 생물학적으로 알려진 사실들을 어느 정도 정확하게 표현하는지에 의해 평가되었다.

'0-과잉 모형'을 이용한 집중호우의 발생특성 분석 (Analysis of torrential rainfall characteristics using 'zero-inflated models')

  • 김상욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.453-453
    • /
    • 2017
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

궤도틀림 진전율 추정을 위한 베이지안 회귀분석 모형 연구 (A Bayesian Regression Model to Estimate the Deterioration Rate of Track Irregularities)

  • 박범환
    • 한국철도학회논문집
    • /
    • 제19권4호
    • /
    • pp.547-554
    • /
    • 2016
  • 본 연구는 궤도 틀림을 관리하기 위한 궤도 품질 지수(TQI)의 진전율 추정에 관한 것이다. 이와 관련한 기존 연구 대부분은 시간에 따른 TQI 값의 선형 회귀분석을 통해 구해진 기울기를 기준으로 상수 진전율을 제시하는 데 그치고 있다. 본 연구는 과거 데이터 혹은 전문가의 식견으로부터 도출되는 파라미터의 사전 분포를 효과적으로 반영할 수 있으며, 파라미터값의 확률 분포를 유도해 낼 수 있는 베이지안 방법론에 기초한 진전율 추정 모델을 제안하고, 기존의 전통적인 회귀분석 모형과의 비교 연구를 통해, 베이지안 방법론의 활용 가능성을 검토해 보았다.

Bayesian Markov Chain Monte Carlo 기법을 통한 NWS-PC 강우-유출 모형 매개변수의 최적화 및 불확실성 분석 (Parameter Optimization and Uncertainty Analysis of the NWS-PC Rainfall-Runoff Model Coupled with Bayesian Markov Chain Monte Carlo Inference Scheme)

  • 권현한;문영일;김병식;윤석영
    • 대한토목학회논문집
    • /
    • 제28권4B호
    • /
    • pp.383-392
    • /
    • 2008
  • 수공구조물을 설계하거나 수자원계획을 수립할 때 제한된 수문자료로 인해 수문모형의 매개변수를 추정하는데 어려움이 따르며 추정된 결과에 신뢰성을 부여하기 위해서 필수적으로 불확실성 분석이 필요하다 하겠다. 이러한 관점에서 본 연구에서는 국내외에서 주로 이용되고 있는 NWS-PC 강우-유출 모형을 대상으로 보다 진보된 매개변수 추정과 불확실성 분석이 가능한 Bayesian Markov Chain Monte Carlo 기법과 결합하여 국내 소양강댐 유역 일유입량 모의에 적용하였다. 실측 일유입량 자료를 대상으로 모형의 검정과정을 수행하였으며 NWS-PC 모형의 총 13개의 매개변수에 대한 사후분포를 추정하여 유출수문곡선의 불확실성 구간을 추정하였다. 검정 및 검증 모두에서 Bayesian Markov Chain Monte Carlo 기법이 모형의 적합성 측면에서 기존 방법론과 비교해보면 다소 우수하거나 비슷한 결과를 나타내었다. 실제로 유역에 발생하는 유출은 다양한 요인에 따라 변화될 수 있으며 이러한 점에서 Bayesian 방법은 강우-유출 관계에서 발생하는 이러한 불확실성을 매개변수의 불확실성으로 인지함으로서 우리가 예상치 못한 유출 사상에 대한 형태를 고려할 수 있는 장점이 있다. 따라서 댐 설계와 같은 대규모 수공 구조물 설계 시에 이러한 불확실성이 접목된 강우-유출 분석이 이루어진다면 보다 합리적인 방법으로 홍수 위험도 분석이 가능하며 더욱이 댐 규모 결정에 있어서 신뢰성 있는 의사 결정 수단을 제공할 수 있을 것으로 사료된다.

베이지안 로지스틱 회귀모형에서의 추론에 대한 연구 (Inferential Problems in Bayesian Logistic Regression Models)

  • 황진수;강성찬
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1149-1160
    • /
    • 2011
  • 기존의 frequentist 추론에 비해 Bayesian 추론에서의 가설 검정 및 모형 선택 문제는 학자들 간에 일치된 견해를 보이지 못하고 있으며 아직도 논란이 되는 것들이 많다. Bayesian 추론에서 가설 검정 및 모형 선택의 기준으로 널리 쓰이는 Bayes factor는 이해하기 쉬우나 여러 경우에 구하기 어려운 단점이 존재한다. 그 외에 다른 기준으로 Spiegelhalter 등 (2002)가 제시한 DIC(Deviance Information Criterion)과 frequentist 추론에서의 P-value에 대비되는 Bayesian P-value가 있다. 본 논문에서는 Swiss banknote 자료를 Bayesian 로지스틱 회귀모형으로 분석하고 관련 기준들을 구하여 각 기준들이 일관성 있는 결론을 보이는지 확인하고자 한다.

이산형 자료 예측을 위한 베이지안 네트워크 분류분석기의 성능 비교 (The performance of Bayesian network classifiers for predicting discrete data)

  • 박현재;황범석
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.309-320
    • /
    • 2020
  • 방향성 비순환 그래프(directed acyclic graph; DAG)라고도 하는 베이지안 네트워크(Bayesian network)는 변수 사이의 관계를 확률과 그래프를 통해 모형화할 수 있다는 점에서 최근 의학, 기상학, 유전학 등 여러 분야에서 다양하게 활용되고 있다. 특히 이산형 자료의 예측에 사용되는 베이지안 네트워크 분류분석기(Bayesian network classifier)가 최근 새로운 데이터 마이닝 기법으로 주목받고 있다. 베이지안 네트워크는 그 구조와 학습 방법에 따라 여러 가지 다양한 모형으로 분류할 수 있다. 본 논문에서는 서로 다른 성질을 가진 이산형 자료를 바탕으로 구조 학습 방법에 차이를 두어 베이지안 네트워크 모형을 학습시킨 후, 가장 간단한 방법인 나이브 베이즈 (naïve Bayes) 모형과 비교해 본다. 학습된 모형들을 여러 가지 실제 데이터에 적용하여 그 예측 정확도를 비교함으로써 최적의 분류 분석 결과를 얻을 수 있는지 살펴본다. 또한 각각의 모형에서 나타나는 그래프를 통해 데이터의 변수 사이의 관계를 비교한다.

Bayesian Network 기반 소규모 저수지의 수문학적 위험도 분석 모형 개발 (A Development of Hydrologic Risk Analysis Model for Small Reservoirs Based on Bayesian Network)

  • 김진국;김진영;권덕순;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.105-105
    • /
    • 2017
  • 최근 우리나라에서는 국지성호우로 인해 발생하는 돌발홍수에 방어하지 못하는 소규모 저수지에 대한 붕괴사고가 빈발하고 있다. 붕괴된 저수지를 살펴보면, 대체적으로 규모가 작아 체계적인 안전관리가 이루어지지 않거나 경과연수가 50년 이상인 필댐(fill dam) 형식으로 축조된 노후저수지로서 갑작스러운 홍수를 대응하는데 있어 매우 취약한 상태이다. 체계적으로 운영되는 대형댐에 비해 축조기간이 오래된 소규모 저수지의 경우, 저수지에 대한 수문학적 정보가 거의 없거나 미계측되어 보수보강이 필요한 저수지를 선정하거나 정량적인 위험도를 분석하는데 매우 어려운 실정이다. 이러한 이유로 본 연구에서는 노후된 소규모 저수지에 대한 수문학적 파괴인자들을 선정하여 Bayesian Network기반의 소규모 저수지 위험도 분석 모형을 구축하였다. 구축된 모형을 기준으로 고려될 수 있는 다양한 위험인자 및 이들 인자간의 연관성을 평가하였으며, 각각의 노드에 파괴인자를 노드로 할당하여 소규모 저수지의 위험도를 분석하였다. Bayesian Network기법의 도입으로 불확실한 상황을 확률로 표시하고, 복잡한 추론을 정량화된 노드의 관계로 단순화시켜 노드의 연결 관계로 표현하였다. 본 연구에서 제안된 모형은 노후된 소규모 저수지의 수문학적 위험도를 정량으로 분석하는 모형으로서 활용성이 높을 것으로 기대된다.

  • PDF

국면전환 임계 자기회귀 분석을 위한 베이지안 방법 비교연구 (A Comparison Study of Bayesian Methods for a Threshold Autoregressive Model with Regime-Switching)

  • 노태영;조성일;이령화
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1049-1068
    • /
    • 2014
  • 자기회귀 모형(autoregressive model)은 일변량(univaraite) 시계열자료의 분석에서 널리 사용되는 방법 중 하나이다. 그러나 이 방법은 자료에 일정한 추세가 있다고 가정하기 때문에 자료에 분절(structural break)이 존재할 때 적절하지 않을 수 있다. 이러한 문제점을 해결하기 위한 방법으로 국면전환(regime-switching) 모형인 임계자기회귀 모형(threshold autoregressive model)이 제안되었는데 최근 지연 모수(delay parameter)을 포함한 이 국면전환(two regime-switching) 모형으로 확장되어 많은 연구가 활발히 진행되고 있다. 본 논문에서는 이 국면전환 임계자기회귀 모형을 베이지안(Bayesian) 관점에서 살펴본다. 베이지안 분석을 위해 모수적 임계자기 회귀 모형 뿐만 아니라 디리슐레 과정(Dirichlet Process) 사전분포를 이용하는 비모수적 임계자기 회귀 모형을 고려하도록 한다. 두 가지 베이지안 임계자기 회귀 모형을 바탕으로 사후분포를 유도하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo) 방법을 통해 사후추론을 실시한다. 모형 간의 성능을 비교하기 위해 모의실험을 통한 자료 분석을 고려하고, 더 나아가 한국과 미국의 국내 총생산(Gross Domestic Product)에 대한 실증적 자료 분석을 실시한다.