• 제목/요약/키워드: Bayesian 분석

검색결과 689건 처리시간 0.028초

Bayesian NSRP 모형을 이용한 추계학적 Downscaling 기법 개발 (Development of Stochastic Rainfall Downscaling using Bayesian Neyman-Scott Rectangular Pulse Model(NSRPM))

  • 김장경;반우식;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.9-9
    • /
    • 2018
  • 추계학적 강우생성모형 중 포아송 클러스터(Poisson Cluster) 모형은 단일지점에 대하여 시간강우량의 관측연한 문제점을 해결하기 위한 강우모형으로 강우 단계별 계층적 구조를 이해하는데 유용한 모형이다. 특히 강우 특성을 계절, 지역 등과 같이 비교하는 기준에 따라 5~6개의 비교적 적은 매개변수들로 모의 강우시계열을 생성할 수 있다는 점에서 장기간 강우분석에 필요한 관측연한 문제를 보완할 수 있다. 그러나 매개변수 최적해가 수렴되지 않는 사례가 많고, 매개변수들이 강우의 물리적 특성을 반영하는 것에 비해 내포된 불확실성에 관한 연구는 미흡하다. 본 연구에서는 포아송 클러스터 강우생성모형 중 Neyman-Scott Rectangular Pulse(NSRP) 모형을 Bayesian 모형과 연계한 Bayesian NSRP 모형을 개발하여 매개변수간 물리적 상관성을 고려한 최적화 기법을 개발하였다. Bayesian 모형은 물리적 범위가 다른 매개변수간의 결합확률분포를 산정하여 사후분포(posterior)를 추정하므로 매개변수 최적화와 불확실성 정량화 문제를 동시에 해결할 수 있다. 최종적으로 Bayesian NSRP 모형에 기후변화 시나리오의 통계적 특성을 고려한 시간단위 강우시계열 생성 모의 기법의 활용 가능성을 평가하고자 한다.

  • PDF

베타-이항 분포에서 Gibbs sampler를 이용한 평가 일치도의 사후 분포 추정 (Posterior density estimation of Kappa via Gibbs sampler in the beta-binomial model)

  • 엄종석;최일수;안윤기
    • 응용통계연구
    • /
    • 제7권2호
    • /
    • pp.9-19
    • /
    • 1994
  • 평가자간 평가 일치도(measure of agreement)를 나타내는 모수 $\kappa$와 양성 반응 비율 $\mu$를 지닌 베타-이항 분포 모형은 심리학 분야에서 많이 다루어지는 모형이다. 이 모형에서 $\kappa$에 대한 추정은 $\mu$가 0에 가까운 값을 가질 때 우도함수를 이용한 전통적 추론 방법의 적용이 어렵다. 본 논문에서는 이러한 문제를 Gibbs sampler를 이용한 Bayesian 분석 방법을 적용시켜 주변 사후 밀도 함수를 추정하였으며 이를 이용하여 Bayesian 추정값도 구하였다.

  • PDF

재표본 방법론을 활용한 베이지안 주파수 추정 (Bayesian estimation for frequency using resampling methods)

  • 박노진
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.877-888
    • /
    • 2017
  • 시계열 자료의 주기를 파악하기 위해 스펙트럴 분석이 널리 이용되고 있다. 전력 스펙트럼이나 피리오도그램을 통해서 주파수를 추정하고 그로부터 순환 주기를 계산한다. 한편에서는 통계학의 한 축인 베이지안 기법을 활용한 주파수 추정법이 연구되어 사용되고 있다. 그런데 베이지안 주파수 추정량이 수학 공식을 통해 분석적으로 표현이 가능하지 않음으로 인해 신뢰구간 추정 같은 심도 깊은 통계학적 분석이 용이하지 않은 상화에서 컴퓨터를 이용한 수치해석적인 방법으로 신뢰구간을 추정하였다. 본 논문에서는 베이지안 주파수에 대한 보다 심도 있는 분석을 위해 모수를 재표본하는 Markov chain Monte Carlo (MCMC)을 이용한 추정과 데이터를 재표본하는 시계열 재표본을 통한 추정을 시도해 보았다. 예제로서 부동산 매매/전세 가격 지수 데이터을 사용하였고 매매와 전세 가격 지수간에 3.7개월 정도의 주기 차이가 존재하나 통계학적으로는 유의미한 차이라고 할 수 없음을 알았다.

Bayesian 기법의 혼합 Gumbel 분포를 활용한 연최대일강우량에 대한 비정상성 빈도해석 (A Non-stationary frequency analysis for annual daily maximum rainfalls(ADMRs) using mixed Gumbel distribution of bayesian approach)

  • 최홍근;유민석;한영천;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.312-312
    • /
    • 2018
  • 우리나라의 기후 지형적 특성에 따라 연강수량의 50% 이상이 여름철에 내리며 이러한 짧은 기간에 집중적으로 내리는 강수패턴 조건하에서 수공구조물 설계시 대부분 극치빈도분석을 활용한다. 우리나라의 경우 단일 Gumbel 분포를 활용한 극치빈도분석을 많이 이용한다. 하지만, 최근 이상기후로 인하여 전세계적으로 강수패턴의 특징이 급격히 변하고 있으며, 우리나라의 강수패턴 또한 바뀌어가고 있다. 연강수량의 대부분은 태풍과 장마로 인한 강수량으로 이루어져 있고, 일반적으로 두 개의 모집단으로 이루어진 형태를 보인다. 앞선 연구에서 두 개 이상의 첨두를 가지는 형태의 연최대강수량 자료에 대해 8개의 지속시간별(1, 2, 3, 6, 9, 12, 18, 24hr)로 Bayesian 기법의 단일 Gumbel 분포형과 혼합 Gumbel분포형 기반의 극치빈도분석 결과를 비교하였고, 혼합 Gumbel 분포형이 이중첨두 부분의 거동을 효과적으로 모의하는 것을 확인하였다. 본 연구에서는 이상기후로 인한 강수량의 특징의 급격한 변화에 일정한 패턴이 있음을 가정하고 이중첨두의 연 최대일강수량 자료에 대해 혼합 Gumbel 분포형 기반 비정상성 빈도분석을 실시하였다. 정상성 빈도분석과의 비교를 위해 확률분포의 매개변수 산정시 우도함수를 Bayesian 기법을 통해 산정하여 각 분포형의 Bayesian information criterion(BIC) 값을 비교하였다. 비정상성일 경우의 BIC 값이 정상성일 경우 보다 작게 산정되었고, 강수패턴이 경향성을 가지는 것으로 판단할 수 있었다. 비정상성 혼합 Gumbel 분포형 모델은 최근 급격한 강수패턴의 변화에 대한 대응책으로서 활용성이 높을 것으로 기대된다.

  • PDF

Pharmacogenomics를 위한 대규모 베이지안 유전자망 학습 (Large-Scale Bayesian Genetic Network Learning for Pharmacogenomics)

  • 황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.139-141
    • /
    • 2001
  • Pharmacogenomics는 개인의 유전적 성향과 약물에 대한 반응간의 관계에 대해 연구하는 학문이다. 이를 위해 DNA microarray 데이터를 비롯한 대량의 생물학 데이터가 구축되고 있으며 이러한 대규모 데이터를 분석하기 위해서 기계학습과 데이터 마이닝의 여러 기법들이 이용되고 있다. 본 논문에서는 pharmacogenomics를 위한 생물학 데이터의 효율적인 분석 수단으로 베이지안망(Bayesian network)을 제시한다. 배이지안망은 다수의 변수들간의 확률적 관계를 표현하는 확률그래프모델(probabilistic graphical model)로 유전자 발현과 약물 반응 사이의 확률적 의존 관계를 분석하는데 적합하다. NC160 cell lines dataset으로부터 학습된 베이지안 유전자망(Bayesian genetic network)이 나타내는 관계는 생물학적 실험을 통해 검증된 실제 관계들을 다수 포함하며, 이는 배이지안 유전자망 분석을 통해 개략적인 유전자-유전자, 약물-약물, 유전자-약물 관계를 효율적으로 파악할 수 있음을 나타낸다.

  • PDF

2단계 베이지안 네트워크를 이용한 대화형 에이전트의 문맥 관리 (Context Management of Conversational Agent using Two-Stage Bayesian Network)

  • 홍진혁;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.89-98
    • /
    • 2004
  • 대화형 에이전트는 언어를 이용하여 사용자에게 적절한 정보를 제공하고 대화의 문맥을 유지하는 시스템이다. 대화형 에이전트를 더욱 현실적으로 만들기 위해서는 사용자 질의에 대한 분석과 모델링 과정이 필수적이며, 베이지안 네트워크가 이를 위한 대표적인 방법 중 하나이다. 보통 대상영역을 위한 네트워크는 매우 복잡하고 이해하기가 어렵기 때문에 네트워크를 구성하는 변수들을 분리함으로써 대화형 에이전트를 보다 쉽게 설계할 수 있다. 본 논문에서는 대화형 에이전트의 질의 분석모듈을 2단계 베이지안 네트워크로 구성하여, 설계를 보다 용이하게 하였고 문형을 고려한 세부적인 질의분석을 가능하도록 하였다. 웹 페이지를 소개하는 에이전트에 적용하여 제안한 대화형 에이전트 구조의 유용성을 보였다.

항만 소유구조에 따른 효율성 모형 비교연구 (A Comparative Study of the Relationship between Port Effeciency and Ownership Structure)

  • 황진수;전홍석;강성
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1167-1176
    • /
    • 2009
  • 항만이나 공항의 소유구조에 대한 효율성 분석은 지금까지 서로 엇갈리는 결과를 제시하고 있다. 즉, 민영화 또는 공영화로 인한 효율성 효과가 자료 또는 분석 방법에 따라서 일치된 결과를 보여주지 않고 있다. 본 논문은 국내의 항만이 포함된 국제 항만 교역데이터베이스를 기반으로 베이지안 확률적 프런티어 모형을 적용하여 항만의 소유 구조에 따른 효율성 분석을 하였다. 소유 구조는 Tongzon과 Heng (2005)의 방법을 따랐으며 제안된 몇 가지 모형과 그들의 모형을 DIC 통계량을 이용하여 비교하였다. 베이지안 추론에 필요한 MCMC 방법은 Griffin과 Steel (2007)에서 소개된 WinBUGS 프로그램을 이용하여 구현하였다.

데이터마이닝의 베이지안 망 기법을 이용한 교통수단선택 모형의 설계 및 구축 (Design and Implementation of Travel Mode Choice Model Using the Bayesian Networks of Data Mining)

  • 김현기;김강수;이상민
    • 대한교통학회지
    • /
    • 제22권2호
    • /
    • pp.77-86
    • /
    • 2004
  • 데이터마이닝 (Data Mining)은 대용량의 데이터에 존재하는 관계, 패턴, 규칙 등을 효율적으로 탐색하여 이를 모형화함으로써, 유용한 정보로 추출 변환하는 일련의 과정이다. 특히 베이지안 망 (Bayesian Network)은 신경망, 유전자알고리즘 퍼지이론 등과 더불어 데이터마이닝의 중요한 기법 중의 하나로서 베이지안 통계 이론(Bayesian Statistics Theory)를 적용하여 변수들간의 확률적인 관계를 기호화함으로써, 설명변수들과 종속변수들간의 인과관계를 파악할 수 있다. 이 연구는 기존에 적용된 바가 없는 데이터마이닝의 베이지안 망을 이용하여 수도권 교통수단선택 모형을 구축한다. 2002년도 수도권 가구통행실태조사 자료의 사회 경제적 특성과 교통체계 특성을 반영하여 베이지안 망을 이용한 교통수단선택 모형을 설계 구축하여, 각 변수들간의 상관관계와 인과관계를 분석함으로써, 설명변수인 성과 연령의 구성비가 변하였을 때, 교통수단선택의 변화율(확률)을 예측한다. 이 연구를 통해 현실에서는 내재하나 설명변수간의 복잡한 상관성을 배제하고 설명변수들과 교통수단선택간의 단순한 직선관계를 가정하는 기존 교통수단선택 모형의 한계를 극복할 수 있는 가능성을 제시한다. 또한 선택되지 않은 교통수단에 대한 정보의 부족으로 인한 교통수단선택 모형 구축의 어려움을 극복한다. 또한 다양한 교통정책에 따른 교통수단선택의 변화를 실시간으로 시뮬레이션 할 수 있는 방법론을 개발한다.

Bayesian 통계법을 활용한 성능기반형 콘크리트 배합설계방법 개발 (Development of PBD Method for Concrete Mix Proportion Design Using Bayesian Probabilistic Method)

  • 김장호;판덕헝;이근성;이나현;김성배
    • 콘크리트학회논문집
    • /
    • 제22권2호
    • /
    • pp.171-177
    • /
    • 2010
  • 최근 내구수명기간 동안 요구되는 성능을 만족시키는 차세대 구조설계 연구의 일환으로 PBD 방법에 대한 관심이 증가하고 있다. 성능의 유효여부를 결정하는 방법 중의 하나인 Bayesian 방법은 일반적으로 내진해석 및 설계에서 많이 사용되어왔다. 이 방법은 어느 지진가속도로 인해 발생할 수 있는 구조물의 한계상태(i.e. 붕괴)의 초과확률을 체계적으로 계산할 수 있는 통계방법이다. 이 연구에서는 Bayesian 방법을 활용하여 콘크리트 배합에 대한 강도, 워커빌리티, 탄산화 등과 같은 재료성능의 만족도를 만족 비율로 계산할 수 있는 PBD 개념을 개발하고자 한다. 설계 또는 분석에 사용될 수 있는 Bayesian 방법은 다양한 재료의 특성을 고려하여 만족도 곡선 작성 과정을 설명하고 작성된 만족도 곡선을 사용하는 방법을 제시하고자 한다.

클래스 불균형 문제에서 베이지안 알고리즘의 학습 행위 분석 (Learning Behavior Analysis of Bayesian Algorithm Under Class Imbalance Problems)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.179-186
    • /
    • 2008
  • 본 논문에서는 베이지안 알고리즘이 불균형 데이터의 학습 시 나타나는 현상을 분석하고 성능 평가 방법을 비교하였다. 사전 데이터 분포를 가정하고 불균형 데이터 비율과 분류 복잡도에 따라 발생된 분류 문제에 대해 베이지안 학습을 수행하였다. 실험 결과는 ROC(Receiver Operator Characteristic)와 PR(Precision-Recall) 평가 방법의 AUC(Area Under the Curve)를 계사하여 불균형 데이터 비율과 분류 복잡도에 따라 분석되었다. 비교 분석에서 불균형 비율은 기 수행된 연구 결과와 같이 베이지안 학습에 영향을 주었으며, 높은 분류 복잡도로부터 나타나는 데이터 중복은 학습 성능을 방해하는 요인으로 확인되었다. PR 평가의 AUC는 높은 분류 복잡도와 높은 불균형 데이터 비율에서 ROC 평가의 AUC보다 학습 성능의 차이가 크게 나타났다. 그러나 낮은 분류 복잡도와 낮은 불균형 데이터 비율의 문제에서 두 측정 방법의 학습 성능의 차이는 미비하거나 비슷하였다. 이러한 결과로부터 PR 평가의 AUC는 클래스 불균형 문제의 학습 모델의 설계와 오분류 비용을 고려한 최적의 학습기를 결정하는데 도움을 줄 수 있다.