• 제목/요약/키워드: 비모수적 베이지안 모형

검색결과 23건 처리시간 0.023초

생물/보건/의학 연구를 위한 비모수 베이지안 통계모형 (Nonparametric Bayesian Statistical Models in Biomedical Research)

  • 노희상;박진수;심규석;유재은;정연승
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.867-889
    • /
    • 2014
  • 비모수 베이지안 통계 모형은 그 유연성과 계산의 편리성으로 인해 최근 다양한 분야에서 응용되고 있는데, 본 논문에서는 생물/의학/보건 연구에서 사용되는 비모수 베이지안 통계 모형에 대해서 개괄하였다. 본 논문에서는 비모수 베이지안 통계 모델링에서 핵심적으로 사용되는 확률모형들을 소개하고, 다양한 예제들을 통하여 그 모형들이 어떻게 사용되는지 이해를 돕도록 하였다. 특별히, 논의된 예제들은 모수적 통계 모형으로 고찰하기에는 한계가 있는 연구가설들을 포함하고 있어 모수적 모형의 한계점을 지적하고 비모수적 베이지안 모형의 필요성을 강조하는 것들로 정하였다. 크게 확률밀도함수 추정, 군집분석, 임의효과 분포의 추정, 그리고 회귀분석의 4가지 주제로 분류하여 살펴보았다.

한국지역 집중호우에 대한 반환주기의 베이지안 모형 분석 (A Hierarchical Bayesian Modeling of Temporal Trends in Return Levels for Extreme Precipitations)

  • 김용구
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.137-149
    • /
    • 2015
  • 본 논문에서는 비정상 극치 강수 자료에 대해 계층적 베이지안 모형을 적용하여 시간에 따른 모수의 변화를 추정하며, 미래 확률 강수량에 대한 극단값 분포를 예측하고 더 나아가 반환기간에 대한 경향과 예측 값을 얻고자 한다. 이전의 고전적 통계 방법을 통한 강수 자료의 모수 추정연구의 경우, 자료의 정상성 가정 하에 고정된 모수를 추정하는 방법으로, 최근 나타난 비정상 강수 사상과 같이 강수량이 가지는 분포의 모수적 변화가 예상되는 경우 해석상 문제가 발생한다. 이러한 문제점을 해결하기 위해 모형의 관심모수에 시간에 따른 자기 상관 선형 회귀 함수를 적합한 계층적 베이지안 모형을 고려한다. 제안된 모형의 효율성을 확인하기 위해서 1973년부터 2011년까지 39년 동안의 우리나라 여러지역의 기상 관측소에서 관측된 일일 강우량 자료가 사용하여 대표적인 극단값 분포인 Generalized Extreme Value(GEV) 분포에 적합시키고, 계층적 베이지안 모형을 이용하여 이들 분포의 모수들에 자기상관 시간모형을 소개한 후 우리나라 여러지역에 대한 반환기간에 대한 시간에 따른 경향을 확인하였다.

모수, 비모수, 베이지안 출산율 모형을 활용한 합계출산율 예측과 비교 (A comparison and prediction of total fertility rate using parametric, non-parametric, and Bayesian model)

  • 오진호
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.677-692
    • /
    • 2018
  • 최근 2017년 우리나라 합계출산율은 1.05명로 2005년 1.08명 수준으로 회귀하는 현상을 보이고 있다. 1.05명은 인구대체선(2.1명), 안전선(1.5명)과도 거리가 먼 초저출산 수준이고 마치 초저출산 덫에 빠질 우려가 있다. 이에 합계출산율의 합리적인 예측과 이를 통한 출산정책에 유용한 자료를 제공하는 것은 그 어느 때 보다도 중요하다. 그 동안 다양한 통계적 방법으로 합계출산율 추이를 예측하였는데, 데이터 완비성이 높고 품질이 좋은 경우 모형 접근인 모수적 방법, 데이터 추이가 단절되거나 변동이 심한 경우 평활과 가중치를 적용한 비모수적 방법, 데이터 부족과 품질 등으로 선진국의 출산율 3단계 전이현상을 참고하여 이들의 사전분포를 활용하는 베이지안 방법 등이 적용되어 왔다. 본 연구는 최근 변동이 심한 우리나라 출산율에 모수, 비모수, 그리고 베이지안 방법을 적용하여 추정과 예측을 실시하고 도출된 결과 비교를 통해 적합성과 타당성 측면에서 어떤 방법이 합리적인지 모색하고자 한다. 분석결과 합계출산율 예측값 순위는 통계청 합계출산율이 가장 높고, 베이지안, 모수, 비모수 순으로 나타났다. 2017년 TFR 1.05명 수준을 감안할 때 모수, 비모수모형으로 도출된 합계출산율 예측값이 합리적이다. 또한 출산율 자료완비성이 높고 품질이 우수할 경우 계산 효율성과 적합도 관점에서 모수적 추정과 예측 접근 방법이 타 방법보다 우수한 것으로 도출되었다.

국면전환 임계 자기회귀 분석을 위한 베이지안 방법 비교연구 (A Comparison Study of Bayesian Methods for a Threshold Autoregressive Model with Regime-Switching)

  • 노태영;조성일;이령화
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1049-1068
    • /
    • 2014
  • 자기회귀 모형(autoregressive model)은 일변량(univaraite) 시계열자료의 분석에서 널리 사용되는 방법 중 하나이다. 그러나 이 방법은 자료에 일정한 추세가 있다고 가정하기 때문에 자료에 분절(structural break)이 존재할 때 적절하지 않을 수 있다. 이러한 문제점을 해결하기 위한 방법으로 국면전환(regime-switching) 모형인 임계자기회귀 모형(threshold autoregressive model)이 제안되었는데 최근 지연 모수(delay parameter)을 포함한 이 국면전환(two regime-switching) 모형으로 확장되어 많은 연구가 활발히 진행되고 있다. 본 논문에서는 이 국면전환 임계자기회귀 모형을 베이지안(Bayesian) 관점에서 살펴본다. 베이지안 분석을 위해 모수적 임계자기 회귀 모형 뿐만 아니라 디리슐레 과정(Dirichlet Process) 사전분포를 이용하는 비모수적 임계자기 회귀 모형을 고려하도록 한다. 두 가지 베이지안 임계자기 회귀 모형을 바탕으로 사후분포를 유도하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo) 방법을 통해 사후추론을 실시한다. 모형 간의 성능을 비교하기 위해 모의실험을 통한 자료 분석을 고려하고, 더 나아가 한국과 미국의 국내 총생산(Gross Domestic Product)에 대한 실증적 자료 분석을 실시한다.

베이지안 모형 기반 한국어 의미역 유도 (Bayesian Model based Korean Semantic Role Induction)

  • 원유성;이우철;김형준;이연수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

베이지안 모형 기반 한국어 의미역 유도 (Bayesian Model based Korean Semantic Role Induction)

  • 원유성;이우철;김형준;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항 인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

비동질적 포아송과정을 사용한 소프트웨어 신뢰 성장모형에 대한 베이지안 신뢰성 분석에 관한 연구 (The Bayesian Analysis for Software Reliability Models Based on NHPP)

  • 이상식;김희철;송영재
    • 정보처리학회논문지D
    • /
    • 제10D권5호
    • /
    • pp.805-812
    • /
    • 2003
  • 본 논문에서는 비동질 포아송 과정(NHPP)에 기초한 소프트웨어 에러 현상에 대한 신뢰도 모형을 고려하고 사전정보(Prior information)를 이용한 베이지안 추론을 시행하였다. 고장 패턴은 NHPP에 대한 강도함수와 평균값 함수로서 나타낼 수 있다. 따라서 본 논문에서는 대수형 포아송 실행시간 모형(Logarithmic Poisson model), Crow 모형 그리고 Rayleigh 모형에 대하여 베이지안 모수 추정방법을 적용하였다. 효율적 모형을 위하여 이들 모형에 관한 모형선택을 편차자승합(SSE)의 합을 이용하여 시행하였고 모수의 추정을 위해서 마코브체인 몬테카를로(MCMC) 기법중에 하나인 깁스샘플링(Gibbs sampling)과 메트로폴리스 알고리즘을 이용한 근사추정 기법이 사용되었다. 수치적인 예에서는 Musa의 T1 자료를 이용하여 모수 및 신뢰도를 추정한 수치 결과론 나열하였다.

NHPP소프트웨어 신뢰도 성장모형에서 베이지안 모수추정과 예측 (Bayesian parameter estimation and prediction in NHPP software reliability growth model)

  • 장인홍;정덕환;이승우;송광윤
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.755-762
    • /
    • 2013
  • 본 논문은 NHPP 소프트웨어 신뢰성모형에서 모수추정과 고장시간에 대한 예측을 다루고자 한다. 소프트웨어 신뢰성모형 Goel-Okumoto모형에서 평균값 함수에 대한 최우추정과 경험적 사전분포를 가정한 공액사전분포에서 베이지안 추정을 다루었다. 실제 자료에서 두 가지 추정법에 의한 모수 추정값을 제공하였으며, 모형의 적합성을 판정하고, 고장수에 대한 예측값을 비교하였다.

베이지안 실험계획법의 이해와 응용 (Understanding Bayesian Experimental Design with Its Applications)

  • 이군희
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1029-1038
    • /
    • 2014
  • 본 연구에서는 베이지안 실험계획법에 대하여 논의하고 간단한 모의실험을 통하여 최적화된 베이지안 실험계획법이 어떠한 특징을 가지고 있는지 설명하였다. 실험을 설계하는 경우 연구자는 관심있는 주제가 모수추정인지 아니면 예측인지를 결정하고 사전확률과 우도함수를 기반으로 이에 맞는 사후확률을 찾아 효용함수와 결합하여 최적의 실험설계를 찾는 것이 베이지안 실험계획법의 기본 원리이다. 만일 사전적 정보가 존재하지 않는다면 무정보적 부적합 사전확률을 이용하여 실험을 설계할 수 있으며, 이는 비 베이지안적 접근방법과 일치하게 된다. 만일 모수나 예측값에 대한 사전적 정보가 존재하는 경우에는 베이지안 실험계획법이 유일한 해결 방법이다. 하지만 모형의 복잡도가 증가하게 되면, 최적해를 찾는 과정이 매우 복잡해져서 극복해야 하는 많은 문제점들이 존재하므로 향후 많은 연구가 필요한 분야이다.