• 제목/요약/키워드: 베이지안통계계산

검색결과 43건 처리시간 0.019초

영과잉 회귀모형에 대한 베이지안 분석 (Bayesian Analysis for the Zero-inflated Regression Models)

  • 장학진;강윤회;이수범;김성욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.603-613
    • /
    • 2008
  • 셀 수 있는 이산 자료 중에서 일반적인 모형에 비하여 영의 빈도가 과도하게 많이 관측되는 자료가 있다. 이러한 경우에 포아송 또는 음이항회귀모형과 같은 일반적인 회귀모형에 의한 분석은 적절하지 못하다. 본 논문에서는 영과잉 포아송회귀모형과 영과잉 음이항회귀모형에 대하여 베이지안 분석을 하였다. 또한, 마코브 연쇄 몬테카롤로 방법으로 계산한 베이즈 요인을 이용하여 모형선택을 하였다. 실제 교통사고 자료를 분석하여 이론적인 결과들을 뒷받침하였다.

지수 생존 모형에서의 베이지안 모형 선택 (Bayesian model selection in exponential survival models)

  • 정윤식;김미숙
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.57-71
    • /
    • 2002
  • 본 논문에서는 지수생존 모형의 형태들로써 단순 지수모형, 변환 점 지수모형과 유한 혼합 지수모형 등 세 가지 모형을 소개한다. 이러한 모형들 중에서, 최적의 모형을 찾기 위하여 Gelfand와 Ghosh(1998)의 방법을 이용한 모형 선택 방법을 제안한다. 이때, 계산상의 어려움을 피하기 위하여 자료 확장 기법(Tanner와 Wong, 1987)과 깁스 샘플러(Gelfand와 Smith, 1990)를 사용하였다. 제안된 베이지안 방법을 설명하기 위하여 모의 실험 자료와Stangl의 항 우울제 자료에 적용한다. 모형 선택 방법은 사전 분포와 모형 선택 기준의 가중치에 민감하지 않다는 것을 제한된 우리의 실험으로 알 수 있었다.

A Comparison study of Hybrid Monte Carlo Algorithm

  • 황진수;전성해;이찬범
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.135-140
    • /
    • 2000
  • 베이지안 신경망 모형(Bayesian Neural Networks Models)에서 주어진 입력값(input)은 블랙 박스(Black-Box)와 같은 신경망 구조의 각 층(layer)을 거쳐서 출력값(output)으로 계산된다. 새로운 입력 데이터에 대한 예측값은 사후분포(posterior distribution)의 기대값(mean)에 의해 계산된다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 가능도함수(likelihood functions)를 통해 계산되어진 사후분포는 매우 복잡한 구조를 갖게 됨으로서 기대값의 적분계산에 대한 어려움이 발생한다. 이때 확률적 추정에 의한 근사 방법인 몬테칼로 적분을 이용한다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 우수한 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘과 기존에 많이 사용되고 있는 Gibbs sampling, Metropolis algorithm, 그리고 Slice Sampling등의 몬테칼로 방법들을 비교한다.

  • PDF

중도 절단 자료에서의 역추정 문제 (On the calibration problem with censored data)

  • 박래현;이석훈;이낙영;박영옥;이상호
    • 응용통계연구
    • /
    • 제7권1호
    • /
    • pp.1-17
    • /
    • 1994
  • 본 논문은 종속변수가 중도 절단된 경우 역추정을 베이지안 방법으로 접근하였는데 이때 특별히 Gibbs Sampling을 응용하여 사후분포를 계산하는 것을 토의하였다. 적용의 예로서 실제 자료에서의 점추정 및 Simulated Annealing을 이용한 구간추정도 하였다.

  • PDF

코스피 지수 자료의 베이지안 극단값 분석 (A Bayesian Extreme Value Analysis of KOSPI Data)

  • 윤석훈
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.833-845
    • /
    • 2011
  • 본 논문에서는 1998.01.03부터 2011.08.31까지 수집된 코스피 지수 자료로부터 계산된 일별 로그수익률과 일별 로그손실률에 대한 극단값 통계분석을 수행하였다. 사용된 극단값 통계분석 모형은 포아송-GPD 모형이고 모수의 추정과 극단분위수의 추정은 최대가능도 방법을 적용하였다. 본 논문에서는 또한 포아송-GPD 모형에 추가적으로 모수의 무정보사전분포를 가정한 베이지안 방법을 고려하였다. 여기서는 마르코프 연쇄 몬테칼로 방법을 적용하여 모수와 극단분위수를 추정하였다. 분석 결과 최대가능도 방법과 베이지안 방법에서 모두, 로그수익률 분포의 오른쪽 꼬리는 정규분포보다 짧은 반면, 로그손실률 분포의 오른쪽 꼬리는 정규분포보다 두텁다는 결론이 얻어졌다. 극단값 분석에서 베이지안 방법을 사용할 때의 장점은 정칙조건이 만족되지 않는 경우에도 최대가능도추정량의 전통적 점근 성질을 걱정할 필요가 없고 예측의 경우에는 모수의 불확실성과 미래 관측치의 불확실성이 모두 반영되는 효과가 있다는 것이다.

동측치가 많은 FRAILTY 모형의 분석 (Analysis of the Frailty Model with Many Ties)

  • 김용대;박진경
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.67-81
    • /
    • 2005
  • 프레일티모형에 대한 기존의 추론방법은 동측치가 많은 경우에 그 성능이 떨어진다. 그 이유는 사용된 경험적 우도함수가 동측치가 많은 자료에는 적합하지 않기 때문이다. 본 논문에서는 동측치가 많은 프레일티 모형에서의 새로운 추론방법을 제안한다. 이항형태의 경험적우도함수를 바탕으로 베이지안 부스트랩을 사용하여 모수의 사후분포를 구한다. 제안된 방법의 장점은 기존에 제안된 주변최대우도추정량에 비하여 계산이 수월하고 안정적인 결과를 제공하는데 있다. 이를 실증적으로 비교하기 위하여 제안된 방법을 주변최대우도추정량과 가상실험을 통하여 비교한다.

모수, 비모수, 베이지안 출산율 모형을 활용한 합계출산율 예측과 비교 (A comparison and prediction of total fertility rate using parametric, non-parametric, and Bayesian model)

  • 오진호
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.677-692
    • /
    • 2018
  • 최근 2017년 우리나라 합계출산율은 1.05명로 2005년 1.08명 수준으로 회귀하는 현상을 보이고 있다. 1.05명은 인구대체선(2.1명), 안전선(1.5명)과도 거리가 먼 초저출산 수준이고 마치 초저출산 덫에 빠질 우려가 있다. 이에 합계출산율의 합리적인 예측과 이를 통한 출산정책에 유용한 자료를 제공하는 것은 그 어느 때 보다도 중요하다. 그 동안 다양한 통계적 방법으로 합계출산율 추이를 예측하였는데, 데이터 완비성이 높고 품질이 좋은 경우 모형 접근인 모수적 방법, 데이터 추이가 단절되거나 변동이 심한 경우 평활과 가중치를 적용한 비모수적 방법, 데이터 부족과 품질 등으로 선진국의 출산율 3단계 전이현상을 참고하여 이들의 사전분포를 활용하는 베이지안 방법 등이 적용되어 왔다. 본 연구는 최근 변동이 심한 우리나라 출산율에 모수, 비모수, 그리고 베이지안 방법을 적용하여 추정과 예측을 실시하고 도출된 결과 비교를 통해 적합성과 타당성 측면에서 어떤 방법이 합리적인지 모색하고자 한다. 분석결과 합계출산율 예측값 순위는 통계청 합계출산율이 가장 높고, 베이지안, 모수, 비모수 순으로 나타났다. 2017년 TFR 1.05명 수준을 감안할 때 모수, 비모수모형으로 도출된 합계출산율 예측값이 합리적이다. 또한 출산율 자료완비성이 높고 품질이 우수할 경우 계산 효율성과 적합도 관점에서 모수적 추정과 예측 접근 방법이 타 방법보다 우수한 것으로 도출되었다.

내재된 인자회귀모형의 베이지안 분석법 (Bayesian analysis of latent factor regression model)

  • 경민정
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2020
  • 선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.

잠재변수를 이용한 NHPP 베이지안 소프트웨어 신뢰성 모형에 관한 연구 (The NHPP Bayesian Software Reliability Model Using Latent Variables)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제6권3호
    • /
    • pp.117-126
    • /
    • 2006
  • 본 논문은 소프트웨어 신뢰성장 모형에 대한 베이지안 모수추론과 모형선택 방법이 연구되었다. 소프트웨어 성장 모형은 내재되어 있는 오류와 고장 간격시간으로 모형화하면 소프트웨어 개발 단계에서 유용하게 사용할 수 있다. 본 논문에서는 사후 분포의 정보를 얻기 위한 다중 적분문제에 있어서 일종의 마코브 체인 몬테칼로 방법인 깁스 샘플링을 사용하여 사후 분포의 계산이 이루어졌다. 확산 사전 분포를 가진 소프트웨어 신뢰성에 의존된 일반적 순서 통계량 모형에 대하여 베이지안 모수 추정이 이루어 졌고 효율적인 모형의 선택방법도 시행되었다. 모형 설정과 선택 판단기준은 편차 자승합을 이용한 적합도 검정과 추세 검정이 사용되었다. 본 논문에서 사용된 소프트웨어 고장 자료는 Minitab(version 14) 통계 페키지에 있는 와이블분포(형상모수가 2이고 척도모수가 5)에서 발생시킨 30개의 난수를 이용한 모의 실험자료를 이용하여 고장자료 분석을 시행하였다.

  • PDF

변량모형 자료에서의 베이지안 이상점검출 (A Bayesian Outlier Detection in Random Effects Model)

  • 정윤식;이상진
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.115-131
    • /
    • 2000
  • 이 논문에서는 평균-이동모형(mean-shift model)을 이상점을 위한 대립모형으로 사용하여 변량모형(random effect model)에서의 이상점 검출을 위한 베이즈인자(Bayes factor)를 제시한다. 그러나 가능한 사전 정보가 없어서 무정보사전분포(noninformative prior distribution)가 사용되어야만 할 때, 대부분의 무정보사전분포는 부적절분포(improper distribution)이기 때문에 베이즌 인자에는 사전분포로부터 나온 미지의 상수가 포함되어 잇다. 이 문제를 해결하기 위해 이 논문에서는 Berger와 Pericchi (1996)가 제시한 내재베이즈인자(the intrinsic Bayes factor;IBF)를 사용한다. 또한 이 베이즈인자를 계산상 어려움을 해결하기 위해 Verdinellidh Wasserman(1995)의 일반화 세비디지키 밀도비를 이용하여 수정하고 이것을 이용하여 이상점을 검출하는 방법을 제시한다. 마지막으로 인위적으로 이상점을 포함하고 있는 데이터를 만들고 제시된 방법으로 가상실험을 하고 또한 실제 데이터에서 제시한 방법으로 이상점을 찾아보았다.

  • PDF