• Title/Summary/Keyword: 사전정보 모형

Search Result 361, Processing Time 0.031 seconds

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

Analysis of torrential rainfall characteristics using 'zero-inflated models' ('0-과잉 모형'을 이용한 집중호우의 발생특성 분석)

  • Kim, Sang Ug
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.453-453
    • /
    • 2017
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

Domain-agnostic Pre-trained Language Model for Tabular Data (도메인 변화에 강건한 사전학습 표 언어모형)

  • Cho, Sanghyun;Choi, Jae-Hoon;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.346-349
    • /
    • 2021
  • 표 기계독해에서는 도메인에 따라 언어모형에 필요한 지식이나 표의 구조적인 형태가 변화하면서 텍스트 데이터에 비해서 더 큰 성능 하락을 보인다. 본 논문에서는 표 기계독해에서 이러한 도메인의 변화에 강건한 사전학습 표 언어모형 구축을 위한 의미있는 표 데이터 선별을 통한 사전학습 데이터 구축 방법과 적대적인 학습 방법을 제안한다. 추출한 표 데이터에서 구조적인 정보가 없이 웹 문서의 장식을 위해 사용되는 표 데이터 검출을 위해 Heuristic을 통한 규칙을 정의하여 HEAD 데이터를 식별하고 표 데이터를 선별하는 방법을 적용했으며, 구조적인 정보를 가지는 일반적인 표 데이터와 엔티티에 대한 지식 정보를 가지는 인포박스 데이터간의 적대적 학습 방법을 적용했다. 기존의 정제되지 않는 데이터로 학습했을 때와 비교하여 데이터를 정제하였을 때, KorQuAD 표 데이터에서 f1 3.45, EM 4.14가 증가하였으며, Spec 표 질의응답 데이터에서 정제하지 않았을 때와 비교하여 f1 19.38, EM 4.22가 증가한 성능을 보였다.

  • PDF

Bayesian Mode1 Selection and Diagnostics for Nonlinear Regression Model (베이지안 비선형회귀모형의 선택과 진단)

  • 나종화;김정숙
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.139-151
    • /
    • 2002
  • This study is concerned with model selection and diagnostics for nonlinear regression model through Bayes factor. In this paper, we use informative prior and simulate observations from the posterior distribution via Markov chain Monte Carlo. We propose the Laplace approximation method and apply the Laplace-Metropolis estimator to solve the computational difficulty of Bayes factor.

Development of probability distribution for simulation of monthly characteristics of torrential rainfall events (집중호우사상의 월별 발생특성 모의를 위한 확률분포 개발)

  • Kim, Sang Ug;Kim, Hyeong Bae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.246-246
    • /
    • 2016
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

A Bayesian Outlier Detection in Random Effects Model (변량모형 자료에서의 베이지안 이상점검출)

  • 정윤식;이상진
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.115-131
    • /
    • 2000
  • 이 논문에서는 평균-이동모형(mean-shift model)을 이상점을 위한 대립모형으로 사용하여 변량모형(random effect model)에서의 이상점 검출을 위한 베이즈인자(Bayes factor)를 제시한다. 그러나 가능한 사전 정보가 없어서 무정보사전분포(noninformative prior distribution)가 사용되어야만 할 때, 대부분의 무정보사전분포는 부적절분포(improper distribution)이기 때문에 베이즌 인자에는 사전분포로부터 나온 미지의 상수가 포함되어 잇다. 이 문제를 해결하기 위해 이 논문에서는 Berger와 Pericchi (1996)가 제시한 내재베이즈인자(the intrinsic Bayes factor;IBF)를 사용한다. 또한 이 베이즈인자를 계산상 어려움을 해결하기 위해 Verdinellidh Wasserman(1995)의 일반화 세비디지키 밀도비를 이용하여 수정하고 이것을 이용하여 이상점을 검출하는 방법을 제시한다. 마지막으로 인위적으로 이상점을 포함하고 있는 데이터를 만들고 제시된 방법으로 가상실험을 하고 또한 실제 데이터에서 제시한 방법으로 이상점을 찾아보았다.

  • PDF

Bayesian Testing for the Equality of K-Lognormal Populations (부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정)

  • 문경애;김달호
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

Prior distributions using the entropy principles (엔트로피 이론을 이용한 사전 확률 분포함수의 추정)

  • Lee, Jung-Jin;Shin, Wan-Seon
    • The Korean Journal of Applied Statistics
    • /
    • v.3 no.2
    • /
    • pp.91-105
    • /
    • 1990
  • Several practical prior distributions are derived using the maximum entropy principle. Also, an interactive method for estimating a prior distribution which uses the minimum cross-entropy principle is proposed when there are many prior informations. The consistency of the prior distributions obtained by the entropy principles is discussed.

  • PDF

로그정규모집단에서의 베이지안 모형선택

  • 이우동
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1998.10a
    • /
    • pp.807-813
    • /
    • 1998
  • 이 논문에서는 로그정규분포에 대한 베이지안 모형선택방법을 제안한다. 일반적으로 , 모수에 대한 사전정보가 비정보적(noninformative)인 경우, 베이즈 요인(Bayes factor)은 결정할 수 없는 상수를 포함하는 것이 일반적이다. 이 경우, 베이즈 요인을 계산하기 위해 최근 활발히 연구중인 고유 베이즈 요인(Intrinsic Bayes factor)방법을 이용한다. 실제의 자료를 통해 로그정규분포의 적합도 검정에 대한 부분적 베이즈 요인을 계산한다.

Evaluation of the performance of the ranking DEA model (순위결정 DEA모형의 변별력 평가)

  • Park, Man-Hee
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.05a
    • /
    • pp.298-299
    • /
    • 2018
  • In this study, the discriminant power of the DEA models which do not require the prior information of decision makers was evaluated. Entropy model, Bootstrap model, Benevolent Cross Efficiency model, Aggressive Cross Efficiency model and Game Cross Efficiency model were selected as the DEA model for discriminant power evaluation. The discriminant power of five DEA models was evaluated using coefficient of variation and degree of importance. According to the evaluation results, the rank of discrimination power was evaluated in the order of Entropy model, Aggressive CE model, Benevolent CE model, Game CE model, and Bootstrap model in both evaluation indexes.

  • PDF