• 제목/요약/키워드: Bayesian

검색결과 2,713건 처리시간 0.024초

베이지안 최적화를 통한 저서성 대형무척추동물 종분포모델 개발 (Development of benthic macroinvertebrate species distribution models using the Bayesian optimization)

  • 고병건;신지훈;차윤경
    • 상하수도학회지
    • /
    • 제35권4호
    • /
    • pp.259-275
    • /
    • 2021
  • This study explored the usefulness and implications of the Bayesian hyperparameter optimization in developing species distribution models (SDMs). A variety of machine learning (ML) algorithms, namely, support vector machine (SVM), random forest (RF), boosted regression tree (BRT), XGBoost (XGB), and Multilayer perceptron (MLP) were used for predicting the occurrence of four benthic macroinvertebrate species. The Bayesian optimization method successfully tuned model hyperparameters, with all ML models resulting an area under the curve (AUC) > 0.7. Also, hyperparameter search ranges that generally clustered around the optimal values suggest the efficiency of the Bayesian optimization in finding optimal sets of hyperparameters. Tree based ensemble algorithms (BRT, RF, and XGB) tended to show higher performances than SVM and MLP. Important hyperparameters and optimal values differed by species and ML model, indicating the necessity of hyperparameter tuning for improving individual model performances. The optimization results demonstrate that for all macroinvertebrate species SVM and RF required fewer numbers of trials until obtaining optimal hyperparameter sets, leading to reduced computational cost compared to other ML algorithms. The results of this study suggest that the Bayesian optimization is an efficient method for hyperparameter optimization of machine learning algorithms.

확률강우분포의 매개변수 및 불확실성 추정을 위한 베이지안 기법의 비교 (Comparison of Bayesian Methods for Estimating Parameters and Uncertainties of Probability Rainfall Distribution)

  • 서영민;박재호;최윤영
    • 한국환경과학회지
    • /
    • 제28권1호
    • /
    • pp.19-35
    • /
    • 2019
  • This study investigates the performance of four Bayesian methods, Random Walk Metropolis (RWM), Hit-And-Run Metropolis (HARM), Adaptive Mixture Metropolis (AMM), and Population Monte Carlo (PMC), for estimating the parameters and uncertainties of probability rainfall distribution, and the results are compared with those of conventional parameter estimation methods; namely, the Method Of Moment (MOM), Maximum Likelihood Method (MLM), and Probability Weighted Method (PWM). As a result, Bayesian methods yield similar or slightly better results in parameter estimations compared with conventional methods. In particular, PMC can reduce parameter uncertainty greatly compared with RWM, HARM, and AMM methods although the Bayesian methods produce similar results in parameter estimations. Overall, the Bayesian methods produce better accuracy for scale parameters compared with the conventional methods and this characteristic improves the accuracy of probability rainfall. Therefore, Bayesian methods can be effective tools for estimating the parameters and uncertainties of probability rainfall distribution in hydrological practices, flood risk assessment, and decision-making support.

Bayesian 모형을 이용한 단일사상 강우-유출 모형의 불확실성 분석 (Uncertainty Assessment of Single Event Rainfall-Runoff Model Using Bayesian Model)

  • 권현한;김장경;이종석;나봉길
    • 한국수자원학회논문집
    • /
    • 제45권5호
    • /
    • pp.505-516
    • /
    • 2012
  • 본 연구에서는 국내외에서 범용되고 있는 단일강우사상 모형인 미육군공병단의 HEC-1 모형을 이용하여 대청댐 유역의 실측 강우-유출 사상을 중심으로 강우-유출 모의를 수행하였으며, 매개변수 검정에는 실제 대청댐의 시간당 유입량을 기준으로 검정을 실시하였다. HEC-1 모형에는 매개변수를 자동으로 최적화시키는 프로그램이 내장되어 있으나 본 연구의 대상유역과 같이 다수의 소유역이 있는 경우, 매개변수 추정시 매개변수 중 일부는 수렴되지 못하고 발산하는 문제가 있었으며, 첨두유량의 추정능력 역시 저하되는 문제를 보였다. 따라서 이러한 HEC-1 모형의 매개변수의 불확실성을 고려하기 위한 방안으로 Bayesian 모형을 HEC-1모형에 연동시켜 활용하였으며, 기존 HEC-1 강우-유출 모형에 적용할 수 있는 매개변수 최적화 및 불확실성 정량화를 위해 HEC-1 강우-유출 모형 매개변수는 SCS 1개, Clark 단위도 2개를 Bayesian MCMC 기법을 적용하여 매개변수간 조건부확률로 모의발생을 한 후, Bayesian 모형으로부터 각 매개변수의 사후분포(posterior distribution)를 추정하여 사후분포의 추정이 매개변수의 불확실성 정량화를 수행하였다. 본 연구를 통해 제안된 BHEC-1 모형을 대상으로 대청댐 유역에 실측 강우-유출사상에 대해서 모형의 적합성을 평가한 결과, 7개 유역의 21개의 매개변수가 해의 발산 없이 안정된 매개변수 추정이 가능하였다. 한편, Bayesian 모형을 근간으로 하기 때문에 최종결과로서 매개변수들의 사후분포(posterior)의 추정이 가능하여 향후 홍수빈도곡선 유도, 댐 위험도분석과 기후변화 문제와 같은 다양한 수문학적 문제의 연구에 적용 가능할 것으로 전망된다.

효율적 구조 학습 알고리즘과 데이타 차원축소를 통한 베이지안망 기반의 마이크로어레이 데이타 분석법 (A Method for Microarray Data Analysis based on Bayesian Networks using an Efficient Structural learning Algorithm and Data Dimensionality Reduction)

  • 황규백;장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.775-784
    • /
    • 2002
  • DNA chip 기술에 의해 얻어지는 마이크로어레이(microarray) 데이타는 세포나 조직 내의 수천 개 유전자의 발현도(expression level)를 한번에 측정한 것으로, 유전자 발현 양상에 기반한 암의 진단, 유전자의 기능 예측 등에 이용되고 있다. 다양한 데이타 분석 기법들 중 베이지안망(Bayesian network)은 데이타의 각 속성들간의 관계를 그래프 형태로 표현할 수 있는 특징을 가지고 있다. 이는 마이크로어레이 데이타의 분석을 통해 여러 유전자와 조직의 특성(암의 종류 등) 사이의 관계를 밝히는데 유용하다 하지만 대부분의 마이크로어레이 데이타는 sparse data로 베이지안망을 비롯한 각종 분석 기법의 적용을 어렵게 하고 있다. 본 논문에서는 베이지안망에 기반한 마이크로어레이 데이타 분석을 위해 효율적 구조 학습 알고리즘과 데이타 차원 축소를 이용한다. 제시되는 분석법은 실제 마이크로어레이 데이타인 NC160 data set에 적용되었으며, 그 유용성은 데이타로부터 학습된 베이지안망이 실제 생물학적으로 알려진 사실들을 어느 정도 정확하게 표현하는지에 의해 평가되었다.

고차상관관계를 표현하는 랜덤 하이퍼그래프 모델 진화를 위한 베이지안 샘플링 알고리즘 (A Bayesian Sampling Algorithm for Evolving Random Hypergraph Models Representing Higher-Order Correlations)

  • 이시은;이인희;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.208-216
    • /
    • 2009
  • 유전자알고리즘의 교차나 돌연변이 연산을 직접적으로 사용하지 않고 개체군의 확률분포를 추정하여 보다 효율적인 탐색을 수행하려는 분포추정알고리즘이 여러 방법으로 제안되었다. 그러나 실제로 변수들간의 고차상관관계를 파악하는 일은 쉽지 않은 일이라 대부분의 경우 낮은 차수의 상관관계를 제한된 가정하에 추정하게 된다. 본 논문에서는 데이타의 고차상관관계를 표현할 수 있고 최적 해를 좀 더 효율적으로 찾을 수 있는 새로운 분포추정알고리즘을 제안한다. 제안된 알고리즘에서는 상관관계가 있을 것으로 추정되는 변수들의 집합으로 정의된 하이퍼에지로 구성된 랜덤 하이퍼그래프 모델을 구축하여 변수들 간의 고차상관관계를 표현하고, 베이지안 샘플링 알고리즘(Bayesian Sampling Algorithm)을 통해 다음 세대의 개체를 생성한다. 기만하는 빌딩블럭(deceptive building blocks)을 가진 분해가능(decomposable) 함수에 대하여 실험한 결과 성공적으로 최적해를 구할 수 있었으며 단순 유전자알고리즘과 BOA (Bayesian Optimization Algorithm)와 비교하여 좋은 성능을 얻을 수 있었다.

베이즈주의에서의 증거 개념 (Bayesian concept of evidence)

  • 이영의
    • 논리연구
    • /
    • 제8권2호
    • /
    • pp.33-58
    • /
    • 2005
  • 오래된 증거의 문제는 가설이 제안되기 이전에 이미 알려진 증거는 그 가설을 입증할 수 없다는 문제를 제기한다. 오래진 증거의 문제는 베이즈적 입증 개념에 심각한 문제를 제기하는데 그것은 관련 학자들의 많은 노력에도 불구하고 여전히 미해결의 상태로 남아있다. 이 글의 목적은 오래된 증거의 문제가 베이즈적 입증 개념에 대한 심각한 오해에서 비롯되었다는 점을 보임으로써 그 문제를 해결하는 것이다. 먼저 논의의 출발점인 오래된 증거의 문제가 분석되고 이어서 베이즈주의자들이 그 문제를 해갈하기 위해서 제안한 두 가지의 대표적 입장이 비판적으로 검토된다. 이러한 과정을 통하여 오래된 증거의 문제에 대한 기존의 논의들에서 공통적으로 발견되는 오해, 즉 설명과 예측의 맥락에서 나타나는 입증의 비대칭성이 무시되는 현상이 지적된다. 마지막으로 입증의 비대칭성을 이용하여 두 종류의 구별되는 베이즈적 입증 개념이 제시되고 오래된 증거의 문제에서 가정된 입증은 진정한 입증이 아니라는 점이 주장된다.

  • PDF

A Methodology for Estimating the Uncertainty in Model Parameters Applying the Robust Bayesian Inferences

  • Kim, Joo Yeon;Lee, Seung Hyun;Park, Tai Jin
    • Journal of Radiation Protection and Research
    • /
    • 제41권2호
    • /
    • pp.149-154
    • /
    • 2016
  • Background: Any real application of Bayesian inference must acknowledge that both prior distribution and likelihood function have only been specified as more or less convenient approximations to whatever the analyzer's true belief might be. If the inferences from the Bayesian analysis are to be trusted, it is important to determine that they are robust to such variations of prior and likelihood as might also be consistent with the analyzer's stated beliefs. Materials and Methods: The robust Bayesian inference was applied to atmospheric dispersion assessment using Gaussian plume model. The scopes of contaminations were specified as the uncertainties of distribution type and parametric variability. The probabilistic distribution of model parameters was assumed to be contaminated as the symmetric unimodal and unimodal distributions. The distribution of the sector-averaged relative concentrations was then calculated by applying the contaminated priors to the model parameters. Results and Discussion: The sector-averaged concentrations for stability class were compared by applying the symmetric unimodal and unimodal priors, respectively, as the contaminated one based on the class of ${\varepsilon}$-contamination. Though ${\varepsilon}$ was assumed as 10%, the medians reflecting the symmetric unimodal priors were nearly approximated within 10% compared with ones reflecting the plausible ones. However, the medians reflecting the unimodal priors were approximated within 20% for a few downwind distances compared with ones reflecting the plausible ones. Conclusion: The robustness has been answered by estimating how the results of the Bayesian inferences are robust to reasonable variations of the plausible priors. From these robust inferences, it is reasonable to apply the symmetric unimodal priors for analyzing the robustness of the Bayesian inferences.

국면전환 임계 자기회귀 분석을 위한 베이지안 방법 비교연구 (A Comparison Study of Bayesian Methods for a Threshold Autoregressive Model with Regime-Switching)

  • 노태영;조성일;이령화
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.1049-1068
    • /
    • 2014
  • 자기회귀 모형(autoregressive model)은 일변량(univaraite) 시계열자료의 분석에서 널리 사용되는 방법 중 하나이다. 그러나 이 방법은 자료에 일정한 추세가 있다고 가정하기 때문에 자료에 분절(structural break)이 존재할 때 적절하지 않을 수 있다. 이러한 문제점을 해결하기 위한 방법으로 국면전환(regime-switching) 모형인 임계자기회귀 모형(threshold autoregressive model)이 제안되었는데 최근 지연 모수(delay parameter)을 포함한 이 국면전환(two regime-switching) 모형으로 확장되어 많은 연구가 활발히 진행되고 있다. 본 논문에서는 이 국면전환 임계자기회귀 모형을 베이지안(Bayesian) 관점에서 살펴본다. 베이지안 분석을 위해 모수적 임계자기 회귀 모형 뿐만 아니라 디리슐레 과정(Dirichlet Process) 사전분포를 이용하는 비모수적 임계자기 회귀 모형을 고려하도록 한다. 두 가지 베이지안 임계자기 회귀 모형을 바탕으로 사후분포를 유도하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo) 방법을 통해 사후추론을 실시한다. 모형 간의 성능을 비교하기 위해 모의실험을 통한 자료 분석을 고려하고, 더 나아가 한국과 미국의 국내 총생산(Gross Domestic Product)에 대한 실증적 자료 분석을 실시한다.

분류 속성과 Naive Bayesian을 이용한 사용자와 아이템 기반의 협력적 필터링 (User and Item based Collaborative Filtering Using Classification Property Naive Bayesian)

  • 김종훈;김용집;임기욱;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권11호
    • /
    • pp.23-33
    • /
    • 2007
  • 협력적 필터링은 피어슨 상관 계수에 의해 유사도를 구하고, 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 및 확장성의 문제를 가지고 있다. 이러한 문제점을 개선하기 위하여 아이템 기반 협력적 필터링이 실용화되었으나 아이템의 속성을 반영하지는 못한다. 본 논문에서는 기존 추천 시스템의 문제점을 보완하기 위하여 분류 속성과 Naive Bayesian을 이용한 사용자와 아이템 기반의 협력적 필터링을 제안하였다. 제안한 방법에서는 희박성 문제를 해결하기 위하여 명시적 데이터에 기반한 아이템 유사도와 묵시적 데이터에 기반한 사용자 유사도를 복합적으로 참조한다. 참조 결과에 대해 Naive Bayesian을 적용한다. 또한 속성을 반영하기 위해 아이템 분류속성간의 유사관계 순위를 아이템 유사도 계산에 반영함으로써 정확성을 높일 수 있었다.

베이지안 기법에 기반한 수명자료 분석에 관한 문헌 연구: 2000~2016 (A Review on the Analysis of Life Data Based on Bayesian Method: 2000~2016)

  • 원동연;임준형;심현수;성시일;임헌상;김용수
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제17권3호
    • /
    • pp.213-223
    • /
    • 2017
  • Purpose: The purpose of this study is to arrange the life data analysis literatures based on the Bayesian method quantitatively and provide it as tables. Methods: The Bayesian method produces a more accurate estimates of other traditional methods in a small sample size, and it requires specific algorithm and prior information. Based on these three characteristics of the Bayesian method, the criteria for classifying the literature were taken into account. Results: In many studies, there are comparisons of estimation methods for the Bayesian method and maximum likelihood estimation (MLE), and sample size was greater than 10 and not more than 25. In probability distributions, a variety of distributions were found in addition to the distributions of Weibull commonly used in life data analysis, and MCMC and Lindley's Approximation were used evenly. Finally, Gamma, Uniform, Jeffrey and extension of Jeffrey distributions were evenly used as prior information. Conclusion: To verify the characteristics of the Bayesian method which are more superior to other methods in a smaller sample size, studies in less than 10 samples should be carried out. Also, comparative study is required by various distributions, thereby providing guidelines necessary.