• 제목/요약/키워드: Bayesian model

검색결과 1,312건 처리시간 0.035초

모델기반 방법론을 이용한 환율예측 모형 연구 (A Study of Exchange rate Prediction Model using Model-based)

  • 전진호;문석환;이채린
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.547-549
    • /
    • 2012
  • 경제적인 국제화가 심화되어 세계경제가 통합화되는 환경에서 기업 및 개인 금융기관 등의 외환 거래 참가자들에게 회환거래로 인한 환위험의 회피방안이 무엇보다 절실하다. 이 방안을 마련하기 위해서 본 연구에서는 환율, 주가와 같은 시계열데이터의 모형추정에 적합한 모델을 통해 단기 환율의 예측모형을 추정하고 이를 통해 향 후 예측에 적용한다. 실제의 환율 데이터를 통하여 최적의 모형이 추정된다면 이를 통해 향후의 일정기간의 운동양태의 예측이 가능할 것이다. 은닉마아코프모형의 추정을 위하여 베이지안정보기준을 통해 모형의 상태 수를 정확하게 추정하는지를 확인하였으며 추정되는 모형으로 예측한 결과 실제 운동양태와 예측에 있어 두 곡선의 운동양태가 유사함을 확인하였다.

  • PDF

A hidden Markov model for long term drought forecasting in South Korea

  • Chen, Si;Shin, Ji-Yae;Kim, Tae-Woong
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.225-225
    • /
    • 2015
  • Drought events usually evolve slowly in time and their impacts generally span a long period of time. This indicates that the sequence of drought is not completely random. The Hidden Markov Model (HMM) is a probabilistic model used to represent dependences between invisible hidden states which finally result in observations. Drought characteristics are dependent on the underlying generating mechanism, which can be well modelled by the HMM. This study employed a HMM with Gaussian emissions to fit the Standardized Precipitation Index (SPI) series and make multi-step prediction to check the drought characteristics in the future. To estimate the parameters of the HMM, we employed a Bayesian model computed via Markov Chain Monte Carlo (MCMC). Since the true number of hidden states is unknown, we fit the model with varying number of hidden states and used reversible jump to allow for transdimensional moves between models with different numbers of states. We applied the HMM to several stations SPI data in South Korea. The monthly SPI data from January 1973 to December 2012 was divided into two parts, the first 30-year SPI data (January 1973 to December 2002) was used for model calibration and the last 10-year SPI data (January 2003 to December 2012) for model validation. All the SPI data was preprocessed through the wavelet denoising and applied as the visible output in the HMM. Different lead time (T= 1, 3, 6, 12 months) forecasting performances were compared with conventional forecasting techniques (e.g., ANN and ARMA). Based on statistical evaluation performance, the HMM exhibited significant preferable results compared to conventional models with much larger forecasting skill score (about 0.3-0.6) and lower Root Mean Square Error (RMSE) values (about 0.5-0.9).

  • PDF

베이지안 State-space 모델을 이용한 눈볼대 자원평가 및 관리방안 (Stock assessment and management of blackthroat seaperch Doederleinia seaperch using Bayesian state-space model)

  • 최지훈;김도훈;최민제;강희중;서영일;이재봉
    • 수산해양기술연구
    • /
    • 제55권2호
    • /
    • pp.95-104
    • /
    • 2019
  • This study is aimed to take a stock assessment of blackthroat seaperch Doederleinia seaperch regarding the fishing effort of large-powered Danish Seine Fishery and Southwest Sea Danish Seine Fishery. For the assessment, the state-space model was implemented and the standardized catch per unit effort (CPUE) of large powered Danish Seine Fishery and Southwest Sea Danish Seine Fishery which is necessary for the model was estimated with generalized linear model (GLM). The model was adequate for stock assessment because its r-square value was 0.99 and root mean square error (RMSE) value was 0.003. According to the model with 95% confidence interval, maximum sustainable yield (MSY) of Blackthroat seaperch is from 2,634 to 6,765 ton and carrying capacity (K) is between 33,180 and 62,820. Also, the catchability coefficient (q) is between 2.14E-06 and 3.95E-06 and intrinsic growth rate (r) is between 0.31 and 0.72.

기계학습기법을 이용한 부산-울산-경남 지역의 증발수요 가뭄지수 예측 (Evaporative demand drought index forecasting in Busan-Ulsan-Gyeongnam region using machine learning methods)

  • 이옥정;원정은;서지유;김상단
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.617-628
    • /
    • 2021
  • 가뭄은 심각한 사회적 경제적 손실을 초래하는 주요 자연재해이다. 지역 가뭄 예측은 가뭄 대비에 중요한 정보를 제공할 수 있다. 본 연구에서는 한반도 동남부 부산-울산-경남 지역에서 1981년부터 2020년까지 10개 관측소의 과거 가뭄지수 및 기상 관측자료를 사용하여 가뭄을 예측하는 새로운 기계학습모델을 제안한다. 베이지안 최적화기법을 이용하여 하이퍼 파라미터가 튜닝된 Random Forest, XGBoost, Light GBM 모델을 구축하여 1개월 뒤의 6개월 시간 척도의 증발 수요 가뭄지수를 예측하였다. 단일 지점별 모델과 지역 모델을 각각 구성하여 모델 성능을 비교하였다. 또한 지역 모델을 기반으로 개별 지점의 자료에 대해 미세조정된 모델을 구성하여 모델 성능을 높일 가능성을 살펴보았다.

자원복원력 개념을 적용한 사전확률분포 및 상태공간 잉여생산 평가모델: 살오징어(Todarodes pacificus) 개체군 자원평가 (A State-space Production Assessment Model with a Joint Prior Based on Population Resilience: Illustration with the Common Squid Todarodes pacificus Stock)

  • 김진우;현상윤;윤상철
    • 한국수산과학회지
    • /
    • 제55권2호
    • /
    • pp.183-188
    • /
    • 2022
  • It is a difficult task to estimate parameters in even a simple stock assessment model such as a surplus production model, using only data about temporal catch-per-unit-effort (CPUE) (or survey index) and fishery yields. Such difficulty is exacerbated when time-varying parameters are treated as random effects (aka state variables). To overcome the difficulty, previous studies incorporated somewhat subjective assumptions (e.g., B1=K) or informative priors of parameters. A key is how to build an objective joint prior of parameters, reducing subjectivity. Given the limited data on temporal CPUEs and fishery yields from 1999-2020 for common squid Todarodes pacificus, we built a joint prior of only two parameters, intrinsic growth rate (r) and carrying capacity (K), based on the resilience level of the population (Froese et al., 2017), and used a Bayesian state-space production assessment model. We used template model builder (TMB), a R package for implementing the assessment model, and estimating all parameters in the model. The predicted annual biomass was in the range of 0.76×106 to 4.06×106 MT, the estimated MSY was 0.13×106 MT, the estimated r was 0.24, and the estimated K was 2.10×106 MT.

Framework for improving the prediction rate with respect to outdoor thermal comfort using machine learning

  • Jeong, Jaemin;Jeong, Jaewook;Lee, Minsu;Lee, Jaehyun
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.119-127
    • /
    • 2022
  • Most of the construction works are conducted outdoors, so the construction workers are affected by weather conditions such as temperature, humidity, and wind velocity which can be evaluated the thermal comfort as environmental factors. In our previous researches, it was found that construction accidents are usually occurred in the discomfort ranges. The safety management, therefore, should be planned in consideration of the thermal comfort and measured by a specialized simulation tool. However, it is very complex, time-consuming, and difficult to model. To address this issue, this study is aimed to develop a framework of a prediction model for improving the prediction accuracy about outdoor thermal comfort considering environmental factors using machine learning algorithms with hyperparameter tuning. This study is done in four steps: i) Establishment of database, ii) Selection of variables to develop prediction model, iii) Development of prediction model; iv) Conducting of hyperparameter tuning. The tree type algorithm is used to develop the prediction model. The results of this study are as follows. First, considering three variables related to environmental factor, the prediction accuracy was 85.74%. Second, the prediction accuracy was 86.55% when considering four environmental factors. Third, after conducting hyperparameter tuning, the prediction accuracy was increased up to 87.28%. This study has several contributions. First, using this prediction model, the thermal comfort can be calculated easily and quickly. Second, using this prediction model, the safety management can be utilized to manage the construction accident considering weather conditions.

  • PDF

한우의 도체형질 유전모수 추정을 위한 REML과 Bayesian via Gibbs Sampling 방법의 비교 연구 (Comparison between REML and Bayesian via Gibbs Sampling Algorithm with a Mixed Animal Model to Estimate Genetic Parameters for Carcass Traits in Hanwoo(Korean Native Cattle))

  • 노승희;김병우;김효선;민희식;윤호백;이득환;전진태;이정규
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.719-728
    • /
    • 2004
  • 본 연구는 한우의 도체형질들에 대한 유전적 변이를 분석방법에 따라 어떠한 차이가 있는지를 알아보고자 한우 후대검정자료를 이용하여 분석하였다. 분석에 이용된 도체성적 관련 자료는 가축개량사업소와 한우개량단지에서 1996 년부터 2001 년까지 태어난 후대검정우 1526두로부터 조사었다. 한우에 있어서 주요 개량형질인 육량과 육질에 영향하는 도체중, 도체율,배최장근단면적, 등지방두께, 근내지방도를 대상으로 유전력과 유전상관을 추정하였다. 유전모수 추정에 있어서 REML 분석법과 Bayesian추론방법으로써 Gibbs Sampling 분석법을 사용하였는데 각각의 모수들에 대한 Gibbs Sampler는 100,000회 실시하였고 초기 1,000회는 모수의 사후분포에 대한 부정확성으로 간주하여 모수의 사후분포특성 규명에서 제외하였다. 각각의 형질들에 대한 유전변이는 이러한 두 가지 분석방법을 상호 비교 함으로써 최적의 통계분석 방법을 모색하였다. 도체형질에 대한 유전력 추정은 REML 방법을 통한 추정에서는 근내지방도가 0.51로 고도의 유전력을 보였고, 도체율이 0.25로 중도의 유전력이 추정되었다. Gibbs Sampling 방법을통한 추정에서도 근내지방도가 0.54로 고도의 유전력을 도체율에서 0.25로 중도의 유전력을 보였다. REML 분석방법과 Gibbs Sampling 분석방법에서의 유전력은 다소 큰 차이는 보이지 않았으나, 대체로 Gibbs Sampling 방법으로 분석한 유전력 추정치가 높게 추정되었다. 그리고, 유전상관분석에서는 REML 방법을 통한 분석에서 도체중과 배최장근단면적에서 0.651 로 높은 정의 유전상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.139로 부의 유천상관을 나타내었다. Gibbs Sampling 방법에서는 도체중과 도체율, 배최장근단면적에서 각각 0.814, 0.695으로 높은 정의 상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.126으로 부의상관을 나타내었다. Gibbs Sampling방법을 통한 분석에서 특정 형질간 유전상관이 높게 나타났으며, 다소 큰 차이를 보이지 않았다. REML 분석방법과 Bayesian Inference를 바탕으로 한 Gibbs Sampling 분석에서 모수 추정은 큰 차이를 보이지 않았다. 따라서 방대한 현장정보를 활용하여 보다 정확한 모수 추정을 수행하기 위해서는 분석모형에 대한 계수행렬의 역행렬 계산을 통한 REML 방법의 한계성을 극복할 수 있는 방법으로써 Gibbs Sampling 분석 방법이 가능할 것으로 사료된다.

특정 종돈집단의 임신기간, 이유후초종부일, 총산자수 및 사산에 대한 유전모수 추정 (Estimation of Genetic Parameters for Gestation Length, Wean to First Service, Litter Size and Stillborn Piglets in a Closed Nucleus Swine Breeding Herd)

  • 이득환;손지현
    • Journal of Animal Science and Technology
    • /
    • 제55권5호
    • /
    • pp.389-398
    • /
    • 2013
  • 본 연구는 폐쇄종돈군을 유지하면서 장기간 선발육종을 실시한 Landrace 및 Yorkshire 모계 종돈집단에서 임신기간, 총산자수, 이유후초종부일 및 사산두수에 대한 유전적 변이성을 제시함으로써 이들 형질들에 대한 선발지표에 참고자료를 제시하고자 실시하였다. 분석에 이용된 자료는 상기의 형질들에 대하여 사전 이상치를 제외한 후, Landrace 품종에서 1,910두의 모돈으로부터 수집된 7,616복의 기록 및 Yorkshire 품종 2283두의 모돈으로부터 수집된 총 10,454복의 기록을 이용하였다. 분석형질들에 대한 유전변이를 추정하기 위하여 상기의 4개 형질을 동시에 고려한 혼합모형을 설정하였으며, 특히 사산두수에 대하여는 정규성에 크게 위배되기 때문에 범주형 자료로 가정하여 다형질 선형-임계형 반복동물개체모형을 설정하여 분석하였다. 분석방법으로서는 Bayesian 추론의 일종인 Gibbs Sampling (GS) 방법에 의하여 모수의 사후분포 함수로부터 모수에 대한 GS을 50,000회 실시하고 burn-in을 제외한 후 모수의 사후분포에 대한 통계량을 제시하였다. 유전변이를 추정한 결과, 임신기간에 대한 유전력은 0.21~0.35로 추정되었고, 이유후초종부일에서는 0.16~0.23, 총산자수는 0.14~0.16 및 사산두수에 있어서는 0.09~0.10으로 추정되었다. 임신기간에 대한 유전상관 추정치는 총산자수 및 사산두수에서 부의 상관을 갖는 것으로 추정되었고 총산자수와 사산두수와는 정의 상관을 갖는 것으로 추정되었다. 총산자수와 이유후초발정일 간의 유전상관은 낮은 부의 상관을 갖는 것으로 추정되었으며 임신기간과 이유후 초종부일 간에는 유전적 상관관계가 매우 미약한 것으로 분석되었다. 따라서 총산자수를 개량하고자 할 때, 사산두수를 고려하여 선발지표를 설정함이 타당할 것으로 판단되었다.

돼지생식기호흡기증후군(PRRS) 바이러스 감염 항체 검출 ELISA 상용 키트의 정확도 비교 (Comparison of Two Commercial Antibody Enzyme-Linked Immunosorbent Assays for Detection of Porcine Reproductive Respiratory Syndrome Virus Infection)

  • 박선일;이승환;박경애
    • 한국임상수의학회지
    • /
    • 제33권2호
    • /
    • pp.102-106
    • /
    • 2016
  • More than 20 years after the first report of porcine reproductive and respiratory syndrome virus (PRRSV) in Korea, the disease is still having major impact on domestic pig health and relevant industries. Although ELISA tests are commonly used by veterinarians to guide herd management, data on diagnostic performance of the test in field settings are very limited. The objective of this study was to evaluate two commercially available PRRSV ELISA (IDEXX PRRS X3 ELISA and Bionote PRRSV ELISA 4.0) to detect antibodies against PRRSV on serum samples. To this end, a total of 1,108 sera were recruited from 35 swine farms located in Gyeonggi province and tested at the Gyeonggi Province Veterinary Service Center. All tests were performed according to the manufacturer's instructions, by laboratory technicians who routinely perform PRRS testing on blood samples. Samples were collected from two sources of swine populations with different PRRS prevalence; 60 samples (5.4%) were originated from breeding farms and the remaining 1,048 samples (94.6%) were from farrow-to-finish farms. We applied Bayesian latent class model (LCM) for two-tests in the two-population when the accuracy of the gold standard is not available. The model estimated that Bionote ELISA was a bit more specific but slightly less sensitive. The estimated sensitivity and specificity of the IDEXX ELISA were 99.8% (95% CI 98.1-100%) and 86.4% (95% CI 81.4-96.5%), respectively. Sensitivity, specificity, positive predictive value and negative predictive value for Bionote kit were 98.7% (95% CI 92.8-100%), 89.8% (95% CI 86.2-93.1%), 93.8% (95% CI 91.5-96.0%), and 97.8% (95% CI 87.1-100%), respectively. Based on the Bayesian 95% credible intervals, the sensitivity and specificity of the two ELISAs were not significantly different each other when assuming that two kits were imperfect, indicating that two kits performed equally well in terms of sensitivity and specificity in our filed setting.

공간 다수준 분석을 이용한 부산지역 암발생 및 암사망 추정 (Cancer incidence and mortality estimations in Busan by using spatial multi-level model)

  • 고영규;한준희;윤태호;김창훈;노맹석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1169-1182
    • /
    • 2016
  • 한국인의 전형적인 사망 원인인 암은 보건 분야에서 중요한 문제이다. 통계청이 제시한 Cause of death statistics (2014)에 따르면, 7대 광역시 중 부산의 표준화 사망률 (standardized mortality rate; SMR)이 가장 높게 나타났다. 이 논문에서는 부산지역암센터의 암등록자료를 이용하여 암발생률과 암사망률의 정도를 추정하고자 한다. 2003~2009년 자료를 대상으로 구/동과 같은 소지역 단위를 고려하였으며, 전체 암과 4대 주요암 (위암, 대장암, 폐암, 간암)에 대해 분석하였다. 공간 상관성을 고려한 공간 다수준 모형을 통해 모형 선택과 모수 추정을 수행하였다. 공간 효과에 대해서는 조건부 자기회귀 (conditional autoregressive; CAR)를 가정하였으며 WinBUGS를 이용하였다. 분석의 결과로 각 지역에서의 공간 효과를 어떻게 분석하고 해석하는지 제시하였다.