• 제목/요약/키워드: Bayesian Information Criterion

검색결과 121건 처리시간 0.03초

베이지안 추정을 이용한 팔당호 유역의 계절별 클로로필a 예측 및 오염특성 연구 (A Study on Characteristics and Predictions of Seasonal Chlorophyll-a using Bayseian Regression in Paldang Watershed)

  • 김미아;신유나;김경현;허태영;유문규;이수웅
    • 한국물환경학회지
    • /
    • 제29권6호
    • /
    • pp.832-841
    • /
    • 2013
  • In recent years, eutrophication in the Paldang Lake has become one of the major environmental problems in Korea as it may threaten drinking water safety and human health. Thus it is important to understand the phenomena and predict the time and magnitude of algal blooms for applying adequate algal reduction measures. This study performed seasonal water quality assessment and chlorophyll-a prediction using Bayseian simple/multiple linear regression analysis. Bayseian regression analysis could be a useful tool to overcome limitations of conventional regression analysis. Also it can consider uncertainty in prediction by using posterior distribution. Generally, chlorophyll-a of a P2(Paldang Dam 2) site showed high concentration in spring and it was similar to that of P4(Paldang Dam 4) site. For the development of Bayseian model, we performed seasonal correlation. As a result, chlorophyll-a of a P2 site had a high correlation with P5(Paldang Dam 5) site in spring (r = 0.786, p<0.05) and with P4 in winter (r = 0.843, p<0.05). Based on the DIC (Deviance Information Criterion) value, critical explanatory variables of the best fitting Bayesian linear regression model were selected as a $PO_4-P$ (P2), Chlorophyll-a (P5) in spring, $NH_3-N$ (P2), Chlorophyll-a (P4), $NH_3-N$ (P4) in summer, DTP (P2), outflow (P2), TP (P3), TP (P4) fall, COD (P2), Chl-a (P4) and COD (P4) in winter. The results of chlorophyll-a prediction showed relatively high $R^2$ and low RMSE values in summer and winter.

벡터자기회귀(VAR) 모형을 이용한 지하수위와 하천수위의 추계학적 모의기법 개발 (A development of stochastic simulation model based on vector autoregressive model (VAR) for groundwater and river water stages)

  • 권윤정;원창희;최병한;권현한
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1137-1147
    • /
    • 2022
  • 하천수위와 지하수위는 수문학적 순환과정에서 나타나는 수문학적 요소로 상호 연관성이 높으며 이러한 수문학적 요소에 대해 확률적 시뮬레이션을 독립적으로 수행하는 경우 상호 관련 정보손실과 같은 문제가 발생할 수 있다. 하천수위와 지하수위는 수문학적·농업적 가뭄을 평가하는 중요한 지표로 활용되지만 하천수위의 경우 건기 중에는 정확한 관측을 얻기가 매우 어려우며, 지하수위의 경우 데이터 기간이 상대적으로 짧아 이를 활용한 가뭄지수 사용이 제한적이다. 이와 관련하여 손실 없이 자료를 최대한 이용하기 위해 본 연구는 각 변수의 시간 의존성을 고려하는 동시에 상호 연관된 변수의 시간 의존성을 고려하는 벡터자기회 모형VAR)을 구성했다. 하천수위와 지하수위 사이의 자기 상관 및 상관관계를 확인하고, 정보 손실을 최소화하는 하천수위 및 지하수위를 예측할 수 있는지 여부를 결정하기 위해 벡터 자기 회귀 모델의 최적 순서 결정과 매개변수를 결정하였다. 또한, 두 변수 간의 상관관계를 반영하지 않는 자기회귀모형(AR)을 구축하고 모의에 대한 DIC와 상관계수를 VAR 모형과 비교하여 VAR 모형 더 적합함을 보이고 하천수위와 지하수위의 간의 상호관계성을 효과적으로 반영함을 확인하였다.

은닉마아코프모델을 이용한 단기 원/달러 환율예측 모형 연구 (A Study of Short-term Won/Doller Exchange rate Prediction Model using Hidden Markov Model)

  • 전진호;김민수
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.229-235
    • /
    • 2012
  • 경제적인 국제화가 심화되어 세계경제가 통합화되는 환경에서 기업 및 개인, 금융기관 등의 외환거래 참가가들에게 외환거래로 인한 환위험의 회피방안이 무엇보다 절실하다. 이 방안을 마련하기 위하여 본 연구에서는 환율, 주가와 같은 시계열데이터의 모형추정에 적합한 은닉마아코프모델을 통해 단기 환율의 예측모형을 추정하고 이를 통해 향후 예측에 적용한다. 실제의 원/달러 환율데이터를 적용하여 최적의 모형이 추정된다면 이를 통해 향후의 일정기간의 운동양태의 예측이 가능할 것이다. 은닉마아코프모형의 추정을 위하여 베이지안정보기준을 통해 모형의 상태수를 정확하게 추정하는지를 확인하였으며 추정되는 모형으로 예측한 결과 실제 운동양태와 예측에 있어 두 곡선의 운동양태가 유사함을 확인하였다.

SHM-based probabilistic representation of wind properties: statistical analysis and bivariate modeling

  • Ye, X.W.;Yuan, L.;Xi, P.S.;Liu, H.
    • Smart Structures and Systems
    • /
    • 제21권5호
    • /
    • pp.591-600
    • /
    • 2018
  • The probabilistic characterization of wind field characteristics is a significant task for fatigue reliability assessment of long-span railway bridges in wind-prone regions. In consideration of the effect of wind direction, the stochastic properties of wind field should be represented by a bivariate statistical model of wind speed and direction. This paper presents the construction of the bivariate model of wind speed and direction at the site of a railway arch bridge by use of the long-term structural health monitoring (SHM) data. The wind characteristics are derived by analyzing the real-time wind monitoring data, such as the mean wind speed and direction, turbulence intensity, turbulence integral scale, and power spectral density. A sequential quadratic programming (SQP) algorithm-based finite mixture modeling method is proposed to formulate the joint distribution model of wind speed and direction. For the probability density function (PDF) of wind speed, a double-parameter Weibull distribution function is utilized, and a von Mises distribution function is applied to represent the PDF of wind direction. The SQP algorithm with multi-start points is used to estimate the parameters in the bivariate model, namely Weibull-von Mises mixture model. One-year wind monitoring data are selected to validate the effectiveness of the proposed modeling method. The optimal model is jointly evaluated by the Bayesian information criterion (BIC) and coefficient of determination, $R^2$. The obtained results indicate that the proposed SQP algorithm-based finite mixture modeling method can effectively establish the bivariate model of wind speed and direction. The established bivariate model of wind speed and direction will facilitate the wind-induced fatigue reliability assessment of long-span bridges.

Facial profile parameters and their relative influence on bilabial prominence and the perceptions of facial profile attractiveness: A novel approach

  • Denize, Erin Stewart;McDonald, Fraser;Sherriff, Martyn;Naini, Farhad B.
    • 대한치과교정학회지
    • /
    • 제44권4호
    • /
    • pp.184-194
    • /
    • 2014
  • Objective: To evaluate the relative importance of bilabial prominence in relation to other facial profile parameters in a normal population. Methods: Profile stimulus images of 38 individuals (28 female and 10 male; ages 19-25 years) were shown to an unrelated group of first-year students (n = 42; ages 18-24 years). The images were individually viewed on a 17-inch monitor. The observers received standardized instructions before viewing. A six-question questionnaire was completed using a Likert-type scale. The responses were analyzed by ordered logistic regression to identify associations between profile characteristics and observer preferences. The Bayesian Information Criterion was used to select variables that explained observer preferences most accurately. Results: Nasal, bilabial, and chin prominences; the nasofrontal angle; and lip curls had the greatest effect on overall profile attractiveness perceptions. The lip-chin-throat angle and upper lip curl had the greatest effect on forehead prominence perceptions. The bilabial prominence, nasolabial angle (particularly the lower component), and mentolabial angle had the greatest effect on nasal prominence perceptions. The bilabial prominence, nasolabial angle, chin prominence, and submental length had the greatest effect on lip prominence perceptions. The bilabial prominence, nasolabial angle, mentolabial angle, and submental length had the greatest effect on chin prominence perceptions. Conclusions: More prominent lips, within normal limits, may be considered more attractive in the profile view. Profile parameters have a greater influence on their neighboring aesthetic units but indirectly influence related profile parameters, endorsing the importance of achieving an aesthetic balance between relative prominences of all aesthetic units of the facial profile.

진화연산과 적응적 ${\alpha}$-cut 기반 평가를 이용한 유전자 발현 데이타의 퍼지 클러스터 분석 (Fuzzy Cluster Analysis of Gene Expression Profiles Using Evolutionary Computation and Adaptive ${\alpha}$-cut based Evaluation)

  • 박한샘;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.681-691
    • /
    • 2006
  • 유전자 데이타의 클러스터링은 방대한 유전자 정보를 발현 정도에 따라 비슷한 그룹으로 나누어 분석하는 방법으로 유전자의 기능을 분석하는데 사용되어 왔다. 클러스터링의 한 종류인 퍼지 클러스터링은 하나의 샘플이 소속정도에 따라 여러 그룹에 동시에 소속되도록 나누는 방법으로, 하나의 유전자 데이타는 여러가지 유전 정보를 가칠 수 있기 때문에 유전자 발현 데이타의 분석에 보다 적절한 방법이다. 그러나 보통 클러스터링 방법은 초기 값에 민감하고, 지역해에 빠질 수 있는 단점을 갖는다. 이런 단점을 해결하기 위해 본 논문에서는 진화 연산을 이용한 퍼지 클러스터링 방법을 제안한다. 이때, 적합도 평가를 위해서 모든 데이타에 대해 동일한 기준을 적용하는 베이지안 검증방법의 단점을 개선하여, 데이타의 특성 을 고려하여 결정된 적용적 ${\alpha}$-cut 기반 평가방법을 사용한다. SRBCT 데이타와 효모 세포주기 데이타를 이용해 실험을 하고 결과를 분석하여 제안하는 방법의 유용성을 확인하였다.

Extensive Lymph Node Dissection Improves Survival among American Patients with Gastric Adenocarcinoma Treated Surgically: Analysis of the National Cancer Database

  • Naffouje, Samer A.;Salti, George I.
    • Journal of Gastric Cancer
    • /
    • 제17권4호
    • /
    • pp.319-330
    • /
    • 2017
  • Introduction: The extent of lymphadenectomy in the surgical treatment of gastric cancer is a topic of controversy among surgeons. This study was conducted to analyze the American National Cancer Database (NCDB) and conclude the optimal extent of lymphadenectomy for gastric adenocarcinoma. Methods: The NCDB for gastric cancer was utilized. Patients who received at least a partial gastrectomy were included. Patients with metastatic disease, unknown TNM stages, R1/R2 resection, or treated with a palliative intent were excluded. Joinpoint regression was used to identify the extent of lymphadenectomy that reflects the optimal survival. Cox regression analysis and Bayesian information criterion were used to identify significant survival predictors. Kaplan-Meier was applied to study overall survival and stage migration. Results: 40,281 patients of 168,377 met the inclusion criteria. Joinpoint analysis showed that dissection of 29 nodes provides the optimal median survival for the overall population. Regression analysis reported the cutoff ${\geq}29$ to have a better fit in the prognostic model than that of ${\geq}15$. Dissection of ${\geq}29$ nodes in the higher stages provides a comparable overall survival to the immediately lower stage. Nonetheless, the retrieval of ${\geq}15$ nodes proved to be adequate for staging without a significant stage migration compared to ${\geq}29$ nodes. Conclusion: The extent of lymphadenectomy in gastric adenocarcinoma is a marker of improved resection which reflects in a longer overall survival. Our analysis concludes that the dissection of ${\geq}15$ nodes is adequate for staging. However, the dissection of 29 nodes might be needed to provide a significantly improved survival.

신경망 모형을 이용한 태풍시기의 남해안 기압예측 연구 (Study on the Sea Level Pressure Prediction of Typhoon Period in South Coast of the Korean Peninsula Using the Neural Networks)

  • 박종길;김병수;정우식;서장원;손용희;이대근;김은별
    • 대기
    • /
    • 제16권1호
    • /
    • pp.19-31
    • /
    • 2006
  • The purpose of this study is to develop the statistical model to predict sea level pressure of typhoon period in south coast of the Korean Peninsula. Seven typhoons, which struck south coast of the Korean Peninsula, are selected for this study, and the data for analysis include the central pressure and location of typhoon, and sea level pressure and location of 19 observing site. Models employed in this study are the first order regression, the second order regression and the neural network. The dependent variable of each model is a 3-hr interval sea level pressure at each station. The cause variables are the central pressure of typhoon, distance between typhoon center and observing site, and sea level pressure of 3 hrs before, whereas the indicative variable reveals whether it is before or after typhoon passing. The data are classified into two groups - one is the full data obtained during typhoon period and the other is the data that sea level pressure is less than 1000 hPa. The stepwise selection method is used in the regression model while the node number is selected in the neural network by the Schwarz's Bayesian Criterion. The performance of each model is compared in terms of the root-mean square error. It turns out that the neural network shows better performance than other models, and the case using the full data produces similar or better results than the case using the other data.

Monte-Carlo expectation-maximaization 방법을 이용한 무응답 모형 추정방법 (An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm)

  • 최보승;유현상;윤용화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.587-598
    • /
    • 2016
  • 각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.

항온과 변온조건에서 복숭아혹진딧물의 발육비교 및 온도 발육모형 (Comparison of Development times of Myzus persicae (Hemiptera:Aphididae) between the Constant and Variable Temperatures and its Temperature-dependent Development Models)

  • 김도익;최덕수;고숙주;강범용;박창규;김선곤;박종대;김상수
    • 한국응용곤충학회지
    • /
    • 제51권4호
    • /
    • pp.431-438
    • /
    • 2012
  • 복숭아혹진딧물(Myzus persicae)의 온도에 따른 발육시험을 실내 15, 18, 21, 24, 27, $30^{\circ}C$의 6개 항온, 광주기 14L:10D, 상대습도 50~60% 조건과 고추 비닐하우스에서 3월 23일부터 8월 20일까지 6회 접종하여 수행하였다. 실내사망률은 저온에서는 1~2령충의 사망률이 높았고 온도가 증가할수록 3~4령충의 사망률이 높았으며 고온에서는 66.7%까지 높아졌다. 실내와 포장조건 모두 온도가 증가할수록 발육기간이 짧아지는 경향을 보였으며 포장조건 8월 접종에서 6.03일로 가장 짧았다. 온도와 발육률과의 관계를 보기 위해 선형 및 3개의 비선형 모형(Briere 1, Lactin 2, Logan 6)을 이용하여 분석한 결과, 선형모형을 이용하여 전체약충의 발육영점온도는 $3.0^{\circ}C$였으며 발육유효적산온도는 111.1DD 였다. 3가지 비선형 모형중 Logan-6 모형이 전약충, 후약충 전체약충 단계에서 AIC와 BIC 값이 가장 적어 온도와 발육율과의 관계를 잘 설명하였으며, 발육단계별 발육완료분포는 3-parameter Weibull 함수를 사용하였으며 전약충, 후약충, 전체약충에서 $r^2$ 값이 0.95~0.97로 높은 값을 보여 양호한 모형 적합성을 보였으며 정식시기별 성충 발생 예측치와 포장 조사치가 일치하여 방제적기 추정에 유용하게 사용할 수 있을 것이다.