• Title/Summary/Keyword: 다중분위회귀분석모형

Search Result 10, Processing Time 0.034 seconds

A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data (조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구)

  • Jung, Chung Gil;Lee, Ji Wan;Kim, Da Rae;Kim, Se Hun;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

Development of Bayesian Multiple Quantile Regression model and Estimation fo Future Design Rainfall with Increased Temperature (베이지안 다중분위회귀분석모형 개발 및 온도상승에 따른 미래 확률강수량 전망)

  • Uranchimeg, Sumiya;Kim, Jin-Guk;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.22-22
    • /
    • 2019
  • 최근 전 세계적으로 급증하는 기후변화의 영향으로 인해 강우량 증가에 따른 이상홍수 발생 및 댐 여유고 부족 등 다양한 위험인자가 노출되고 있다. 이러한 예상치 못한 이상홍수는 실제 거주하고 있는 사람들을 위협할 수 있으며, 하천 범람으로 인해 2차 3차 피해가 일어날 가능성이 존재하고 있다. 이에 다양한 자연재해로부터 인명 및 재산 피해를 방지 및 저감하기 위한 목적으로 다양한 수공구조물이 존재하며, 수자원 관리계획 수립의 목적에 따라 다양한 강수량이 활용되고 있다. 특히, 지구온난화에 따른 기후변화 영향을 고려한 연최대 강수량 및 확률강수량 산정이 필요한 시점이며, 온도변화에 따른 증기압 계산식인 Clausius-Clapeyron 관계에 따르면 대기 온도가 $1^{\circ}C$ 상승할 때 대기수분량이 6~7% 증가하여 평균 온도상승에 따라 극치강수량 발생 잠재력이 향상 될 것으로 전망되고 있다. 본 연구에서는 온도상승에 따른 극치강수량의 변화를 베이지안 다중분위회귀분석모형을 통해 산정하여 CORDEX 온도자료 기반의 미래 극치강수량을 전망하였다. 본 연구결과 100년 이상 빈도의 강수량은 온도상승에 따라 급격히 증가하는 추세를 확인하였으며, 2100년까지 온도상승을 고려한 최대 극치강수량은 1500mm를 넘을 가능성을 확인하였다.

  • PDF

Analysis of AI interview data using unified non-crossing multiple quantile regression tree model (통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석)

  • Kim, Jaeoh;Bang, Sungwan
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.6
    • /
    • pp.753-762
    • /
    • 2020
  • With an increasing interest in integrating artificial intelligence (AI) into interview processes, the Republic of Korea (ROK) army is trying to lead and analyze AI-powered interview platform. This study is to analyze the AI interview data using a unified non-crossing multiple quantile tree (UNQRT) model. Compared to the UNQRT, the existing models, such as quantile regression and quantile regression tree model (QRT), are inadequate for the analysis of AI interview data. Specially, the linearity assumption of the quantile regression is overly strong for the aforementioned application. While the QRT model seems to be applicable by relaxing the linearity assumption, it suffers from crossing problems among estimated quantile functions and leads to an uninterpretable model. The UNQRT circumvents the crossing problem of quantile functions by simultaneously estimating multiple quantile functions with a non-crossing constraint and is robust from extreme quantiles. Furthermore, the single tree construction from the UNQRT leads to an interpretable model compared to the QRT model. In this study, by using the UNQRT, we explored the relationship between the results of the Army AI interview system and the existing personnel data to derive meaningful results.

Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration (기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측)

  • Kim, Chul-gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Nam-won;Kim, Hyeonjun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin (다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측)

  • Kim, Chul-Gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Hyeonjun
    • Journal of Korea Water Resources Association
    • /
    • v.55 no.10
    • /
    • pp.723-736
    • /
    • 2022
  • In this study, monthly precipitation forecasting models that can predict up to 12 months in advance were constructed for the Geum River basin, and two statistical techniques, multiple linear regression (MLR) and artificial neural network (ANN), were applied to the model construction. As predictor candidates, a total of 47 climate indices were used, including 39 global climate patterns provided by the National Oceanic and Atmospheric Administration (NOAA) and 8 meteorological factors for the basin. Forecast models were constructed by using climate indices with high correlation by analyzing the teleconnection between the monthly precipitation and each climate index for the past 40 years based on the forecast month. In the goodness-of-fit test results for the average value of forecasts of each month for 1991 to 2021, the MLR models showed -3.3 to -0.1% for the percent bias (PBIAS), 0.45 to 0.50 for the Nash-Sutcliffe efficiency (NSE), and 0.69 to 0.70 for the Pearson correlation coefficient (r), whereas, the ANN models showed PBIAS -5.0~+0.5%, NSE 0.35~0.47, and r 0.64~0.70. The mean values predicted by the MLR models were found to be closer to the observation than the ANN models. The probability of including observations within the forecast range for each month was 57.5 to 83.6% (average 72.9%) for the MLR models, and 71.5 to 88.7% (average 81.1%) for the ANN models, indicating that the ANN models showed better results. The tercile probability by month was 25.9 to 41.9% (average 34.6%) for the MLR models, and 30.3 to 39.1% (average 34.7%) for the ANN models. Both models showed long-term predictability of monthly precipitation with an average of 33.3% or more in tercile probability. In conclusion, the difference in predictability between the two models was found to be relatively small. However, when judging from the hit rate for the prediction range or the tercile probability, the monthly deviation for predictability was found to be relatively small for the ANN models.

Bayesian quantile regression analysis of private education expenses for high scool students in Korea (일반계 고등학생 사교육비 지출에 대한 베이지안 분위회귀모형 분석)

  • Oh, Hyun Sook
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.6
    • /
    • pp.1457-1469
    • /
    • 2017
  • Private education expenses is one of the key issues in Korea and there have been many discussions about it. Academically, most of previous researches for private education expenses have used multiple regression linear model based on ordinary least squares (OLS) method. However, if the data do not satisfy the basic assumptions of the OLS method such as the normality and homoscedasticity, there is a problem with the reliability of estimations of parameters. In this case, quantile regression model is preferred to OLS model since it does not depend on the assumptions of nonnormality and heteroscedasticity for the data. In the present study, the data from a survey on private education expenses, conducted by Statistics Korea in 2015 has been analyzed for investigation of the impacting factors for private education expenses. Since the data do not satisfy the OLS assumptions, quantile regression model has been employed in Bayesian approach by using gibbs sampling method. The analysis results show that the gender of the student, parent's age, and the time and cost of participating after school are not significant. Household income is positively significant in proportion to the same size for all levels (quantiles) of private education expenses. Spending on private education in Seoul is higher than other regions and the regional difference grows as private education expenditure increases. Total time for private education and student's achievement have positive effect on the lower quantiles than the higher quantiles. Education level of father is positively significant for midium-high quantiles only, but education level of mother is for all but low quantiles. Participating after school is positively significant for the lower quantiles but EBS textbook cost is positively significant for the higher quantiles.

A comparison study of multiple linear quantile regression using non-crossing constraints (비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구)

  • Bang, Sungwan;Shin, Seung Jun
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.5
    • /
    • pp.773-786
    • /
    • 2016
  • Multiple quantile regression that simultaneously estimate several conditional quantiles of response given covariates can provide a comprehensive information about the relationship between the response and covariates. Some quantile estimates can cross if conditional quantiles are separately estimated; however, this violates the definition of the quantile. To tackle this issue, multiple quantile regression with non-crossing constraints have been developed. In this paper, we carry out a comparison study on several popular methods for non-crossing multiple linear quantile regression to provide practical guidance on its application.

Long-term rainfall prediction of Geum river basin using teleconnected climate indices (원격상관 기후지수를 이용한 금강유역 장기 강우량 예측)

  • Lee, Jeongwoo;Kim, Nam Won;Kim, ChuI-Gyum;Lee, Jeong Eun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.211-211
    • /
    • 2018
  • 미해양대기청 기후예측센터(Climate Prediction Center, NOAA)에서 제공하고 있는 기후지수(climate indices)를 예측인자로 하고 금강유역의 5~6월의 강우량을 예측대상으로 하는 원격상관기반 통계모형을 구축하였다. 1988년부터 2017년까지의 30년 자료에 대해 예측인자와 예측대상간의 시간지연상관분석을 수행한 결과 NAO(North Atlantic Oscillation), EP/NP(East Pacific/North Pacific Oscillation), EA(East Atlantic Pattern), WP(Western Pacific Index) 등과 상관성이 높은 것으로 분석되었으며, 이러한 시간지연 기후지수를 이용하여 4개월전에 5,6월 강수량을 예측할 수 있는 다중회귀모형을 개발하였다. 관측 강우량 아노말리가 큰 경우에는 다소 과소 예측되고, 아노말리가 작은 경우에는 다소 과다 예측되는 경향을 보였지만 관측 강우량과 예측 강우량간의 상관계수가 0.75로서 비교적 우수한 예측 결과를 나타내었다. 5~6월 강우량 아노말리의 3분위 예측성을 평가한 결과 평년이상 적중률은 77.8%, 평년수준은 81.8%로서 예측 성공률이 높았으며, 5, 6월 누적강우량이 매우 작았던 92년과 95년을 제외하고는 강우량이 적은 해에도 예측성이 우수하여 평년이하 적중률이 70.0%를 나타내었다. 따라서 본 개발모형은 최소 4개월 이전 선행시간을 가지고 늦봄, 초여름강우량을 예측할 수 있는 저비용의 가뭄 예측 도구로 유용하게 활용될 수 있을 것이다.

  • PDF

Long-term runoff prediction of Gyeongan-cheon watershed using statistically forecasted weather information (통계적 기상예측정보를 이용한 경안천 유출량 장기 전망)

  • Kim, Chul-Gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Hyeonjun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.413-413
    • /
    • 2022
  • 본 연구에서는 통계적 방법으로 도출된 장기 기상예측정보를 이용하여 유역에서의 유출량 전망 가능성을 검토하였다. 먼저 한강권역의 월 강수량과 기온에 대해 글로벌 기후지수와의 원격상관성을 기반으로 다중회귀모형 기반의 통계적 예측모형을 구성하여 미래기간(1~12개월)에 대한 월 단위 기상예측정보를 도출하였다. 월 단위로 도출된 강수량과 기온은 통계적 상세화 기법을 통해 한강권역 주요 ASOS 관측소 지점별로 일 단위 강수량과 기온자료로 변환하였으며, 상세화된 일 자료를 유역모형인 SWAT의 입력자료로 활용하여 경안천 유역의 미래기간에 대한 유출량을 도출하였다. 유출량 예측성을 평가하기 위하여 과거기간(2003~2021년)을 대상으로 관측유출량과 예측기상정보로부터 산출된 예측유출량을 비교하였다. 각 월별로 예측된 유출량의 중앙값과 관측값의 적합도를 분석한 결과, PBIAS는 -5.2~-2.7%, RSR은 0.79~0.91, NSE는 0.34~0.38, r은 0.59~0.62로 강수량 및 기온의 예측성에 비해 낮게 나타났다. 전 기간에 대해 월별로 분석한 예측결과에 대한 3분위 확률은 5월, 6월, 7월, 9월, 11월은 평균 42.8%로 예측성이 충분한 것으로 나타났으나, 나머지 월에서의 평균 예측성은 17.3%로 매우 낮게 나타났다. 상세화된 기상정보를 이용하여 유역모델링을 통해 산정한 유출량에 대한 전망 결과는 기상예측결과에 비해 상대적으로 예측성이 낮은 것으로 분석되었다. 이는 관측값 자체에서 나타날 수 있는 불확실성에 기인할 수도 있으며, 유출량에 지배적인 영향을 주는 강수량의 예측성에 대한 문제가 유역 모델링 과정에서 증폭되어 나타나는 문제일 수도 있다. 또한 지점별 일 자료로 상세화되는 과정에서의 불확실성, 우리나라 여름철 유출량 변동성 등 여러 가지 요인이 복합적으로 영향을 주어 나타나는 것으로 생각된다. 향후 다양한 대상유역에 대한 검토와 기상예측모형의 보완, 상세화 과정에서의 불확실성 해소 등을 통해 예측성을 개선할 계획이다.

  • PDF

A Development of Nonstationary Frequency Analysis Model using a Bayesian Multiple Non-crossing Quantile Regression Approach (베이지안 다중 비교차 분위회귀 분석 기법을 이용한 비정상성 빈도해석 모형 개발)

  • Uranchimeg, Sumiya;Kim, Yong-Tak;Kwon, Young-Jun;Kwon, Hyun-Han
    • Journal of Coastal Disaster Prevention
    • /
    • v.4 no.3
    • /
    • pp.119-131
    • /
    • 2017
  • Global warming under the influence of climate change and its direct impact on glacial and sea level are known issue. However, there is a lack of research on an indirect impact of climate change such as coastal structure design which is mainly based on a frequency analysis of water level under the stationary assumption, meaning that maximum sea level will not vary significantly over time. In general, stationary assumption does not hold and may not be valid under a changing climate. Therefore, this study aims to develop a novel approach to explore possible distributional changes in annual maximum sea levels (AMSLs) and provide the estimate of design water level for coastal structures using a multiple non-crossing quantile regression based nonstationary frequency analysis within a Bayesian framework. In this study, 20 tide gauge stations, where more than 30 years of hourly records are available, are considered. First, the possible distributional changes in the AMSLs are explored, focusing on the change in the scale and location parameter of the probability distributions. The most of the AMSLs are found to be upward-convergent/divergent pattern in the distribution, and the significance test on distributional changes is then performed. In this study, we confirm that a stationary assumption under the current climate characteristic may lead to underestimation of the design sea level, which results in increase in the failure risk in coastal structures. A detailed discussion on the role of the distribution changes for design water level is provided.