• 제목/요약/키워드: ARFIMA models

검색결과 2건 처리시간 0.015초

Forecasting daily PM10 concentrations in Seoul using various data mining techniques

  • Choi, Ji-Eun;Lee, Hyesun;Song, Jongwoo
    • Communications for Statistical Applications and Methods
    • /
    • 제25권2호
    • /
    • pp.199-215
    • /
    • 2018
  • Interest in $PM_{10}$ concentrations have increased greatly in Korea due to recent increases in air pollution levels. Therefore, we consider a forecasting model for next day $PM_{10}$ concentration based on the principal elements of air pollution, weather information and Beijing $PM_{2.5}$. If we can forecast the next day $PM_{10}$ concentration level accurately, we believe that this forecasting can be useful for policy makers and public. This paper is intended to help forecast a daily mean $PM_{10}$, a daily max $PM_{10}$ and four stages of $PM_{10}$ provided by the Ministry of Environment using various data mining techniques. We use seven models to forecast the daily $PM_{10}$, which include five regression models (linear regression, Randomforest, gradient boosting, support vector machine, neural network), and two time series models (ARIMA, ARFIMA). As a result, the linear regression model performs the best in the $PM_{10}$ concentration forecast and the linear regression and Randomforest model performs the best in the $PM_{10}$ class forecast. The results also indicate that the $PM_{10}$ in Seoul is influenced by Beijing $PM_{2.5}$ and air pollution from power stations in the west coast.

장기억 과정에서 빠른 베이지안 변화점검출 (A Fast Bayesian Detection of Change Points Long-Memory Processes)

  • 김주원;조신섭;여인권
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.735-744
    • /
    • 2009
  • 이 논문에서는 장기억 과정에서의 변화점을 빨리 검출하는 베이지안 추론방법에 대해 알아본다. 장기억 과정에서의 베이지안 추정은 장기억 모수값에 따라 전체 자료에 대한 부분차분을 계산해야 하기 때문에 수행시간이 많이 걸린다는 문제가 있다. 이 논문에서는 이러한 문제를 해결하고자 장기억 모수공간을 그룹화하여 순서형으로 범주화시킨 후 설명력이 가장 높은 범주의 대표값을 선택하게 하였다. 이 방법은 초기단계에서 범주의 대표값에 대해 한번씩만 부분차분을 계산하면 되기 때문에, 매번 계산해야 하는 추정하는 방법보다, 특히 시계열자료의 수가 많은 경우, 상대적으로 빠른 베인지안 추론이 가능하다. 또한 장기억 모수공간이 (0,0.5) 이기 때문에 모수공간을 적절하게 그룹화한다면 장기억 모수를 선택하는 것이 모수를 추정하는 것에 비해 큰 차이가 없다. 이 논문에서는 나일강 수위자료 실증분석을 통해 제안된 방법의 타당성을 확인해본다.