• Title/Summary/Keyword: 시계열 통계

Search Result 558, Processing Time 0.034 seconds

Data Flow Prediction Scheme using ARIMA Model (ARIMA 모델을 이용한 데이터 흐름 예측 기법)

  • Kim, Dong-Hyun;Kim, Min-Woo;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.141-142
    • /
    • 2018
  • 기존 데이터의 패턴 예측에는 통계를 기반으로 한 수학적 모델이 주로 사용되었으나 새로운 데이터에 대한 피드백이 부족하기 때문에 장기간의 데이터 예측에 한계가 있다. 또한 데이터의 특성이 다양하고 복잡한 경우에는 수학적 모델의 결합 및 계산과정이 어려워진다. 따라서 본 논문에서는 데이터의 학습 및 예측에 기존 정적 모델이 아닌 기계학습 중 시계열 데이터 분석 (Time Series Analysis) 을 기반으로 연구를 진행하였다. 기계학습은 복잡한 특성을 가진 데이터를 학습하여 미래의 데이터 값을 예측하거나 분류하는데 있어서 정확도 및 처리시간 측면에서의 성능을 향상시킬 수 있다.

  • PDF

정박 중 준해양사고 원인에 대한 빅데이터 분석 연구

  • No, Beom-Seok;Kim, Tae-Hun;Gang, Seok-Yong
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.05a
    • /
    • pp.144-146
    • /
    • 2018
  • 준해상사고를 줄이기 위하여 준해양사고 등을 분석하여 사고 예방에 활용하였다. 하지만 준해양사고 건수가 많은 대신 주내용이 정성적이기 때문에 다양한 정량적 데이터로 분석하기에는 현실적 어려움이 있었다. 이러 장단점을 고려하여 준해양사고에 대해서 그동안 단순한 내용 검토 방식에서 통계적 분석과 이를 통한 객관적 결과 토출이 가능한 빅데이터 기법를 적용한 연구가 필요하다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 이 데이터를 기반으로 1차로 텍스트마이닝 분석을 통해 정박 중 준해양사고 발생 원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양 사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.

  • PDF

Time-series big data analytics software on IoT streaming data (빅데이터 기반 대용량 시계열 에너지 데이터 처리 시스템)

  • Kang, Jeonghoon;Yoo, June-Jae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.52-53
    • /
    • 2018
  • 본 논문은 에너지 빅데이터를 분석하기 위해 대용량의 시계열 데이터를 처리하는 시스템의 설계, 구축 방법을 제시한다. 이미 사용 중인 건물이나 공장의 에너지 효율화를 위해서 정부는 효율자원 시장 지원 사업을 수행하고 있다, 에너지 소비 설비에 따라 고효율 자원으로 변경 설치하는 데 필요한 자금의 일부를 지원하고 있다. 정부지원으로 고효율 설비로 변경함에 따라 실증 사이트에서는 측정 데이터를 수집하여, 효율화 정도를 파악하기 위한 에너지 데이터 분석 시스템을 구축하여 운영하였다. 해당 측정 정보는 IoT 전력량계를 통해 수집되며, 수집된 데이터는 클라우드 시스템에서 다양한 머신러닝 알고리즘에 적용되어, 에너지 소비 효율 평가에 필요한 성능 지표를 연산한다. 구현된 진단 시스템은 기축 건물의 에너지 효율향상 상황을 분석하는데 기여할 수 있다. 빅데이터 기반의 에너지 분석 기능을 사용하여 에너지 고효율 장비의 운영시간, 부하율 등의 효율성과 성능통계를 연산할 수 있다.

Bayes Inference for the Spatial Time Series Model (공간시계열모형에 대한 베이즈 추론)

  • Lee, Sung-Duck;Kim, In-Kyu;Kim, Duk-Ki;Chung, Ae-Ran
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.1
    • /
    • pp.31-40
    • /
    • 2009
  • Spatial time series data can be viewed either as a set of time series collected simultaneously at a number of spatial locations. In this paper, We estimate the parameters of spatial time autoregressive moving average (SIARMA) process by method of Gibbs sampling. Finally, We apply this method to a set of U.S. Mumps data over a 12 states region.

Autocorrelation in Statistical Analyses of Fisheries Time Series Data (수산 관련 시계열 자료를 이용한 통계학적 분석에서의 자기상관에 대한 고찰)

  • Park Young Cheol;Hiyama Yoshiaki
    • Korean Journal of Fisheries and Aquatic Sciences
    • /
    • v.35 no.3
    • /
    • pp.216-222
    • /
    • 2002
  • Autocorrelation in time series data can affect statistical inference in correlation or regression analyses. To improve a regression model from which the residuals are autocorrelated, Yule-Walker method, nonlinear least squares estimation, maximum likelihood method and 'prewhitening' method have been used to estimate the parameters in a regression equation. This study reviewed on the estimation methods of preventing spurious correlation in the presence of autocorrelation and applied the former three methods, Yule-Walker, nonlinear least squares and maximum likelihood method, to a 20-year real data set. Monte carlo simulation was used to compare the three parameter estimation methods. However, the simulation results showed that the mean squared error distributions from the three methods simulated do not differ significantly.

Joint model of longitudinal data with informative observation time and competing risk (결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형)

  • Kim, Yang-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.1
    • /
    • pp.113-122
    • /
    • 2016
  • Longitudinal data often occur in prospective follow-up studies. Joint model for longitudinal data and failure time has been applied on several works. In this paper, we extend it to the case where longitudinal data involve informative observation time process as well as competing risks survival times. We use a likelihood approach and derive an EM algorithm to obtain maximum likelihood estimate of parameters. A suggested joint model allows us to make inferences for three components: longitudinal outcome, observation time process and competing risk failure time. In addition, we can test the association among these components. In this paper, liver cirrhosis patients' data is analyzed. The relationship between prothrombin times measured at irregular visiting times and drop outs is investigated with a joint model.

Squared Log-return and TGARCH Model : Asymmetric Volatility in Domestic Time Series (제곱수익률 그래프와 TGARCH 모형을 이용한 비대칭 변동성 분석)

  • Park, J.A.;Song, Y.J.;Baek, J.S.;Hwang, S.Y.;Choi, M.S.
    • The Korean Journal of Applied Statistics
    • /
    • v.20 no.3
    • /
    • pp.487-497
    • /
    • 2007
  • As is pointed out by Gourieroux (1997), the volatility effects in financial time series vary according to the signs of the return rates and therefore asymmetric Threshold-GARCH (TGARCH, henceforth) processes are natural extensions of the standard GARCH toward asymmetric volatility modeling. For preliminary detection of asymmetry in volatility, we suggest graphs of squared-log-returns for various financial time series including KOSPI, KOSDAQ and won-Euro exchange rate. Next, asymmetric TGARCH(1,1) model fits are provided in comparisons with standard GARCH(1.1) models.

Wild bootstrap Ljung-Box test for autocorrelation in vector autoregressive and error correction models (벡터자기회귀모형과 오차수정모형의 자기상관성을 위한 와일드 붓스트랩 Ljung-Box 검정)

  • Lee, Myeongwoo;Lee, Taewook
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.1
    • /
    • pp.61-73
    • /
    • 2016
  • We consider the wild bootstrap Ljung-Box (LB) test for autocorrelation in residuals of fitted multivariate time series models. The asymptotic chi-square distribution under the IID assumption is traditionally used for the LB test; however, size distortion tends to occur in the usage of the LB test, due to the conditional heteroskedasticity of financial time series. In order to overcome such defects, we propose the wild bootstrap LB test for autocorrelation in residuals of fitted vector autoregressive and error correction models. The simulation study and real data analysis are conducted for finite sample performance.

Improved Trend Estimation of Non-monotonic Time Series Through Increased Homogeneity in Direction of Time-variation (시변동의 동질성 증가에 의한 비단조적 시계열자료의 경향성 탐지력 향상)

  • Oh, Kyoung-Doo;Park, Soo-Yun;Lee, Soon-Cheol;Jun, Byong-Ho;Ahn, Won-Sik
    • Journal of Korea Water Resources Association
    • /
    • v.38 no.8 s.157
    • /
    • pp.617-629
    • /
    • 2005
  • In this paper, a hypothesis is tested that division of non-monotonic time series into monotonic parts will improve the estimation of trends through increased homogeneity in direction of time-variation using LOWESS smoothing and seasonal Kendall test. From the trend analysis of generated time series and water temperature, discharge, air temperature and solar radiation of Lake Daechung, it is shown that the hypothesis is supported by improved estimation of trends and slopes. Also, characteristics in homogeneity variation of seasonal changes seems to be more clearly manifested as homogeneity in direction of time-variation is increased. And this will help understand the effects of human intervention on natural processes and seems to warrant more in-depth study on this subject. The proposed method can be used for trend analysis to detect monotonic trends and it is expected to improve understanding of long-term changes in natural environment.

EXCEL을 이용한 통계교육용 통계소프트웨어의 개발

  • Seong, Byeong-Chan;Song, Dae-Geon;Jo, Sin-Seop
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.79-82
    • /
    • 2004
  • 본 발표에서는 1998년 서울대학교 통계학과에서 개발한 KESS(Korean Educational Statistical System; http://stats.snu.ac.kr/time)의 추가로 개발된 내용을 소개하기로 한다 (조신섭 외, 1999). 추가로 개발된 모듈(module)들은 통계교육에서 필요로 하는 분석법들 중에서 회귀분석, 시계열분석과 연관된 내용들이다. 기존의 여러 가지 통계패키지와 비교해 보아 효율적인 통계교육을 위한 필수적인 옵션 및 분석 결과를 제공하도록 하였다.

  • PDF