• 제목/요약/키워드: 시계열 통계

검색결과 558건 처리시간 0.021초

다중개입 계절형 ARIMA 모형을 이용한 KTX 수송수요 예측 (KTX passenger demand forecast with multiple intervention seasonal ARIMA models)

  • 차효영;오윤식;송지우;이태욱
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.139-148
    • /
    • 2019
  • 본 연구는 KTX 수송수요를 예측하기 위한 방법으로 다중개입 시계열 모형을 제안하였다. 구체적으로 2011년 이전의 자료로서 경부 2단계 개통 개입만 고려한 Kim과 Kim (Korean Society for Railway, 14, 470-476, 2011)의 연구를 수정 보완하기 위해 다양한 개입이 추가적으로 발생하고 있는 2011년 이후의 시계열 자료를 효과적으로 모델링하는 한편 KTX 수송수요를 정확히 예측하기 위한 방법으로 다중개입 계절형 ARIMA 모형을 도입하였다. 자료 분석을 통해 KTX 수송수요에 영향을 주었던 경부 및 호남 2단계 개통, 메르스 발병과 설추석 명절 등 다양한 개입의 효과를 효과적으로 해석하는 한편, 이를 통해 예측의 정확성을 높일 수 있음을 확인하였다.

시계열 자료에서 불변하는 인과성 탐색: 원-달러 환율 데이터에 적용 (Invariant causal prediction for time series data: Application to won dollar exchange rate data)

  • 김미정
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.837-848
    • /
    • 2021
  • 본 연구에서는 Pfister 등 (2019)에서 제시된 시계열 데이터에 대해서 시간이 지나도 불변하는 인과성(invariant causality)을 갖는 변수를 찾는 방법에 대해서 설명하고자 한다. 시계열에서 주로 이용되는 Granger causality 방법은 인과 관계를 찾기 보다는 선행한 사건과 추후에 일어나는 사건과의 연관성을 찾는 방법이며, 때로는 허위 연관성의 결과를 산출하기도 한다. Chow 검정은 고정된 모형에 대해서 특정 시점 전후의 차이를 검정하는데 이용된다. 기존 방법은 높은 설명을 갖는 모형을 찾는데 중점을 두었는데, 이러한 모형은 환경의 변화에 따라 같은 모형이 유지되지 않을 가능성이 있다. Pfister 등 (2019)에서 제시된 모형은 설명변수와 종속변수 간의 조건부 관계를 찾는데 중점을 두고 있기 때문에, 환경의 변화에도 불변하는 인과성을 찾는데 유용하게 이용될 수 있다. 특히, 거시 경제 데이터는 측정하기 어려운 많은 변수로 인해 설명력이 높은 모형을 찾는 것이 어렵기 때문에, 기존 방법을 이용하기 보다는 Pfister 등 (2019)의 모형을 적용하는 것이 의미가 있다. 본 연구에서는 Pfister 등 (2019)가 제시한 방법을 이용하여 원 달러 환율에 불변하는 인과성을 갖는 거시경제 변수를 찾고자 한다.

Detection Power when outliers are present at or near the end of time series

  • 이종선;안미혜;이재준
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.281-283
    • /
    • 2003
  • 시계열 모형을 따르는 자료의 예측(Forecasting)이나 공정조정(Process Adjustment)의 경우, 자료의 마지막 부분에 발생한 이상치(Outlier)에 의해 크게 영향 받을 수 있다. 그러나 지금까지 제안된 이상치 탐지 방법은 주로 자료의 중간 부분에 발생한 이상치를 검출하는데 효율적이라고 알려져 왔다. 본 연구에서는 자료의 마지막 부분에 발생한 이상치에 대한 기존 탐지 방법의 검출력을 모의 실험을 통해 분석하였다 또한, 이를 개선할 수 있는 방안을 제시하고, 모의 실험을 통해 기존의 검출력과 비교하였다.

  • PDF

시계열 모형과 기계학습 모형을 이용한 풍력 발전량 예측 연구 (Wind power forecasting based on time series and machine learning models)

  • 박수진;이진영;김삼용
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.723-734
    • /
    • 2021
  • 빠르게 발전하고 있는 재생에너지 중 하나인 풍력에너지는 기후변화 대응에 맞추어 개발 및 투자가 이루어지고있다. 신재생에너지 정책과 발전소 설치가 추진됨에 따라 국내 풍력 보급이 점차 확대되어 수요를 정확히 예측하기 위한 시도들이 확대되고 있다. 본 논문에서는 전남지역과 경북지역의 풍력 발전량 예측을 위하여 시계열 기법인 ARIMA, ARIMAX 모형과 기계학습 모형인 SVR, Random Forest, XGBoost 모형들을 비교 분석하였다. 모형의 예측 결과를 비교하기 위한 지표로서 mean absolute error (MAE)와 mean absolute percentage error (MAPE)를 사용하였다. 2018년 1월 1일부터 2020년 10월 24일까지의 시간별 원 데이터를 차분한 후 모형을 훈련시켜 2020년 10월 25일부터 2020년 10월 31일까지의 168시간에 대한 풍력 발전량을 예측하였다. 모형의 예측력 비교 결과, Random Forest와 XGBoost 모형이 전남지역, 경북지역 순으로 가장 우수한 성능을 보였다. 향후 연구에서는 기계학습뿐 아니라 최근 활발한 연구가 이루어지는 데이터 마이닝 기법 기반의 풍력 발전량 예측을 시도할 것이다.

공간-시계열 모형을 이용한 결측대체 방법에 대한 연구 (Imputation Method using the Space-Time Model in Sample Survey)

  • 이진희;신기일
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.499-514
    • /
    • 2007
  • 표본조사에서 항목무응답 발생 시 결측대체에 사용되는 일반적인 방법은 결측변수와 관계 있는 보조변수를 이용하는 것이다. 최근 이진희 등 (2006)은 2002년 강원지역의 농가경제 자료를 이용하여 표본조사에서 공간통계를 이용한 결측대체 (missing imputation) 방법을 비교하였으며, 자료들 사이에 지역적 상관이 존재할 때 이를 이용한 결측대체가 효율적임을 보였다. 본 논문에서는 이를 확장한 개념으로, 강원지역의 2000-2002까지의 월별 자료가 공간상관과 시계열상관이 존재함을 확인하고 이 관계를 결측대체에 이용하였다. 또한 공간상관과 시계열상관이 모두 존재할 경우 공간시계열 모형을 이용한 결측 대체 방법이 공간모형을 이용하였을 때에 비해 더 효율적임을 모의실험을 통해 확인하였다.

DCCA 방법으로 연결된 한반도의 기온 네트워크 분석 (Temperature network analysis of the Korean peninsula linking by DCCA methodology)

  • 민승식
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1445-1458
    • /
    • 2016
  • 본 논문에서는 1976년부터 2015년까지 40년 간, 59개 지역 기온 시계열을 대상으로 degrended cross-correlation analysis(DCCA) 방법을 이용한 상관 계수를 도출하였다. 4년 단위의 평균기온, 최고기온, 최저기온 시계열을 분석하여 상관계수 값이 0.9 이상이면 단위 기간 동안 두 지역의 온도 상관성이 존재하는 것으로 판단하고, 두 지역 간의 연결선을 만드는 방식으로 네트워크를 구축하였다. 이후 네트워크 이론을 바탕으로 평균 경로 길이, 결집 계수, 유사성, 모듈성 등의 값들을 도출하였다. 그 결과, 기온 네트워크는 좁은 세상 성질을 만족하고, 유사성과 모듈성이 높은 네트워크임을 알 수 있었다.

로버스트 추정법을 이용한 자기상관회귀모형에서의 특이치 검출 (Outlier Detection of Autoregressive Models Using Robust Regression Estimators)

  • 이동희;박유성;김기환
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.305-317
    • /
    • 2006
  • 시계열 자료에서의 특이치, 특히 이 가운데 가법적 특이치가 모형의 식별, 모수의 추정 및 예측과 관련된 분석 전과정을 왜곡하는 것은 잘 알려져 있다. 그러나 특이치가 다수 발생하는 경우, 특히 연속적으로 집단을 이루어 발생할 때 대부분 특이치 검출방법은 가면화효과와 수렁화효과때문에 이들을 정확히 판별하지 못한다. 본 논문에서는 p차 자기상관회귀모형에 대한 고붕괴점 회귀추정량을 이용한 양방향 로버스트 필터방법을 제안했다. 실제 사례와 모의실험을 통해 제안한 방법이 매우 정확하게 시계열 자료에 포함된 특이치들을 검출하고 있음을 확인할 수 있다.

시계열 모형과 기상변수를 활용한 태양광 발전량 예측 연구 (A study on solar energy forecasting based on time series models)

  • 이근호;손흥구;김삼용
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.139-153
    • /
    • 2018
  • 최근 정부의 친환경 정책에 따라 태양광 발전 설비가 지속적으로 증가하고 있다. 태양광 발전량은 에너지원인 태양의 특성상 계절에 따라 하루 중 발전이 이루어지는 시간이 일정하지 않다. 이러한 특성으로 인해 태양광 발전량 예측에서는 연속된 시간간격으로 수집된 자료에 적용할 수 있는 시계열 모형 적용에 어려움이 있다. 본 논문에서 제안하는 방법은 연속된 시간자료를 각 시간대 별로 분리, 재구성하여 24개의 (1시-24시) 일별 자료 형태로 예측에 활용하는 방법이다. 강원도 영암 태양광 발전소의 시간별 발전량 자료를 공공데이터포털에서 수집하여 연구하였다. 기존방법과 제안된 방법의 성능차이를 비교하기 위해 ARIMAX, 신경망(neural network model) 모형을 동일한 모형과 변수를 가지는 환경에서 성능차이를 확인하였다.

시계열 계속 표본조사에서 불균등확률 추출법 연구 (A study on unequal probability sampling over two successive occasions in time series)

  • 박홍래;이계오
    • 응용통계연구
    • /
    • 제6권1호
    • /
    • pp.145-162
    • /
    • 1993
  • 본 논문에서는 반복적 계속 표본조사에서 일부의 표본을 교체하는 2회 계속조사의 표본 추 출법들을 요약하고 앞 조사시기의 관찰값을 확률측도로 이용한 RHC(Rao-Hartley-Cochran) 유형의 불균등 확률추출법을 제안하였다. 제안된 추출법과 기존의 확률추출법의 비교를 위 하여 둘째 조사시기의 모평균 추정량과 그의 분산을 유도하였으며, 제안된 추출법의 상대 효율은 이론적인 측면과 수치적 시뮬레이션 방법으로 비교 분석되었다. 시뮬레이션 비교를 위하여 한 특별한 시계열 모형을 가정하고 이를 사용하여 인위적인 모집단을 생성하였으며 이 모집단에서 각 추출법에 해당되는 표본을 컴퓨터로 추출하여 각각의 추정치를 계산하여 비교한 결과에서 RHC 유형의 새로 제안된 추출법의 분산과 편차가 일반적으로 적음을 보 였다.

  • PDF

금융시계열 분석을 위한 다변량-GARCH 모형에서 비대칭-CCC의 도입 및 응용 (Asymmetric CCC Modelling in Multivariate-GARCH with Illustrations of Multivariate Financial Data)

  • 박란희;최문선;황선
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.821-831
    • /
    • 2011
  • 다변량-GARCH 분야에서 비대칭모형에 대한 연구는 상대적으로 미진하다 (McAleer 등, 2009). 본 논문에서는 다변량-GARCH 시계열에서 비대칭 모형과 상수 조건부 상관모형(CCC)을 도입하여 모델링하는 방법론에 대해 연구하고 있다. 다변량 비대칭 변동성 모형 적합 방법을 실용적으로 소개하고 있으며 이를 이용하여 국내 다변량 시계열 분석을 상세히 예시하였다.