• 제목/요약/키워드: 시계열 예측분석

검색결과 732건 처리시간 0.028초

한국프로야구 기록들의 장기추세 (Long term trends in the Korean professional baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.1-10
    • /
    • 2015
  • 본 연구에서는 한국프로야구 변천사를 야구 통계량들을 중심으로 살펴보았다. 분석방법으로는 1982년부터 2013년까지의 한국프로야구 데이터를 이용하여 야구 통계량들의 시계열 그래프와 상관계수를 이용하였다. 그 결과 유의수준 1%에서 연도와 유의한 양의 상관관계를 보인 통계량은 2루타, 타점, 4구, 삼진, 병살타, 사구, 출루율, OPS, 방어율, 폭투, WHIP이고, 유의한 음의 상관관계를 보인 통계량은 3루타, 도루자, 실책, 완투, 완봉, 보크였다. 상관계수가 유의한 야구통계량의 예측을 위해서는 Box-Jenkins의 ARIMA 모형을 이용하였다. 결론적으로 세월의 흐름과 가장 상관이 큰 것은 완투 횟수의 감소이며, 그 다음으로 삼진 개수의 증가를 들 수 있었다.

광업 데이터의 시계열 분석을 통해 실리카 농도를 예측하기 위한 머신러닝 모델 (A Machine Learning Model for Predicting Silica Concentrations through Time Series Analysis of Mining Data)

  • 이승훈;윤연아;정진형;심현수;장태우;김용수
    • 품질경영학회지
    • /
    • 제48권3호
    • /
    • pp.511-520
    • /
    • 2020
  • Purpose: The purpose of this study was to devise an accurate machine learning model for predicting silica concentrations following the addition of impurities, through time series analysis of mining data. Methods: The mining data were preprocessed and subjected to time series analysis using the machine learning model. Through correlation analysis, valid variables were selected and meaningless variables were excluded. To reflect changes over time, dependent variables at baseline were treated as independent variables at later time points. The relationship between independent variables and the dependent variable after n point was subjected to Pearson correlation analysis. Results: The correlation (R2) was strongest after 3 hours, which was adopted as a dependent variable. According to root mean square error (RMSE) data, the proposed method was superior to the other machine learning methods. The XGboost algorithm showed the best predictive performance. Conclusion: This study is important given the current lack of machine learning studies pertaining to the domestic mining industry. In addition, using time series analysis in mining data will show further improvement. Before establishing a predictive model for the proposed method, predictions should be made using data with time series characteristics. After doing this work, it should also improve prediction accuracy in other domains.

엘만 순환 신경망을 사용한 전력 에너지 시계열의 예측 및 분석 (The Prediction and Analysis of the Power Energy Time Series by Using the Elman Recurrent Neural Network)

  • 이창용;김진호
    • 산업경영시스템학회지
    • /
    • 제41권1호
    • /
    • pp.84-93
    • /
    • 2018
  • In this paper, we propose an Elman recurrent neural network to predict and analyze a time series of power energy consumption. To this end, we consider the volatility of the time series and apply the sample variance and the detrended fluctuation analyses to the volatilities. We demonstrate that there exists a correlation in the time series of the volatilities, which suggests that the power consumption time series contain a non-negligible amount of the non-linear correlation. Based on this finding, we adopt the Elman recurrent neural network as the model for the prediction of the power consumption. As the simplest form of the recurrent network, the Elman network is designed to learn sequential or time-varying pattern and could predict learned series of values. The Elman network has a layer of "context units" in addition to a standard feedforward network. By adjusting two parameters in the model and performing the cross validation, we demonstrated that the proposed model predicts the power consumption with the relative errors and the average errors in the range of 2%~5% and 3kWh~8kWh, respectively. To further confirm the experimental results, we performed two types of the cross validations designed for the time series data. We also support the validity of the model by analyzing the multi-step forecasting. We found that the prediction errors tend to be saturated although they increase as the prediction time step increases. The results of this study can be used to the energy management system in terms of the effective control of the cross usage of the electric and the gas energies.

확률적 변동성을 가진 은닉마르코프 모형을 통한 비트코인 가격의 변동성 추정 (Hidden Markov model with stochastic volatility for estimating bitcoin price volatility)

  • 강태현;황범석
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.85-100
    • /
    • 2023
  • Stochastic volatility (SV) 모형은 시변 변동성을 모델링하는 주요한 수단 중 하나이며, 특히 금융시장 변동성의 추정 및 예측, 옵션의 가격 결정 등의 분야에서 활발하게 사용되고 있다. 본 논문은 SV 모형을 활용하여 비트코인 시장의 시변 변동성을 모델링하고자 한다. 시장의 변동성은 국면 전환의 특성을 갖고 있다고 알려져 있으며, 시장의 변동 국면을 나누기 위해 시계열의 패턴을 인식하는 작업에 유용한 hidden Markov model(HMM)을 결합하여 사용하고자 한다. 본 연구는 암호화폐 거래 사이트 업비트의 비트코인 데이터를 활용하여 비트코인의 변동성 모형을 추정하였으며 SV 모형의 성능을 높이기 위하여 시장의 변동 국면을 나누어 분석을 진행하였다. MCMC 기법이 SV 모델의 모수를 추정하는 데 사용되며 MAPE, MSE 등의 평가 기준을 통하여 모델의 성능을 확인하고자 한다.

센서를 활용한 도심지 측구 저류조 운영 시스템 모델 (Urban Gutter Reservoir Operating System Model Using Sensors)

  • 이운성;육연수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.399-399
    • /
    • 2022
  • 최근 국지성 호우 등 홍수방어 시설의 설계빈도를 초과하는 강우 발생으로 홍수피해가 증가하고 있다. 그 중 도시지역의 내수침수 피해는 전체 피해액의 50%를 넘는다. 그러나 우수관거의 노후화 및 통수능 부족으로 우수의 즉각적인 배출이 이루어지지 않아 침수피해가 증가하고 있다. 침수피해의 주요 원인 중 저지대 지역 및 우수관거의 통수능력 부족이 침수피해의 가장 큰 원인을 차지한다. 따라서 도심지의 경우 내수침수로 인한 피해가 증가하고 있는 점을 감안하면 배수관거와 연계한 저류시스템 구축으로 침수 빈발 지역의 치수 능력 향상을 통하여 경제적 피해를 저감시킬 수 있다. 저류시스템은 현장 노면수 저류를 위한 측구 저류조와 저류조 운영 시스템을 의미하며, 저류조 운영 시스템 모델에 대한 연구를 수행하였다. 측구 저류조 운영 시스템 구축을 위해서 현장 센싱(Sensing)데이터와 연계할 수 있는 정보체계 및 운영 시스템 모델이 필요하다. 이에 센서를 활용한 도심지 측구 저류조 운영 시스템 모델을 제시한다. 먼저 센서의 구성은 측구 저류조 내의 협소한 공간과 전원공급, 방진·방수 문제를 해결할 수 있도록 구성되어야 하며, 무전원 근거리 이동통신기술(RFID)을 적용하여 측구 저류조 운영 시스템 수집서버와 통신하여 센싱 데이터를 저장한다. 데이터는 근거리 RFID 리더기가 측구 저류조로부터 센싱 정보를 수신하여 통신모듈에 수신한 저류조 개폐도어 열림과 닫힘 시그널(signal), RFID의 고유 ID 등을 전달 받아 운영 시스템 내의 RFID 이력 DB(Database)에 기록한다. 기록된 정보는 각각 RFID 일련번호, 기록 시간, 동적센서 시그널 값 등이 저장되어 각각의 측구 저류조의 상태를 확인할 수 있어야 한다. 저류량 산정을 위해서 GIS기반의 하수도 시설물 속성 데이터를 포함하는 운영 시스템을 구성해야 한다. 운영 시스템은 수집된 센서정보를 시계열 단위로 분석하고 위치정보 기준으로 측구 저류조 내의 총 저류량 산출에 필요한 기초정보를 제공하며 결과를 표출한다. 따라서 하수도 시설물의 속성정보를 포함하여 측구 저류조 및 센서의 속성정보 정의가 필요하며, 공간정보 파일(Shape File)을 적용하여 GIS 운영 시스템을 구축하여야 한다. 운영 시스템은 저류조 만관상태와 총 저류량을 산출하여 침수위험 알림을 제공할 수 있으며, 예상 강우에 따른 도심지 피해를 역으로 예측하여 강우사상 빈도에 따른 측구 저류조 체적을 결정할 수 있다.

  • PDF

외환거래에서 의사결정나무와 그래디언트 부스팅을 이용한 수익 모형 연구 (The study of foreign exchange trading revenue model using decision tree and gradient boosting)

  • 정지현;민대기
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.161-170
    • /
    • 2013
  • 외환차액거래는 국제외환 시장에서 외국의 통화를 거래하는 것으로 현물시장에서 이뤄지는 장외 통화선물 거래를 의미한다. 외환차액거래 데이터를 이용하여 의사결정나무와 그래디언트 부스팅 방법을 이용한 수익모델을 비교하였다. 금융시장의 예측을 위해 사용되고 있는 시계열분석과 같은 방법들은 장기간의 예측 모형을 설명하기에 장점이 있지만, 파동이많고 짧은 시간에 가격이 급변하는 외환시장을 예측하기에는 한계가 있다. 따라서 본 논문에서는 단기간 즉 1, 3, 5분에서 외환시장의 수익구조를 의사결정나무와 앙상블기법의 하나인 그래디언트 부스팅으로 비교하여 매수, 매도거래 시 수익을 만들기 위한 규칙을 연구하였다.

백두산 천지 붕괴 가상 시나리오 별 천지못 유출수의 피해영향범위 예측 (Prediction of the Area Inundated by Lake Effluent According to Hypothetical Collapse Scenarios of Cheonji Ground at Mt. Baekdu)

  • 서장원;이희욱;김성민;박형동
    • 지질공학
    • /
    • 제23권4호
    • /
    • pp.409-425
    • /
    • 2013
  • 본 연구에서는 백두산 분화 전 지반 균열 및 거동에 의한 천지못 지반 붕괴 시나리오 별 천지못 유출수의 이동경로와 홍수 피해영향범위를 시계열로 예측하였다. 지형 지표 기상 환경 자료를 기반으로 다방향 흐름기법, 지표토양에 의한 흡수율과 초기저장량, 화구 및 분지 지형의 부피(저장공간)를 함께 고려할 수 있는 지리정보시스템 기반의 수문분석 알고리즘을 개발하였다. 백두산 지역의 화산군 분포와 지형적 특성을 고려하여 4가지 경우의 천지못 지반 붕괴 지점을 가상으로 선정하고, 개발된 알고리즘을 적용하여 천지못 유출수의 확산패턴과 시간 변화에 따른 피해영향범위를 산정하였다. 시나리오 1과 2(천지못 전체/남쪽 경계 지반 붕괴)의 경우 천지못 유출 약 3시간 경과 후부터 중국쪽 마을에 홍수피해가 발생한 반면 북한 영토는 천지못 남동쪽에 위치한 산봉우리의 지형적 특성으로 인해 거의 영향을 받지 않는 것으로 나타났다. 반면 시나리오 2의 조건에 천지못 남동쪽 산봉우리를 붕괴시킨 시나리오 3과 4의 경우에는 천지못 유출 약 3시간 경과 후부터 중국뿐만 아니라 북한 영토쪽 마을에도 1,500만톤 이상의 홍수 피해를 발생시키는 것으로 분석되었다.

시나리오 중립 접근법을 활용한 기후변화 시나리오에 따른 보령시 가뭄의 수문학적 위험도 평가 (Evaluation of hydrologic risk of drought in Boryeong according to climate change scenarios using scenario-neutral approach)

  • 김지영;한영만;서승범;김대하;김태웅
    • 한국수자원학회논문집
    • /
    • 제57권3호
    • /
    • pp.225-236
    • /
    • 2024
  • 기후위기에 선제적으로 대비하기 위해서는 기후변화에 따른 영향을 예측 및 분석하고, 이를 바탕으로 기후위기 적응과 관련한 정책과 전략을 수립할 필요가 있다. 이를 위해 기후변화를 고려해야 하나, 기존 연구 방법인 시나리오 리드 접근법에서 연구자들은 기후변화 대표 시나리오를 선택하여 활용하기 때문에, 예측된 결과의 불확실성이 크고 신뢰도가 낮다. 이러한 연구 결과는 기후변화 관련된 수자원 정책 및 설계기준에 반영되는 데 한계가 있다. 따라서 기후변화로 인해 발생가능한 변화 범위를 고려하는 시나리오 중립 접근법을 활용할 필요가 있다. 본 연구에서는 보령시를 대상으로 총 343개의 기후스트레스 시계열을 생성한 뒤 이변량 가뭄빈도분석을 통해 재현기간을 산정하고 가뭄에 대한 수문학적 위험도를 산정하였다. 분석결과, SSP1-2.6 18개 및 SSP5-8.5에 18개에 대해 최대 재현기간의 가뭄이 20년 내에 발생할 수문학적 위험도는 0.15±0.025, 50년 내에 발생할 수문학적 위험도는 0.3125±0.0625 사이로 나타났다. 따라서 보령시에서는 해당 범위의 수문학적 위험도를 고려하여 가뭄 정책 및 대책 수립이 필요하다.

시계열 국가산림자원조사 자료를 이용한 전국 산림의 임상 변화 특성 분석과 미래 전망 (Future Prospects of Forest Type Change Determined from National Forest Inventory Time-series Data)

  • 김은숙;정병헌;배재수;임종환
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.461-472
    • /
    • 2022
  • 우리나라 산림의 임상은 자연적·인위적 요인에 의해 지속적으로 변화하고 있다. 임상(침엽수림, 활엽수림, 혼효림)면적의 비율은 국가 산림자원 특성 파악에 중요하게 활용되는 정보이기 때문에 임상 변화에 대한 정확한 이해와 전망이 필요하다. 따라서 본 연구에서는 국가산림자원조사 시계열 자료를 이용하여 임상 변화 발생 특성을 이해하고 이를 기반으로 미래 임상 변화 예측치를 도출하는 것을 목표로 하였다. 제5차, 제7차 국가산림자원조사 자료의 10년 기간 임상 변화정보와 임상 변화에 영향을 미칠 수 있는 변수(기후, 지형, 임분, 교란 등)를 이용하여 임상 변화 특성을 분석한 결과, 우리나라 산림은 침엽수림이 감소하고 혼효림과 활엽수림이 증가하는 방향으로 변화하고 있는 것으로 확인되었다. 침엽수림에서 혼효림으로, 혼효림에서 활엽수림으로 변화되는 지역은 주로 지형적으로 습윤하고 강수량이 많아서 수분관련 생육환경이 양호하며 주변에 활엽수림이 많은 지역이었다. 또한 기온이 높은 지역, 임분의 임령과 밀도가 낮은 지역, 주변 지역에 비산림이 많은 지역 등 교란 가능성이 높은 지역에서 변화가 많이 발생했다. 이러한 임상의 변화 특성을 반영하여 기계학습 모형(SVM)을 구축하고 기후변화시나리오(RCP 8.5)를 이용하여 미래의 임상 변화를 전망한 결과, 2015년에서 2055년까지 40년 동안 침엽수림은 38.1%에서 28.5%로 감소, 활엽수림은 34.2%에서 38.8%로 증가, 혼효림은 27.7%에서 32.7%로 증가할 것으로 예측되었다. 본 미래 임상분포 변화 정보는 향후 산림관리 전략 수립의 기초자료로 활용될 수 있다.

시계열 국가산림자원조사 자료 기반 자연적 임분동태 변화에 따른 소나무림의 감소 특성 평가 (Analysis of Changes in Pine Forests According to Natural Forest Dynamics Using Time-series NFI Data)

  • 김은숙;정종빈;박신영
    • 한국산림과학회지
    • /
    • 제113권1호
    • /
    • pp.40-50
    • /
    • 2024
  • 소나무림 산림생태계의 자연적 임분 동태 변화 과정에 따라 참나무류 등 활엽수와의 경쟁에 밀려 분포 면적이 지속적으로 감소하고 있다. 소나무림의 자연적 쇠퇴가 가시화되면서 소나무가 우리 국민들에게 제공해왔던 다양한 가치들이 함께 소멸될 위험에 처해 있으며, 지역별 소나무 쇠퇴 진행 상황에 따라 미래 산림관리 방향을 마련하는 것이 중요한 과제로 제기되고 있다. 따라서, 본 연구는 자연적 임분 동태 변화에 따른 소나무림 변화 특성을 이해하고, 미래 소나무림의 지역별 변화를 전망하는 것을 목적으로 하였다. 이를 위해, 시계열 국가산림자원조사 자료 기반 전국 소나무림 변화 정보를 이용하여 소나무림의 변화 경향을 분석하고 변화에 영향을 줄 수 있는 변수(지형, 임분, 교란, 기후)들을 평가하였다. 또한 유효변수들을 이용하여 모형을 구축하고 미래의 소나무림의 미래 변화 모습을 예측했다. 그 결과, 과거 10년 동안 전국 산림에서 소나무류의 중요치는 전반적으로 감소하였으며 소나무류가 대표수종인 표본점이 10년 후에도 대표수종이 유지된 비율은 75%, 나머지 25%는 혼효림으로 전환된 것으로 나타났다. 이러한 변화는 수분 조건이 좋으며 임분 내·외부의 교란 요인이 많은 지역에서 발생한 것으로 분석되었다. 향후 10년 후의 소나무림 변화를 전망한 결과, 전국적으로 현재 기준 소나무림 순림의 약 14.2%가 자연적인 임분 동태 변화에 따라 혼효림으로 전환될 가능성이 높을 것으로 추정되었다. 지역적으로 보면 소나무림 변화율은 제주와 경기가 42.8%, 26.9%로 가장 높았고 경북과 강원이 8.8%, 13.8%로 가장 낮았다. 경기, 충청, 전남 지역 등 한반도 서쪽 지역에 있는 소나무림의 감소 위험이 높을 것으로 예측되었다. 본 연구에서 제시한 자연적 임분동태 변화에 따른 소나무림 변화 민감도 평가 결과는 전국 소나무림의 종합적 관리 방안을 마련하는데 활용할 수 있다.