• Title/Summary/Keyword: 시계열 통계

Search Result 564, Processing Time 0.031 seconds

Pattern Classification Model Design and Performance Comparison for Data Mining of Time Series Data (시계열 자료의 데이터마이닝을 위한 패턴분류 모델설계 및 성능비교)

  • Lee, Soo-Yong;Lee, Kyoung-Joung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.21 no.6
    • /
    • pp.730-736
    • /
    • 2011
  • In this paper, we designed the models for pattern classification which can reflect the latest trend in time series. It has been shown that fusion models based on statistical and AI methods are superior to traditional ones for the pattern classification model supporting decision making. Especially, the hit rates of pattern classification models combined with fuzzy theory are relatively increased. The statistical SVM models combined with fuzzy membership function, or the models combining neural network and FCM has shown good performance. BPN, PNN, FNN, FCM, SVM, FSVM, Decision Tree, Time Series Analysis, and Regression Analysis were used for pattern classification models in the experiments of this paper. The economical indices DB with time series properties of the financial market(Korea, KOSPI200 DB) and the electrocardiogram DB of arrhythmia patients in hospital emergencies(USA, MIT-BIH DB) were used for data base.

Fishing Boat Rolling Movement of Time Series Prediction based on Deep Network Model (심층 네트워크 모델에 기반한 어선 횡동요 시계열 예측)

  • Donggyun Kim;Nam-Kyun Im
    • Journal of Navigation and Port Research
    • /
    • v.47 no.6
    • /
    • pp.376-385
    • /
    • 2023
  • Fishing boat capsizing accidents account for more than half of all capsize accidents. These can occur for a variety of reasons, including inexperienced operation, bad weather, and poor maintenance. Due to the size and influence of the industry, technological complexity, and regional diversity, fishing ships are relatively under-researched compared to commercial ships. This study aimed to predict the rolling motion time series of fishing boats using an image-based deep learning model. Image-based deep learning can achieve high performance by learning various patterns in a time series. Three image-based deep learning models were used for this purpose: Xception, ResNet50, and CRNN. Xception and ResNet50 are composed of 177 and 184 layers, respectively, while CRNN is composed of 22 relatively thin layers. The experimental results showed that the Xception deep learning model recorded the lowest Symmetric mean absolute percentage error(sMAPE) of 0.04291 and Root Mean Squared Error(RMSE) of 0.0198. ResNet50 and CRNN recorded an RMSE of 0.0217 and 0.022, respectively. This confirms that the models with relatively deeper layers had higher accuracy.

Improving prediction performance of network traffic using dense sampling technique (밀집 샘플링 기법을 이용한 네트워크 트래픽 예측 성능 향상)

  • Jin-Seon Lee;Il-Seok Oh
    • Smart Media Journal
    • /
    • v.13 no.6
    • /
    • pp.24-34
    • /
    • 2024
  • If the future can be predicted from network traffic data, which is a time series, it can achieve effects such as efficient resource allocation, prevention of malicious attacks, and energy saving. Many models based on statistical and deep learning techniques have been proposed, and most of these studies have focused on improving model structures and learning algorithms. Another approach to improving the prediction performance of the model is to obtain a good-quality data. With the aim of obtaining a good-quality data, this paper applies a dense sampling technique that augments time series data to the application of network traffic prediction and analyzes the performance improvement. As a dataset, UNSW-NB15, which is widely used for network traffic analysis, is used. Performance is analyzed using RMSE, MAE, and MAPE. To increase the objectivity of performance measurement, experiment is performed independently 10 times and the performance of existing sparse sampling and dense sampling is compared as a box plot. As a result of comparing the performance by changing the window size and the horizon factor, dense sampling consistently showed a better performance.

The methods of forecasting for the number of student based on promotion proportion (학년진급률에 따른 학생수 예측방법)

  • Kim, Jong-Tae
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.5
    • /
    • pp.857-867
    • /
    • 2009
  • The purpose of this paper is to suggest the methods of forecasting for the number of the elementary, middle and high-school student based on the proportion of promotion until 2026 year. The suggested methods are the proportion of promotion, mov baseverage, Holt-W bters model, SARIMA, regression fit. As the result, the abilities of forecasting by the method of moving average are better than those of other methods.

  • PDF

Land Use Analysis of Road Circumstance using Remote Sensing and GIS (RS와 GIS를 이용한 도로주변의 토지이용분석)

  • Choi, Seok-Keun;Hwang, Eui-Jin;Park, Kyeong-Sik
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.25 no.2
    • /
    • pp.133-140
    • /
    • 2007
  • In this study we did the monitor the change of a urban land coverage to forecast and to deal with various city problems according to urban development. The amount of change of a land coverage used the landsat satellite image and was calculated by analyzing the situation and the distribution aspect of land cover of the road circumstance by time series. We interpreted two images which are taken picture different time and calculated the amount of the area change through integration of the spatial analysis technique of remote sensing and GIS for this study. We could create the development model of the urban area by continuous analysis of satellite and geographic data.

Short-term Reactive Power Load Forecasting Using Multiple Time-Series Model (다중 시계열 모델을 이용한 단기 부하 무효전력 예측)

  • Lee, Hyo-Sang;Cho, Jong-Man;Park, Woo-Hyun;Kim, Jin-O
    • Journal of the Korean Institute of Illuminating and Electrical Installation Engineers
    • /
    • v.18 no.5
    • /
    • pp.105-111
    • /
    • 2004
  • This paper shows that active and reactive power load have significant positive relationship and there exist two types of relationship between them using Test Statistics. In investigating the cross plots at every hour, we found out that from 0 to 8 hours, there relationships are linear, while from 9 to 23 hours, they are two piece-wise linear. Also, reactive power loads was estimated and forecasted using active power load as the explanary variable with OLS (Ordinary Least Squares) regression methods. MAPE (Mean Absolute Percentage Error) for each model is calculated for one-hour ahead forecasting.

A stochastic rainfall generation model that accurately reproduces the various statistical properties at the timescales from 5 minutes through decades, making it suitable for complex disaster simulations (5분에서 수십년 사이의 모든 타임스케일에서 강수의 다양한 통계적 특성을 정확히 재현하여 복합재난 모의에 적합한 추계학적 강수생성모형)

  • Dongkyun Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.117-117
    • /
    • 2023
  • 도시 홍수, 하천 범람, 산사태와 같은 폭우와 관련된 재해는 자주 동시에 발생하며, 각 재해는 서로 다른 범위의 시간 스케일에서 강우 변동성에 민감하게 반응한다. 따라서 재해 복합화 모델링에 적합한 확률 강우 모델은 모든 유형의 재해와 관련된 모든 시간 스케일에서 강우 변동성을 잘 재현할 수 있어야 한다. 본 연구에서는 5분에서 10년 사이의 시간 스케일에서 다양한 강우통계특성을 재현할 수 있는 추계학적 강우 생성기를 제안하였다. 이 모델은 우선 Randomized Bartlett-Lewis Rectangular Pulse (RBLRP) 모델을 사용하여 미세 규모의 강우량 시계열을 생성한 후, 연속된 폭풍 사이의 상관관계 구조가 유지되도록 폭풍우의 순서를 섞는다. 마지막으로, 별도의 월별 강우량 모델링 결과에 따라 월 단위로 시계열을 재배열한다. 독일 보훔에서 기록된 69년간의 5분 강우량 데이터를 사용하여 본 모형을 검증한 결과, 평균, 분산, 공분산, 왜곡도 및 강우 간헐성은 5분에서 10년에 이르는 시간 스케일에서 체계적인 편향 없이 잘 재현됨은 물론, 5분에서 3일 사이의 시간 스케일에서의 극한 강수량 값도 잘 재현음을 확인하였다. 아울러, 극한 강우 및 산사태에 큰 영향을 주는 극한 강우 발생 전 과거 7일간의 강수량도 정확히 재현되었다.

  • PDF

Estimation of stochastic factor of changes considering climate internal variability (기후내적변동성을 고려한 추계학적 할증률 산정)

  • jihwan Kwon;Jongho Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.309-309
    • /
    • 2023
  • 자연재해대책법에 따라 방재성능목표를 달성하기 위해 행안부 및 지자체는 방재성능목표강우량을 설정·운영하고 있다. 현재, 기후변화로 인한 할증률을 산정하여 방재성능목표강우량 산정에 포함하고 있으나, 기후의 내적변동성으로 인한 강수의 변화는 반영하지 못하고 있는 실정이다. 이에 본 연구에서는 기후변화뿐만 아니라, 엘리뇨, 라니뇨, ENSO 등과 같이 지구의 내적인 원인들로 인해 변화하는 기후내적변동성(Climate Internal Variability, CIV)을 추가적으로 고려하여 할증률 개념을 확장하고자 한다. 외부의 Forcing 변화(즉 기후변화)가 없더라도 자연적으로 기후가 변동하는 현상을 모의하기 위해, 크게 3개 동역학적, 통계학적, 추계학적 방법들이 적용되어 기후내적 변동성을 정량화하고 있다. 본 연구에서는 기후에 대한 일기를 추계학적으로 오랜 기간 동안 생성하고 생성된 시계열을 바탕으로 자연적인 변동성을 추출(Stochastic Approach)하는 방법을 사용하여 기후내적변동성을 추정할 것이다. 구체적으로, 생성된 앙상블 시계열에 Detrended 방법과Differenced 방법을 각각 적용하여 기후내적변동성의 크기를 정량화하고 상호 비교할 예정이다. 정량화된 기후내적변동성의 크기는 추계학적 할증률로 변환될 것이며 방재성능목표강우량 산정에 포함시켜 과거 기왕최대강우량을 갱신하는 지역에 대한 위험도를 추가로 제시할 수 있을 것으로 기대된다.

  • PDF

Simulation of continuous snow accumulation data using stochastic method (추계론적 방법을 통한 연속 적설 자료 모의)

  • Park, Jeongha;Kim, Dongkyun;Lee, Jeonghun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.60-60
    • /
    • 2022
  • 본 연구에서는 적설 추정 알고리즘과 추계 일기 생성 모형을 활용하여 관측 적설의 특성을 재현하는 연속 적설심 자료 모의 방법을 소개한다. 적설 추정 알고리즘은 강수 유형 판단, Snow Ratio 추정, 그리고 적설 깊이 감소량 추정까지 총 3단계로 구성된다. 먼저 강수 발생시 지상기온과 상대습도를 지표로 활용하여 강수 유형을 판단하고, 강수가 적설로 판별되었을 때 강수량을 신적설심으로 환산하는 Snow Ratio를 추정한다. Snow Ratio는 지상 기온과의 sigmoid 함수 회귀분석을 통해 추정하였으며, precipitation rate 조건(5 mm/3hr 미만 및 이상)에 따라 두 가지 함수를 적용하였다. 마지막으로 적설 깊이 감소량은 온도 지표 snowmelt 식을 이용하여 추정하였으며, 매개변수는 적설 깊이 및 온도 관측 자료를 활용하여 보정하였다. 속초 관측소 자료를 활용하여 매개변수를 보정 및 검증하여 높은 NSE(보정기간 : 0.8671, 검증기간 : 0.7432)를 달성하였으며, 이 알고리즘을 추계 일기 생성 모형으로 모의한 합성 기상 자료(강수량, 지상기온, 습도)에 적용하여 합성 적설심 시계열을 모의하였다. 모의 자료는 관측 자료의 통계 및 극한값을 매우 정확하게 재현하였으며, 현행 건축구조기준과도 일치하는 것으로 나타났다. 이 모형을 통하여 적설 위험 분석 분야뿐 아니라 기후 전망 자료와의 결합, 미계측 지역에 대한 자료 모의 등에도 광범위하게 활용될 수 있을 것이다.

  • PDF

Estimation of storm events frequency analysis using copula function (Copula 함수를 이용한 호우사상의 빈도해석 산정)

  • An, Heejin;Lee, Moonyoung;Kim, Si Yeon;Jeon, Seol;Ahn, Youngmin;Jung, Donghwa;Park, Daeryong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.200-200
    • /
    • 2022
  • 본 연구에서는 총 강우량과 강우강도을 고려한 이변수 분석으로 연최대 호우사상을 선별하고, 두 변수를 Copula 함수로 결합하여 최적의 모델조합을 찾는 확률호우사상 산정 방법론을 제시하였다. 국내 69개 관측소의 2020년까지의 관측 자료를 대상으로 1mm 이하의 강우는 제거한 뒤, IETD(Inter-Event Time Definition) 12시간을 기준으로 강우자료를 독립적인 호우사상으로 분리하였다. 호우사상의 여러 특성 중 양의 상관관계를 갖는 총 강우량과 강우강도를 변수로 선택해 이변수 지수분포에 대입하였고, 각 지점의 연최대 호우사상 시계열을 생성하였다. 2변수 지수분포의 매개변수는 전체 기간과 연도별로 나누어 추정해 본 결과 연도별 변동성이 큰 것을 확인해 연도별 추정 방식을 선택하였다. 연최대 강우사상 시계열의 총 강우량과 강우강도는 극한 강우에 적용하는 확률분포형 중 Lognarmal, Gamma, Gumbel, GEV(Generalized Extreme Value), GPD(Generalized Pareto Distribution) 5가지를 사용하여 각각 CDF(Cumulative distribution Function) 값을 추정하였다. 계산된 CDF 값은 3가지 Copula 모형으로 결합해 joint CDF 값을 산출하였다. 총 75개의 모델조합 중 최적 모델을 찾기 위해 CVM(Cramer-von-Mises) 적합도 검정을 시행하였다. CVM의 통계량 Sn 값이 가장 작은 모델조합을 해당 지점의 최적 모델조합으로 선정하였다.

  • PDF