• Title/Summary/Keyword: Multivariate time series model

검색결과 87건 처리시간 0.03초

강우 및 지점특성치를 이용한 계절형 다변량 시계열 모형 구축 평가 및 비교 (Evaluation and Comparison of seasonal multivariate time series model construction with rainfall and site characteristics)

  • 김태림;최원영;신홍준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.29-29
    • /
    • 2015
  • 수자원의 지속적인 관리 및 효율적인 활용을 위하여 수문량의 예측과 분석은 필수적인 과정이라 할 수 있으며 이에 따라 다양한 수문 모형이 구축되고 강우, 유량 등 대표적인 수문량의 예측이 수행되어져 왔다. 그 중에서도 수문 시계열 모형은 시간의 흐름에 따라 일정하게 기록되어온 수문 자료를 확률적인 과정을 통하여 모형을 구축하고 이를 바탕으로 미래 수문량을 예측하는 데활용되는 모형으로, 과거에 기록된 수문 패턴이 미래에도 지속된다는 가정 하에 구축된다. 일반적으로 시계열 모형은 하나의 자료계열로 모형을 구축하는 단변량 모형과 원 자료계열 외에 다른 자료계열을 고려하여 모형을 구축하는 다변량 모형이 있으며, 다변량 모형은 원 자료계열에 영향을 미치는 외부변수를 고려함으로써 두 자료계열간의 상관성을 모형에 반영할 수 있는 장점을 가지고 있다. 또한 자료계열의 계절성을 고려하여 시계열 모형을 구축할 경우, 수문 시계열이 가지고 있는 계절적 영향을 잘 반영할 수 있다. 따라서 본 연구에서는 계절성을 고려한 다변량 시계열 모형인 SARIMAX(Seasonal AutoRegressive Integrated Moving Average with eXogenous) 모형을 이용하여 대표적인 수공구조물인 댐의 유입량 예측을 수행하였다. 일반적으로 댐 유입량 예측에는 댐의 유입량과 상관성이 높은 강우가 외부변수로 사용되어져 왔으나, 이 외에도 영향을 미칠 수 있는 지점특성치를 고려하여 모형을 구축한 후 비교하였다.

  • PDF

LSTM-VAE를 활용한 기계시설물 장치의 이상 탐지 시스템 (Anomaly Detection System in Mechanical Facility Equipment: Using Long Short-Term Memory Variational Autoencoder)

  • 서재홍;박준성;유준우;박희준
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.581-594
    • /
    • 2021
  • Purpose: The purpose of this study is to compare machine learning models for anomaly detection of mechanical facility equipment and suggest an anomaly detection system for mechanical facility equipment in subway stations. It helps to predict failures and plan the maintenance of facility. Ultimately it aims to improve the quality of facility equipment. Methods: The data collected from Daejeon Metropolitan Rapid Transit Corporation was used in this experiment. The experiment was performed using Python, Scikit-learn, tensorflow 2.0 for preprocessing and machine learning. Also it was conducted in two failure states of the equipment. We compared and analyzed five unsupervised machine learning models focused on model Long Short-Term Memory Variational Autoencoder(LSTM-VAE). Results: In both experiments, change in vibration and current data was observed when there is a defect. When the rotating body failure was happened, the magnitude of vibration has increased but current has decreased. In situation of axis alignment failure, both of vibration and current have increased. In addition, model LSTM-VAE showed superior accuracy than the other four base-line models. Conclusion: According to the results, model LSTM-VAE showed outstanding performance with more than 97% of accuracy in the experiments. Thus, the quality of mechanical facility equipment will be improved if the proposed anomaly detection system is established with this model used.

Using machine learning to forecast and assess the uncertainty in the response of a typical PWR undergoing a steam generator tube rupture accident

  • Tran Canh Hai Nguyen ;Aya Diab
    • Nuclear Engineering and Technology
    • /
    • 제55권9호
    • /
    • pp.3423-3440
    • /
    • 2023
  • In this work, a multivariate time-series machine learning meta-model is developed to predict the transient response of a typical nuclear power plant (NPP) undergoing a steam generator tube rupture (SGTR). The model employs Recurrent Neural Networks (RNNs), including the Long Short-Term Memory (LSTM), Gated Recurrent Unit (GRU), and a hybrid CNN-LSTM model. To address the uncertainty inherent in such predictions, a Bayesian Neural Network (BNN) was implemented. The models were trained using a database generated by the Best Estimate Plus Uncertainty (BEPU) methodology; coupling the thermal hydraulics code, RELAP5/SCDAP/MOD3.4 to the statistical tool, DAKOTA, to predict the variation in system response under various operational and phenomenological uncertainties. The RNN models successfully captures the underlying characteristics of the data with reasonable accuracy, and the BNN-LSTM approach offers an additional layer of insight into the level of uncertainty associated with the predictions. The results demonstrate that LSTM outperforms GRU, while the hybrid CNN-LSTM model is computationally the most efficient. This study aims to gain a better understanding of the capabilities and limitations of machine learning models in the context of nuclear safety. By expanding the application of ML models to more severe accident scenarios, where operators are under extreme stress and prone to errors, ML models can provide valuable support and act as expert systems to assist in decision-making while minimizing the chances of human error.

벡터오차수정모형과 다변량 GARCH 모형을 이용한 코스피200 선물의 헷지성과 분석 (Hedging effectiveness of KOSPI200 index futures through VECM-CC-GARCH model)

  • 권동안;이태욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1449-1466
    • /
    • 2014
  • 본 논문에서는 기초자산의 선물을 이용하는 헷지 전략을 연구하였다. 최적헷지비율을 구하기 위한 전통적인 방법으로 회귀분석이 사용되고 있으나, 현물과 선물 사이에 존재하는 장기균형관계와 금융 시계열 자료의 분산에 존재하는 변동성 군집현상 등의 특징을 설명하지 못하는 한계가 있다. 이를 극복하기 위해 코스피200 지수와 선물 자료에 대해 평균모형으로 벡터오차수정모형을 적합하고, 분산모형으로 다변량 GARCH 모형을 적합하여 분산-공분산 행렬을 추정하고, 이를 통해 최적헷지비율을 구하는 방법을 연구하였다. 실증분석 결과에 의하면 시장이 안정적일 때에는 회귀분석을 사용해도 큰 차이가 없지만, 시장이 불안정해지고 변동성이 커지는 구간에서는 벡터오차수정모형과 다변량 GARCH 모형을 이용하는 경우에 헷지성과가 월등히 좋아지는 결과를 얻을 수 있었다.

국내 MIS 연구에서 구조방정식모형 활용에 관한 메타분석 (A Meta Analysis of Using Structural Equation Model on the Korean MIS Research)

  • 김종기;전진환
    • Asia pacific journal of information systems
    • /
    • 제19권4호
    • /
    • pp.47-75
    • /
    • 2009
  • Recently, researches on Management Information Systems (MIS) have laid out theoretical foundation and academic paradigms by introducing diverse theories, themes, and methodologies. Especially, academic paradigms of MIS encourage a user-friendly approach by developing the technologies from the users' perspectives, which reflects the existence of strong causal relationships between information systems and user's behavior. As in other areas in social science the use of structural equation modeling (SEM) has rapidly increased in recent years especially in the MIS area. The SEM technique is important because it provides powerful ways to address key IS research problems. It also has a unique ability to simultaneously examine a series of casual relationships while analyzing multiple independent and dependent variables all at the same time. In spite of providing many benefits to the MIS researchers, there are some potential pitfalls with the analytical technique. The research objective of this study is to provide some guidelines for an appropriate use of SEM based on the assessment of current practice of using SEM in the MIS research. This study focuses on several statistical issues related to the use of SEM in the MIS research. Selected articles are assessed in three parts through the meta analysis. The first part is related to the initial specification of theoretical model of interest. The second is about data screening prior to model estimation and testing. And the last part concerns estimation and testing of theoretical models based on empirical data. This study reviewed the use of SEM in 164 empirical research articles published in four major MIS journals in Korea (APJIS, ISR, JIS and JITAM) from 1991 to 2007. APJIS, ISR, JIS and JITAM accounted for 73, 17, 58, and 16 of the total number of applications, respectively. The number of published applications has been increased over time. LISREL was the most frequently used SEM software among MIS researchers (97 studies (59.15%)), followed by AMOS (45 studies (27.44%)). In the first part, regarding issues related to the initial specification of theoretical model of interest, all of the studies have used cross-sectional data. The studies that use cross-sectional data may be able to better explain their structural model as a set of relationships. Most of SEM studies, meanwhile, have employed. confirmatory-type analysis (146 articles (89%)). For the model specification issue about model formulation, 159 (96.9%) of the studies were the full structural equation model. For only 5 researches, SEM was used for the measurement model with a set of observed variables. The average sample size for all models was 365.41, with some models retaining a sample as small as 50 and as large as 500. The second part of the issue is related to data screening prior to model estimation and testing. Data screening is important for researchers particularly in defining how they deal with missing values. Overall, discussion of data screening was reported in 118 (71.95%) of the studies while there was no study discussing evidence of multivariate normality for the models. On the third part, issues related to the estimation and testing of theoretical models on empirical data, assessing model fit is one of most important issues because it provides adequate statistical power for research models. There were multiple fit indices used in the SEM applications. The test was reported in the most of studies (146 (89%)), whereas normed-test was reported less frequently (65 studies (39.64%)). It is important that normed- of 3 or lower is required for adequate model fit. The most popular model fit indices were GFI (109 (66.46%)), AGFI (84 (51.22%)), NFI (44 (47.56%)), RMR (42 (25.61%)), CFI (59 (35.98%)), RMSEA (62 (37.80)), and NNFI (48 (29.27%)). Regarding the test of construct validity, convergent validity has been examined in 109 studies (66.46%) and discriminant validity in 98 (59.76%). 81 studies (49.39%) have reported the average variance extracted (AVE). However, there was little discussion of direct (47 (28.66%)), indirect, and total effect in the SEM models. Based on these findings, we suggest general guidelines for the use of SEM and propose some recommendations on concerning issues of latent variables models, raw data, sample size, data screening, reporting parameter estimated, model fit statistics, multivariate normality, confirmatory factor analysis, reliabilities and the decomposition of effects.

한국의 자연실업률 추정 (Korea's Natural Rate of Unemployment: Estimates and Assessment)

  • 신석하
    • KDI Journal of Economic Policy
    • /
    • 제26권2호
    • /
    • pp.3-62
    • /
    • 2004
  • 한국의 자연실업률에 대한 기존 연구들은 대부분 한 가지의 추정방법에 의존하고 있어 연구 간에 상이하게 나타나는 추정결과를 평가할 근거가 없는 상황이다. 따라서 본고에서는 이를 감안하여 순수 시계열방법, 축약형 모형을 이용한 방법, 구조모형을 이용한 방법 등 다양한 추정방법을 검토하여 추정방법 간 상대적인 장단점을 비교하고 이를 기반으로 한국의 자연실업률을 추정하고자 하였다. 또한 본 논문에서는 추정결과의 신뢰구간을 몬테카를로 적분(Monte Carlo integration)방법을 이용하여 추정함으로써 추정결과의 정확성에 대한 평가 근거를 제시하였다. 축약형 모형의 하나인 다변수 비관측인자모형이 여타 추정방법에 비해 상대적으로 장점을 지니고 있는 것으로 평가되었으나 추정결과가 모형설정오류에 민감하다는 점을 고려하여 모형설정에 세심한 주의를 기울일 필요가 제기되었으며, 순수 시계열방법이나 구조 벡터자기회귀모형도 나름대로의 장점이 있으므로 특정방법을 이용한 결과에 의존하기보다는 여러 추정방법에 의한 추정결과에서 공통적으로 발견되는 부분에 기반을 두어 자연실업률을 추론하는 것이 바람직하다고 사료된다. 추정방법에 따라 다소 차이가 있지만, 한국의 자연실업률은 1979~87년 동안 평균 3.7~4.0% 수준에서 1988~97년 기간 동안 평균 2.6~3.2% 수준으로 하락하였으나, 외환위기를 거치며 4.0~5.3% 수준까지 상승하였다가 이후 하락하는 추세를 지속하고 있는 것으로 나타났다. 또한 대부분의 추정결과에서 최근에 실제실업률이 자연실업률에 근접해 있으나 실업률 갭이 상승하고 있는 것으로 나타나 최근 비교적 높은 수준에 머무르고 있는 실업률이 외환위기 이후 자연실업률의 상승이라는 구조적 변화와 경기침체라는 경기순환적 요인에 함께 영향 받고 있을 가능성을 시사하였다.

  • PDF

SVECM 모형을 이용한 탄소배출권 가격 연구 (The Analysis of EU Carbon Prices Using SVECM Approach)

  • 부기덕;정기호
    • 자원ㆍ환경경제연구
    • /
    • 제20권3호
    • /
    • pp.531-565
    • /
    • 2011
  • 배출권 가격의 다변량 시계열자료를 이용하는 국내외 선행연구들은 모두 공통적으로 내생변수가 네 개 이내이며, 분석기간에서 가격자료에 왜곡이 발생한 2006년 4월~6월까지의 데이터를 포함하고 있다. 본 연구는 유럽 배출권 가격의 시계열자료를 분석하되, 내생변수를 다섯 개 이상으로 확장하였으며, 분석기간도 일간자료의 경우 비교적 신뢰성이 확보된 제2단계 기간의 자료(즉, 2008년 4월 21일~2010년 3월 31일)를 대상으로 하였고, 경제변수들을 내생변수로 포함하는 월간 자료를 추가로 분석하였다. 분석 방법은 그래프 이론과 구조적 벡터오차수정모형(SVECM)을 이용하였다. 본 연구 결과는 다음과 같이 요약된다. 첫째, 일간 자료에서 배출권 가격에 가장 큰 영향을 미치는 변수는 오일가격, 전력가격, 가스가격의 순으로 나타났다. 둘째, 일간 자료에서 배출권 가격이 전력가격에 전가된다는 기존의 이론이 최근 데이터에서도 입증되었다. 셋째, 일간 자료에서 그래프 분석 결과 브렌트유 가격이 인과흐름에서 중요한 중간 매체 역할을 수행하여 배출권 가격${\rightarrow}$브렌트유 가격${\rightarrow}$석탄/가스가격${\rightarrow}$전력가격으로 이어지는 인과흐름이 파악되었으며, 배출권거래소간에는 EEX 선물${\rightarrow}$BlueNext 선물${\rightarrow}$ECX 선물로 이어지는 인과흐름이 발견되었다. 마지막으로 월간 자료에서는 유로 산업생산지수와 영국 재무성증권90일물 금리, 유로 생산자물가지수 등 경제변수들이 배출권 가격에 큰 영향을 미치는 것으로 나타났다. 이것은 배출권 가격의 주요 결정요인으로 경제변수들을 포함시킬 수 있는 가능성을 보여주었다.

  • PDF

SPADE 기반 U-Net을 이용한 고해상도 위성영상에서의 도시 변화탐지 (Urban Change Detection for High-resolution Satellite Images Using U-Net Based on SPADE)

  • 송창우;;정지훈;홍성재;김대희;강주형
    • 대한원격탐사학회지
    • /
    • 제36권6_2호
    • /
    • pp.1579-1590
    • /
    • 2020
  • 본 논문에서는 고해상도의 위성영상을 활용하여 도시의 변화 양상을 분석하기 위하여 SPADE기반의 U-Net과 객체 영역기반 변화탐지 방법을 제안한다. 제안하는 네트워크는 기존의 U-Net에서 공간 정보를 잃지 않기 위해 SPADE를 사용했다. 고해상도 위성영상을 활용한 변화탐지 방법은 계획, 예측 등 다양한 도시 문제를 해결하기 위해 활용할 수 있다. IR-MAD 등 전통적인 방법인 화소 기반의 변화탐지를 수행할 경우, 다중 시기 영상 간의 기후, 계절 변화 등에 의해 화소의 변화가 민감하기 때문에 미변화 지역들이 변화 지역으로 오탐지될 가능성이 매우 크다. 이에 본 논문에서는 시계열 위성영상에서 도시를 구성하는 객체에 대한 변위를 정확하게 탐지하기 위해 도시를 구성하는 주요 공간 객체를 정의하고, 딥러닝 기반 영상 분할을 통해 추출한 후 영역 간의 변위 오차를 분석하여 변화탐지를 수행한다. 변화 양상을 분석하기 위한 공간 객체로 건축물, 도로, 농경지, 비닐하우스, 산림 영역, 수변 영역의 6개로 정의하였다. KOMPSAT-3A 위성영상으로 학습한 각 네트워크 모델을 시계열 KOMPSAT-3 위성영상에 대한 변화탐지를 수행한다. 객관적인 성능 평가를 위한 변화탐지 지표는 F1-score, Kappa를 사용한다. 제안하는 변화탐지 기법은 U-Net, UNet++ 대비 뛰어난 결과를 보이며, 평균 F1 score는 0.77, kappa는 77.29의 성능을 확인할 수 있다.

MEAT SPECIATION USING A HIERARCHICAL APPROACH AND LOGISTIC REGRESSION

  • Arnalds, Thosteinn;Fearn, Tom;Downey, Gerard
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1245-1245
    • /
    • 2001
  • Food adulteration is a serious consumer fraud and a matter of concern to food processors and regulatory agencies. A range of analytical methods have been investigated to facilitate the detection of adulterated or mis-labelled foods & food ingredients but most of these require sophisticated equipment, highly-qualified staff and are time-consuming. Regulatory authorities and the food industry require a screening technique which will facilitate fast and relatively inexpensive monitoring of food products with a high level of accuracy. Near infrared spectroscopy has been investigated for its potential in a number of authenticity issues including meat speciation (McElhinney, Downey & Fearn (1999) JNIRS, 7(3), 145-154; Downey, McElhinney & Fearn (2000). Appl. Spectrosc. 54(6), 894-899). This report describes further analysis of these spectral sets using a hierarchical approach and binary decisions solved using logistic regression. The sample set comprised 230 homogenized meat samples i. e. chicken (55), turkey (54), pork (55), beef (32) and lamb (34) purchased locally as whole cuts of meat over a 10-12 week period. NIR reflectance spectra were recorded over the wavelength range 400-2498nm at 2nm intervals on a NIR Systems 6500 scanning monochromator. The problem was defined as a series of binary decisions i. e. is the meat red or white\ulcorner is the red meat beef or lamb\ulcorner, is the white meat pork or poultry\ulcorner etc. Each of these decisions was made using an individual binary logistic model based on scores derived from principal component or partial least squares (PLS1 and PLS2) analysis. The results obtained were equal to or better than previous reports using factorial discriminant analysis, K-nearest neighbours and PLS2 regression. This new approach using a combination of exploratory and logistic analyses also appears to have advantages of transparency and the use of inherent structure in the spectral data. Additionally, it allows for the use of different data transforms and multivariate regression techniques at each decision step.

  • PDF

MEAT SPECIATION USING A HIERARCHICAL APPROACH AND LOGISTIC REGRESSION

  • Arnalds, Thosteinn;Fearn, Tom;Downey, Gerard
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1152-1152
    • /
    • 2001
  • Food adulteration is a serious consumer fraud and a matter of concern to food processors and regulatory agencies. A range of analytical methods have been investigated to facilitate the detection of adulterated or mis-labelled foods & food ingredients but most of these require sophisticated equipment, highly-qualified staff and are time-consuming. Regulatory authorities and the food industry require a screening technique which will facilitate fast and relatively inexpensive monitoring of food products with a high level of accuracy. Near infrared spectroscopy has been investigated for its potential in a number of authenticity issues including meat speciation (McElhinney, Downey & Fearn (1999) JNIRS, 7(3), 145 154; Downey, McElhinney & Fearn (2000). Appl. Spectrosc. 54(6), 894-899). This report describes further analysis of these spectral sets using a hierarchical approach and binary decisions solved using logistic regression. The sample set comprised 230 homogenized meat samples i. e. chicken (55), turkey (54), pork (55), beef (32) and lamb (34) purchased locally as whole cuts of meat over a 10-12 week period. NIR reflectance spectra were recorded over the wavelength range 400-2498nm at 2nm intervals on a NIR Systems 6500 scanning monochromator. The problem was defined as a series of binary decisions i. e. is the meat red or white\ulcorner is the red meat beef or lamb\ulcorner, is the white meat pork or poultry\ulcorner etc. Each of these decisions was made using an individual binary logistic model based on scores derived from principal component or partial least squares (PLS1 and PLS2) analysis. The results obtained were equal to or better than previous reports using factorial discriminant analysis, K-nearest neighbours and PLS2 regression. This new approach using a combination of exploratory and logistic analyses also appears to have advantages of transparency and the use of inherent structure in the spectral data. Additionally, it allows for the use of different data transforms and multivariate regression techniques at each decision step.

  • PDF