• 제목/요약/키워드: Autoregressive model

검색결과 748건 처리시간 0.031초

Prediction Model of User Physical Activity using Data Characteristics-based Long Short-term Memory Recurrent Neural Networks

  • Kim, Joo-Chang;Chung, Kyungyong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권4호
    • /
    • pp.2060-2077
    • /
    • 2019
  • Recently, mobile healthcare services have attracted significant attention because of the emerging development and supply of diverse wearable devices. Smartwatches and health bands are the most common type of mobile-based wearable devices and their market size is increasing considerably. However, simple value comparisons based on accumulated data have revealed certain problems, such as the standardized nature of health management and the lack of personalized health management service models. The convergence of information technology (IT) and biotechnology (BT) has shifted the medical paradigm from continuous health management and disease prevention to the development of a system that can be used to provide ground-based medical services regardless of the user's location. Moreover, the IT-BT convergence has necessitated the development of lifestyle improvement models and services that utilize big data analysis and machine learning to provide mobile healthcare-based personal health management and disease prevention information. Users' health data, which are specific as they change over time, are collected by different means according to the users' lifestyle and surrounding circumstances. In this paper, we propose a prediction model of user physical activity that uses data characteristics-based long short-term memory (DC-LSTM) recurrent neural networks (RNNs). To provide personalized services, the characteristics and surrounding circumstances of data collectable from mobile host devices were considered in the selection of variables for the model. The data characteristics considered were ease of collection, which represents whether or not variables are collectable, and frequency of occurrence, which represents whether or not changes made to input values constitute significant variables in terms of activity. The variables selected for providing personalized services were activity, weather, temperature, mean daily temperature, humidity, UV, fine dust, asthma and lung disease probability index, skin disease probability index, cadence, travel distance, mean heart rate, and sleep hours. The selected variables were classified according to the data characteristics. To predict activity, an LSTM RNN was built that uses the classified variables as input data and learns the dynamic characteristics of time series data. LSTM RNNs resolve the vanishing gradient problem that occurs in existing RNNs. They are classified into three different types according to data characteristics and constructed through connections among the LSTMs. The constructed neural network learns training data and predicts user activity. To evaluate the proposed model, the root mean square error (RMSE) was used in the performance evaluation of the user physical activity prediction method for which an autoregressive integrated moving average (ARIMA) model, a convolutional neural network (CNN), and an RNN were used. The results show that the proposed DC-LSTM RNN method yields an excellent mean RMSE value of 0.616. The proposed method is used for predicting significant activity considering the surrounding circumstances and user status utilizing the existing standardized activity prediction services. It can also be used to predict user physical activity and provide personalized healthcare based on the data collectable from mobile host devices.

토사터널의 쉴드 TBM 데이터 시계열 분석을 통한 막장 전방 예측 연구 (A ground condition prediction ahead of tunnel face utilizing time series analysis of shield TBM data in soil tunnel)

  • 정지희;김병규;정희영;김해만;이인모
    • 한국터널지하공간학회 논문집
    • /
    • 제21권2호
    • /
    • pp.227-242
    • /
    • 2019
  • 토압식(Earth Pressure-Balanced, EPB) 쉴드 TBM 기계데이터 분석을 통해 토사터널의 특징이 반영된 막장 전방 예측 방법을 제안하였다. 기존에 암반과 토사가 혼합된 복합 지반의 예측에 적용하였던 시계열 분석 모델을 토사터널에 적용가능하도록 수정하였다. 또한 수정된 모델을 사용하여, 토사 종류에 따라 쏘일 컨디셔닝 재료를 선택하는 것이 타당한지 연구하였다. 이를 위해 Self-Organizing Map (SOM) 군집화(clustering) 분석을 수행하였다. 그 결과 무엇보다도 지반타입이 #200체 통과량 35% 기준으로 분류되어야 한다는 것을 확인하였다. 또한 TBM 기계데이터 분석을 통해 수정된 모델이 지반 타입을 예측하는데 사용될 수 있음을 확인하였다. 수정된 기준에 따라 지반 타입을 분류하고 시계열 분석을 수행하면, 10막장 전방 지반에 대해서 98%의 높은 예측 정확도를 보였으며, 이를 통해 수정된 방법의 우수성이 입증되었다. 특히 지반 타입 변화 구간에 대한 예측 정확도도 약 93%로, 10막장 전방에서 지반 타입 변화 여부를 미리 확인할 수 있게 되었다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

The Effect of the Reduction in the Interest Rate Due to COVID-19 on the Transaction Prices and the Rental Prices of the House

  • KIM, Ju-Hwan;LEE, Sang-Ho
    • 산경연구논집
    • /
    • 제11권8호
    • /
    • pp.31-38
    • /
    • 2020
  • Purpose: This study uses 'Autoregressive Integrated Moving Average Model' to predict the impact of a sharp drop in the base rate due to COVID-19 at the present time when government policies for stabilizing house prices are in progress. The purpose of this study is to predict implications for the direction of the government's house policy by predicting changes in house transaction prices and house rental prices after a sharp cut in the base rate. Research design, data, and methodology: The ARIMA intervention model can build a model without additional information with just one time series. Therefore, it is a time-series analysis method frequently used for short-term prediction. After the subprime mortgage, which had shocked since the global financial crisis in April 2007, the bank's interest rate in 2020 is set at a time point close to zero at 0.75%. After that, the model was estimated using the interest rate fluctuations for the Bank of Korea base interest rate, the house transaction price index, and the house rental price index as event variables. Results: In predicting the change in house transaction price due to interest rate intervention, the house transaction price index due to the fall in interest rates was predicted to change after 3 months. As a result, it was 102.47 in April 2020, 102.87 in May 2020, and 103.21 in June 2020. It was expected to rise in the short term. In forecasting the change in house rental price due to interest rate intervention, the house rental price index due to the drop in interest rate was predicted to change after 3 months. As a result, it was 97.76 in April 2020, 97.85 in May 2020, and 97.97 in June 2020. It was expected to rise in the short term. Conclusions: If low interest rates continue to stimulate the contracted economy caused by COVID-19, it seems that there is ample room for house transaction and rental prices to rise amid low growth. Therefore, In order to stabilize the house price due to the low interest rate situation, it is considered that additional measures are needed to suppress speculative demand.

한국 멸치어업의 어획량 분석과 예측 ARIMA 모델 및 스펙트럼 해석 (Analysis and Prediction of Anchovy Fisheries in Korea ARIMA Model and Spectrum Analysis)

  • 박해훈;윤갑동
    • 한국수산과학회지
    • /
    • 제29권2호
    • /
    • pp.143-149
    • /
    • 1996
  • 우리나라 멸치어업에서의 1971~1992년 동안의 22년간 월별 어획량 자료를 시계열 분석하여 어획량을 분석, 예측하였다. 시계열 분석은 다른 생물학적, 해양학적, 사회 경제적인 요소가 없어도 단지 어획량 자료만으로 분석과 예측이 가능하다. 첫 20년간인 1971~1990년 사이의 월별 멸치 어획량 자료를 ARIMA 시계열 모형에 적용시켜 구한 결과는 다음과 같다. 로그 (대수) 변환시켰을 때의 ARIMA 모형: $$(1-0.381B)(1-0.027B^{12}+0.141B^{24})(1-B^1)(1-B^{12})Z_t=(1-0.968B)(1-0.727B^{12})e_t$$, Box-Cox 변환시켰을 때의 ARIMA 모형: $$(1-0.431B)(1-B^{12})Z_t=(1-0.882B^{12})e_t$$, 위의 두 모형중 Box-Cox 변환시킨 것이 로그 (대수) 변환시킨 것보다 예측오차가 적었으며, Box-Cox 변환식은 $Y'=(Y^{0.58}-1)/0.58$ 이었다. 위의 두 모형 중 후자의 모형을 이용하여 1991~1992년 사이의 월별 어획량을 예측하였다. 예측 어획량과 실제 어획량과의 월별 오차범위는 1.0~63.2% (1991년에 1.6~63.2%이고, 1992년에는 1.0~60.4%)였다. 예측 어획량이 각 연도별로 148,201M/T과 148,834M/T인데 비해, 실제 어획량은 170,293M/T, 168,234M/T이었다. 2년 동안의 총어획량에 대한 오차는 12.3%였다. 또한 스펙트럼 분석은 순환변동의 주기가 2.2개월, 6.1개월, 10.2개월, 12개월, 14.7개월에서 상대적으로 큰 성분이 있음을 나타내었다 이 순환변동 성분은 적절한 ARIMA 모형을 결정하는 데도 도움이 된다.

  • PDF

공간효과를 이용한 한국의 대 중국 직접투자 결정요인 (Determinants of Korean FDI in China using the Spatial Effects)

  • 류병현;김도현;강한균
    • 통상정보연구
    • /
    • 제16권4호
    • /
    • pp.385-408
    • /
    • 2014
  • 본 연구는 한국의 대 중국 제조업 직접투자(1996~2012)의 투자결정 요인을 4개 투자지역으로 구분하고 선행연구와 차별적으로 공간패널효과 모형을 이용하여 규명하였다. 연구결과 중국 전체를 대상으로 한 경우 1인당 RGDP가 정(+)의 유의적 변수로 나타났고 공간효과 변수도 매우 민감한 것으로 나타났다. A지역(동북지구 화북지구)은 1인당 RGDP가 정(+)의 유의적 변수, 공간효과 변수는 부(-)의 유의적 변수로 나타나 지역 내 투자는 대체적인 것으로 나타났다. B지역(화동지구 화남지구)에서는 1인당 RGDP가 정(+)의 유의적 변수, 공간오차모형 계수는 정(+)의 유의적 관계로 나타나 지역 내 투자는 보완적인 것으로 추정된다. C지역(중부내륙지구)의 분석결과 1인당 RGDP와 공간효과 변수 등 모든 변수는 비유의적이고 D지역(서북 서남지구)에서는 1인당 RGDP, WAGE(임금), ROAD(교통인프라), 공간효과 변수(${\rho}$, ${\lambda}$) 모두 정(+)의 유의적인 변수로 나타났다. 이는 한국의 대 중국 직접투자가 동부연안 중심에서 서북 서남지구로 전환을 모색하고 있는 것으로 추정되어지며 이 지역으로 진출시 인접 성(省)의 지역 환경적 특성을 충분히 고려할 필요가 있다고 하겠다.

  • PDF

우리나라 자산가격 변동의 기준점 효과 및 전망이론적 해석 가능성 검정 (Dynamics of Asset Returns Considering Asymmetric Volatility Effects: Evidences from Korean Asset Markets)

  • 김윤영;이진수
    • KDI Journal of Economic Policy
    • /
    • 제33권1호
    • /
    • pp.93-124
    • /
    • 2011
  • 본고에서는 Tversky and Kahneman(1974)의 기준점 효과와 Kahneman and Tversky(1979)의 전망이론으로 해석이 가능한 현상이 우리나라 자산시장에 동시에 나타나는지를 주가 및 부동산 가격을 대상으로 검증하였다. 전망이론의 경우 위험 회피 성향 투자자가 가격 상승 시 매각을 선호하는 것으로 예측하는데, 본고는 이런 성향이 자산가격 수익의 변동성이 증가하는 경우 더 강화되는 것으로 보았다. 1990년대 이후 우리나라 자료를 바탕으로 실증분석한 결과, 과거 수익률이 양(+)인 경우, 주가수익률은 과거 20 또는 30 영업일 자료(window)를 이용하여 산출한 변동성에, 아파트를 제외한 주택가격 수익률은 과거 24~36개월의 자료를 이용하여 산출한 변동성에 각각 통계적으로 유의한 영향을 받는 것으로 나타났다.

  • PDF

KOSPI지수와 원-달러 환율의 변동성의 비대칭성에 대한 실증연구 (Empirical Analyses of Asymmetric Conditional Heteroscedasticities for the KOSPI and Korean Won-US Dollar Exchange Rate)

  • 맹혜영;신동완
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1033-1043
    • /
    • 2011
  • 본 논문에서는 KOSPI지수와 원-달러 환율의 로그수익률을 사용하여 비대칭 이분산성에 대해 연구한다. 커널 density plot과 상승기와 하강기의 평균, 분산을 검토하여 이들 시계열의 변동의 비대칭성에 대한 윤곽을 파악하고 GARCH군의 여러 비대칭 모형을 적합하여 비대칭성을 실증적으로 파악한다. 또한 최종선택 모형인 EGARCH 모형을 바탕으로 부트스트래핑을 사용하여 미래 시점의 변동성인 조건부 분산의 기대치를 예측하고 예측표준오차를 구해본다.

항공화물수요예측에서 계절 ARIMA모형 적용에 관한 연구: 인천국제공항발 미주항공노선을 중심으로 (Application of SARIMA Model in Air Cargo Demand Forecasting: Focussing on Incheon-North America Routes)

  • 서보현;양태웅;하헌구
    • 대한교통학회지
    • /
    • 제35권2호
    • /
    • pp.143-159
    • /
    • 2017
  • 본 연구는 2003년 1사분기부터 2016년 2사분기 까지 인천국제공항에서 미주노선을 통하여 미주 내 공항에 도착하는 항공화물의 시계열 자료를 통하여 SARIMA 모형을 활용하여 항공화물 수요예측을 시행하였다. 또한 SARIMA 모형을 활용하여 만들어진 수요예측 모형과 기존 연구에 주로 활용되어졌던 ARIMA 모형을 활용하여 만들어진 수요예측 모형과 비교분석함으로써, 주기적인 특성 및 계절성을 가진 시계열 자료에 대한 SARIMA 모형의 상대적으로 우수한 예측 정확성을 입증하였다. 기존의 항공 관련 연구는 주로 여객에 관한 연구가 상대적으로 많았다. 또한 화물과 관련된 연구에서도 특정노선이 아닌 공항이나 전체에 대한 연구가 대부분이었다. 이러한 상황에서, SARIMA 모형을 활용하여 미주지역이라는 특정 노선에 대한 항공화물의 수요를 예측한 본 연구는 큰 의의가 있다고 생각된다.

Effect of Repeated Public Releases on Cesarean Section Rates

  • Jang, Won-Mo;Eun, Sang-Jun;Lee, Chae-Eun;Kim, Yoon
    • Journal of Preventive Medicine and Public Health
    • /
    • 제44권1호
    • /
    • pp.2-8
    • /
    • 2011
  • Objectives: Public release of and feedback (here after public release) on institutional (clinics and hospitals) cesarean section rates has had the effect of reducing cesarean section rates. However, compared to the isolated intervention, there was scant evidence of the effect of repeated public releases (RPR) on cesarean section rates. The objectives of this study were to evaluate the effect of RPR for reducing cesarean section rates. Methods: From January 2003 to July 2007, the nationwide monthly institutional cesarean section rates data (1 951 303 deliveries at 1194 institutions) were analyzed. We used autoregressive integrated moving average (ARIMA) time-series intervention models to assess the effect of the RPR on cesarean section rates and ordinal logistic regression model to determine the characteristics of the change in cesarean section rates. Results: Among four RPR, we found that only the first one (August 29, 2005) decreased the cesarean section rate (by 0.81 percent) and continued to have an impact period through the last observation in May 2007. Baseline cesarean section rates (OR, 4.7; 95% CI, 3.1 to 7.1) and annual number of deliveries (OR, 2.8; 95% CI, 1.6 to 4.7) of institutions in the upper third of each category at before first intervention had a significant contribution to the decrease of cesarean section rates. Conclusions: We could not found the evidence that RPR has had the significant effect of reducing cesarean section rates. Institutions with upper baseline cesarean section rates and annual number of deliveries were more responsive to RPR.