• 제목/요약/키워드: ARIMA analysis

검색결과 199건 처리시간 0.033초

시계열 분석을 통한 출생아 수와 소아치과 내원 환자 수 추세 분석 및 예측 (Trend Analysis and Prediction of the Number of Births and the Number of Outpatients using Time Series Analysis)

  • 안화연;김선미;최남기
    • 대한소아치과학회지
    • /
    • 제49권3호
    • /
    • pp.274-284
    • /
    • 2022
  • 이 연구의 목적은 시계열 분석을 통하여 최근 10년(2010 - 2019)간의 광주광역시 출생아 수 추이와 전남대학교 치과병원 소아치과 내원 환자 수 추이를 분석하고 향후 1년을 예측하는 것이다. 출생아 수는 월별 반복과정을 보이면서 비안정적으로 하락하는 추세를 보였으며 1월에 출생아 수가 가장 많고 12월에 가장 적은 경향을 보였다. 2020년의 출생아 수가 평균 682명(595 - 782명, 95% CI)으로 예측되었으며 실제 출생아 수는 평균 610명이었다. 소아치과 내원 환자 수는 월별 반복과정을 보이면서 비교적 안정되어 있으며 8월에 내원 환자 수가 가장 많고 6월에 가장 적은 경향을 보였다. 2020년의 내원 환자 수가 평균 603명(505 - 701명, 95% CI)으로 예측되었으며 실제 내원 환자 수의 평균은 587명이었다. 출생아 수의 기록적인 감소에도 불구하고 소아치과에 내원한 환자의 수는 다소 증가할 것으로 예측되었다. COVID-19이라는 특수한 상황으로 인하여 실제 출생아 수와 내원 환자수가 예측치보다 다소 낮게 확인되었으나 예측 범위 내에 포함됨을 확인하였다. 시계열 분석 모형은 과거를 이해하고 미래를 예측하는 유용한 방법으로 소아치과 영역에서 저출산 시대를 대비하기 위한 기초 도구로써 유용하게 활용될 수 있을 것이다.

부산항 컨테이너 물동량을 이용한 시계열 및 딥러닝 예측연구 (Time series and deep learning prediction study Using container Throughput at Busan Port)

  • 이승필;김환성
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.391-393
    • /
    • 2022
  • 최근에는 딥러닝과 빅데이터를 기반으로 한 수요예측 기술이 전자상거래, 물류, 유통 분야의 스마트화를 가속화하고 있다. 특히, 글로벌 운송 네트워크와 현대적인 지능형 물류의 중심인 항만은 4차 산업혁명으로 인한 세계 경제 및 항만 환경의 변화에 발 빠르게 대응하고 있습니다. 항만물동량 예측은 신항만 건설, 항만확장, 터미널 운영 등 다양한 분야에서 중요한 영향을 담당하고 있다. 따라서 본 연구의 목적은 항만 물동량 예측에 자주 쓰이는 시계열 분석과 타 산업에서 좋은 결과를 도출해내고 있는 딥러닝 분석을 비교하여 부산항의 미래 컨테이너 예측에 적합한 예측모델을 제시하는 것이다. 부산항 컨테이너 물동량을 이용하여 학습시키고 그 이후 물동량 예측을 진행하였다. 또한, 상관관계 분석을 통해 물동량 변화와 관련된 외부변수를 선정하여 다변량 딥러닝 예측모델에 적용하였다. 그 결과 부산항 컨테이너 물동량만 이용한 단일변수 예측모델에서 LSTM의 오차가 가장 낮았고, 외부변수를 이용한 다변수 예측모델에서도 LSTM의 성능이 가장 우수하였다.

  • PDF

시계열분석을 통한 실적공사비의 노무비 분석 및 예측에 관한 연구 (Time Series Analysis and Forecast for Labor Cost of Actual Cost Data)

  • 이현석;이은영;김예상
    • 한국건설관리학회논문집
    • /
    • 제14권4호
    • /
    • pp.24-34
    • /
    • 2013
  • 2004년부터 정부는 무분별한 저가입찰을 방지하고, 기술 경쟁에 의한 적정 시장 가격 반영 및 효율적인 계약관련 업무를 추진하는 것을 목적으로 실적공사비 제도를 도입 시행하고 있다. 하지만 실적공사비 제도의 도입이 낙찰단가 하락에 의한 정부의 예산 절감에만 기여할 뿐, 실질적인 시장가격을 반영하고 있지 못하고 있다는 우려의 목소리 또한 꾸준히 제기되고 있는 실정이다. 낙찰단가 하락에 의한 일반건설업체의 비용 부담은 전문건설업체로 전가되며 최종적으로 건설노동자의 피해로 이어질 가능성이 크기에, 실적공사비에 적정 가격을 반영하고 현실화하는 것은 성공적인 실적공사비 제도의 정착에 매우 중요한 요소이다. 따라서 본 연구는 노무비를 중심으로 노무중심공정을 도출하고 이들의 실적공사비단가와 해당 기능공의 시중노임단가를 비교하여 실적공사비의 현실화수준을 파악하고, 시계열분석을 통해 변화를 분석하고 예측하였다. 시장가격이 반영되지 않은 낙찰 단가의 실질적 하락은 노무 환경의 변화를 가속화하고, 임금체불, 업체부도 등 건설근로자의 직접적인 피해로 이어질 수 있기에 향후 본 연구가 현행 실적공사비 제도의 문제점을 해결하고, 개선방안을 수립하기 위한 기초 자료로 활용될 수 있을 것으로 기대된다.

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

CA모형을 이용한 단기 구간통행시간 예측에 관한 연구 (A Study on Link Travel Time Prediction by Short Term Simulation Based on CA)

  • 이승재;장현호
    • 대한교통학회지
    • /
    • 제21권1호
    • /
    • pp.91-102
    • /
    • 2003
  • 본 연구는 $\circled1$Cellular Automata(이하 CA)모형을 기반으로 대규모 네트워크에 적용 가능한 보다 현실적인 CA차량모형 구축. $\circled2$구축된 CA차량모형을 이용한 차량 모의실험기의 개발과 개발된 차량 모의실험기를 이용한 단기링크통행시간 예측으로 구성된다. 구축된 CA차량추종모형은 기존의 CA차량추종모형 보다 현실적으로 감속을 통한 정지과정을 설명하면서 거시적 지표인 교통량-밀도-속도관계를 설명하였다. 또한 링크의 유출교통량(Outflow)을 제어하기 위한 차량의 링크전이모형은 기존의 차량 링크전이모형에 비하여 보다 안정된 대기차량을 형성하였다. 단기링크통행시간 예측을 위한 차량모의실험기는 대규모 가로망에 적용이 가능하도록 차량묶음(Packet, 이하차량묶음)방식과 링크기반 모의실험방식으로 컴퓨터의 연산 수행속도 및 메모리를 효율적으로 처리할 수 있었으며, 기존의 시계열자료 예측기법에서 고려할 수 없었던 차량의 행태 및 링크 상에서 발생하는 이동류 과포화, 뒷막힘현상 등의 메커니즘을 고려함으로서 기존 시계열자료 예측기법에 비하여 우수한 예측력을 보였다.

도로종류별 교통사고 추세분석 및 시제열 분석모형 개발 (Road Accident Trends Analysis with Time Series Models for Various Road Types)

  • 한상진;김근정
    • 한국도로학회논문집
    • /
    • 제9권3호
    • /
    • pp.1-12
    • /
    • 2007
  • 우리나라의 도로는 종류별로 관리주체가 서로 다르다. 고속국도는 한국도로공사, 일반국도는 건설교통부, 지방도는 광역자치단체, 시 군도는 기초자치단체에서 건설 관리 및 운영 책임을 맡고 있다. 본 연구에서는 이렇듯 관리주체가 다른 우리나라의 도로에서 발생하고 있는 교통사고발생 추세를 도로종류별로 분석하는데 목적이 있다. 이를 위해 과거로부터 축적된 도로종류별 교통사고건수, 사망자수, 부상자수의 자료를 기반으로 사고위험을 단순건수, 도로연장 당 건수, 그리고 대 km당 건수로 비교하였다. 그 결과 단순 건수에 의한 비교에서는 도시부 도로가 전 부문에서 가장 위험하고 고속국도는 전 부문에서 가장 안전한 것으로 분석되었다. 그러나 1km당 발생건수는 일반국도가 가장 위험하고 지방도가 가장 안전한 것으로 분석되었다. 교통사고 발생률을 가장 객관적으로 비교할 수 있는 지표인 10만 차량 대 km당 비교에서는 일반국도가 가장 위험하고, 고속국도가 상대적으로 안전한 것으로 분석되었다. 한편, 도로종류별 사망자수 추세를 설명하는 시계열 분석모형을 개발한 결과 고속국도, 지방도, 도시부도로의 경우 AR(1)모형이 추세를 잘 설명 할 수 있는 것으로 분석되었고, 일반국도의 경우 ARIMA(2, 3, 0)모형이 추세를 설명할 수 있는 것으로 분석되었다. 이러한 모형은 장래 교통안전계획의 목표치를 수립하거나 평가하는데 근거자료로 활용될 수 있을 것으로 보인다.

  • PDF

Wavelet Transform을 이용한 물수요량의 특성분석 및 다원 ARMA모형을 통한 물수요량예측 (Water Supply forecast Using Multiple ARMA Model Based on the Analysis of Water Consumption Mode with Wavelet Transform.)

  • 조용준;김종문
    • 한국수자원학회논문집
    • /
    • 제31권3호
    • /
    • pp.317-326
    • /
    • 1998
  • 시계열자료의 분해능력이 뛰어난 wavelet 변환을 사용하여 물소비특성을 분석하였다. Wavelet 변환의 기저함수로는 물수요량의 경우 Coiflets5 함수, 기온측정치의 경우 Coiflets3 함수를 사용하였으며 해석결과 212 scale에서 목표된 장기간에 걸친 변화추이는 hyperbolic tangent 함수의 형태로 전기간에 걸처 꾸준한 증가세를 보였다. 또한 절기혹은 경기주기와 밀접한 관련이 있을 것으로 생각되는 추가수요가 6월과 12월말을 정점으로 발생하였으며 이 추가 수요량은 하절기의 경우 $1,700\;\textrm{cm}^3/hr$, 동절기의 경우 $500\;\textrm{cm}^3/hr$ 정도인 것으로 관측되었다. 정수장 생산량 시계열자료에 내재한 주기성분은 주기가 각각 3.13day, 33.33 hr, 23.98hr와 12hr인 것으로 규명되었다. 진폭은 주기가 23,98hr인 성분이 가장 큰 것으로 밝혀졌으며 2i[i = 1,2,…12] scale에서 목도된 단주기성분들은 Gaussian PDF를 따르는 것이 확인되엇다. 잔차성분의 상호독립성, 자색파여부와 FPE의 최소화를 기준으로 할 경우 물수요량의 최적예측모형으로는 기온을 입력자료로한 다원 AR[32, 16, 23]과 다원 ARM [20, 16, 10, 23]인 것으로 판단된다.

  • PDF

Prediction Model of User Physical Activity using Data Characteristics-based Long Short-term Memory Recurrent Neural Networks

  • Kim, Joo-Chang;Chung, Kyungyong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권4호
    • /
    • pp.2060-2077
    • /
    • 2019
  • Recently, mobile healthcare services have attracted significant attention because of the emerging development and supply of diverse wearable devices. Smartwatches and health bands are the most common type of mobile-based wearable devices and their market size is increasing considerably. However, simple value comparisons based on accumulated data have revealed certain problems, such as the standardized nature of health management and the lack of personalized health management service models. The convergence of information technology (IT) and biotechnology (BT) has shifted the medical paradigm from continuous health management and disease prevention to the development of a system that can be used to provide ground-based medical services regardless of the user's location. Moreover, the IT-BT convergence has necessitated the development of lifestyle improvement models and services that utilize big data analysis and machine learning to provide mobile healthcare-based personal health management and disease prevention information. Users' health data, which are specific as they change over time, are collected by different means according to the users' lifestyle and surrounding circumstances. In this paper, we propose a prediction model of user physical activity that uses data characteristics-based long short-term memory (DC-LSTM) recurrent neural networks (RNNs). To provide personalized services, the characteristics and surrounding circumstances of data collectable from mobile host devices were considered in the selection of variables for the model. The data characteristics considered were ease of collection, which represents whether or not variables are collectable, and frequency of occurrence, which represents whether or not changes made to input values constitute significant variables in terms of activity. The variables selected for providing personalized services were activity, weather, temperature, mean daily temperature, humidity, UV, fine dust, asthma and lung disease probability index, skin disease probability index, cadence, travel distance, mean heart rate, and sleep hours. The selected variables were classified according to the data characteristics. To predict activity, an LSTM RNN was built that uses the classified variables as input data and learns the dynamic characteristics of time series data. LSTM RNNs resolve the vanishing gradient problem that occurs in existing RNNs. They are classified into three different types according to data characteristics and constructed through connections among the LSTMs. The constructed neural network learns training data and predicts user activity. To evaluate the proposed model, the root mean square error (RMSE) was used in the performance evaluation of the user physical activity prediction method for which an autoregressive integrated moving average (ARIMA) model, a convolutional neural network (CNN), and an RNN were used. The results show that the proposed DC-LSTM RNN method yields an excellent mean RMSE value of 0.616. The proposed method is used for predicting significant activity considering the surrounding circumstances and user status utilizing the existing standardized activity prediction services. It can also be used to predict user physical activity and provide personalized healthcare based on the data collectable from mobile host devices.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.