• 제목/요약/키워드: 평균절대오차

검색결과 274건 처리시간 0.042초

KOSPI200 옵션의 내재변동성 추정 (An estimation of implied volatility for KOSPI200 option)

  • 최지은;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.513-522
    • /
    • 2014
  • 옵션가격의 결정에 있어서 실제 변동성은 사후에 알 수 있는 정보이므로 대용값으로 내재변동성을 가장 많이 사용하는데 본 연구에서는 동일한 기초자산을 가진 옵션의 잔존만기와 행사가격을 이용하여 내재변동성을 추정하고자 한다. KOSPI200 옵션 데이터와 서포트벡터회귀, 나무모형 및 회귀모형을 통해 모형의 설명력을 평균제곱근오차 (RMSE)와 평균절대오차 (MAE)를 사용하여 살펴보았다. 그 결과 서포트벡터회귀와 MART의 성능이 최소제곱회귀보다 우수한 것으로 나타났으며, 서포트벡터회귀와 MART의 성능은 거의 비슷하였다.

시계열 데이터를 활용한 코로나19 동향 예측 (Covid19 trends predictions using time series data)

  • 김재호;김장영
    • 한국정보통신학회논문지
    • /
    • 제25권7호
    • /
    • pp.884-889
    • /
    • 2021
  • 국내 코로나19의 감염자 수가 백신과 사회적 거리 두기, 백신 등 여러 가지 노력 덕분에 차츰 줄어드는 듯 보였으나 2020년 2월 20일 특정한 사건 이후 감염자 수가 증가한 것처럼, 2020년 12월부터 또다시 급격히 감염자 수가 증가하는 추세이며 꾸준히 일일 500명가량의 감염자 수가 이어지고 있다. 따라서 Kaggle의 데이터셋을 이용해서 Prophet 알고리즘을 통해 미래 코로나19를 예측하고 사이킷런을 통해 결정계수, 평균 절대 오차, 평균 백분율 오차, 평균 제곱 차, 평균 제곱근 편차를 통해 이 예측에 대한 설명력을 더한다. 또한 코로나19가 급격히 특정한 사건이 없었을 경우 국내 감염자 수를 예측해 앞으로 우리가 미래의 질병에 대해서 방역과 방역 수칙 실천의 중요함을 강조한다.

인경신경망을 이용한 한국프로야구 관중 수요 예측에 관한 연구 (A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network)

  • 박진욱;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권12호
    • /
    • pp.565-572
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 연구에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial neural network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 훈련 자료로는 2015년 3월부터 9월까지의 일별 KBO 관중 수 자료를 대상으로 하였다. 전방향 신경망(Feedforward neural network)의 모형 훈련 과정에서, 그리드 탐색(Grid search)을 적용하여 최적의 초모수(Hyperparameter)를 찾고자 하였다. 그 결과, 그리드 탐색법의 최적 모형을 이용한 평균 절대 백분율 오차(MAPE)는 평균 20.9% 였다. 앙상블 기법을 이용한 모형의 MAPE는 평균 20.0%였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 26.3%, 30.3% 높은 예측력을 보인다.

Application of Informer for time-series NO2 prediction

  • Hye Yeon Sin;Minchul Kang;Joonsung Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.11-18
    • /
    • 2023
  • 본 논문에서는 딥러닝 시계열 예측 모형을 평가한다. 최근 연구에 따르면 이 모형은 ARIMA와 같은 기존 예측 모형보다 성능이 우수하다고 결론짓는다. 그 중 히든 레이어에 이전 정보를 저장하는 순환 신경망이 이를 위한 예측 모형 중 하나이다. 네트워크의 그래디언트 소실 문제를 해결하기 위해 LSTM은 데이터 흐름의 반대 방향으로 숨겨진 레이어가 추가되는 BI-LSTM과 함께 순환 신경망 내부의 작은 메모리로 사용된다. 본 논문은 서울의 2018년 1월 1일부터 2022년도 1월 1일까지의 NO2 자료에 대해 Informer의 성능을 LSTM, BI-LSTM, Transformer와 비교하였다. 이에 실제 값과 예측값 사이의 평균 제곱근 오차와 평균 절대 오차를 구하였다. 그 결과 Test 데이터(2021.09.01.~2022.01.01.)에 대해 Informer는 다른 방법에 비해 가장 높은 예측 정확도 (가장 낮은 예측 오차: 평균 제곱근 오차: 0.0167, 평균 절대 오차: 0.0138)를 보여 타 방법에 비해 그 우수성을 입증하였다. Informer는 당초 취지와 부합되게 다른 방법들이 갖고 있는 장기 시계열 예측에 있어서의 문제점을 개선하는 결과를 나타내고 있다.

라울의 법칙과 다중회귀분석법에 의한 n-Nonane+n-Decane+n-Tridecane 계의 인화점 계산 (The Calculation of Flash Point for n-Nonane+n-Decane+n-Tridecane System by Raoult's Law and Multiple Regression Analysis)

  • 하동명;이성진
    • 한국가스학회지
    • /
    • 제22권2호
    • /
    • pp.52-58
    • /
    • 2018
  • 가연성 액체 혼합물의 화재와 폭발의 위험성을 규정하는 가장 중요한 성질 중 하나는 인화점이다. 본 논문에서는 삼성분계 액체 혼합물인, n-nonane+n-decane+n-tridecane 계의 인화점을 Seta flash 밀폐식 장치를 사용하여 측정하였다. 실험값은 라울의 법칙을 이용한 방법과 다중회귀분석법에 의해 계산된 값들과 비교되었다. 라울의 법칙에 의한 계산된 결과의 절대평균오차는 $0.6^{\circ}C$이었다. 다중회귀분석법에 의해 계산된 결과의 절대평균 오차는 $0.4^{\circ}C$이었다. 절대평균오차에서 알 수 있듯이 다중회귀분석법에 의한 계산값이 라울의 법칙에 의한 계산값에 비해 측정값을 잘 모사하였다.

도시하천 소배수구역의 결측 강우량 산정 방법 비교 (Comparison of Estimation Methods for the Missing Rainfall data in a Urban Sub-drainage Area)

  • 김충수;김형섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.701-705
    • /
    • 2006
  • 강우자료는 수문 모델링 작업에서 가장 기초적인 수문학적 입력자료로 시간과 공간에 따른 변동성이 크므로 규명하기 복잡한 수문현상 중의 하나이다. 산악지역이 많은 우리나라의 지형학적 특성과 태풍, 장마 및 특히, 최근의 게릴라성 집중호우 등으로 인하여 이러한 변동성이 더욱 커지고 있는 실정이다. 장기간 실측된 수문기상 기초 자료가 부족한 우리나라의 실정상 홍수예보 및 수공구조물 설계를 위해 정확한 강우량 자료의 취득이 선행돼야 한다. 따라서 적절한 장소에 수문관측소 설치 및 관리를 통해 양호한 강우량 자료를 획득해야 하지만, 현장 여건상 등의 이유로 미계측 및 결측, 이상자료가 발생하고 있다. 따라서 이러한 미계측 혹은 결측지점의 우량을 추정할 수 있는 방법을 비교, 분석하여 적절한 보정과정을 수행할 필요가 있다. 그간의 연구에서는 미계측 지점 혹은 산악지역에서의 점 강우량 보정방법에 대한 연구가 진행되었지만, 본 연구에서는 '도시홍수재해관리기술연구사업단'에서 운영 중인 도시하천 유역 특히 소배수구역에서의 결측 자료에 대해 여러 추정 방법을 비교, 분석하여 적절한 방안을 찾고자 한다. 이를 위하여 중랑천 유역의 3개 소배수 구역(월계1 배수구역, 군자 배수구역, 어린이대공원 배수구역)에 설치된 3개 우량관측소와 건설교통부 관할 우량관측소 2개소의 우량자료를 사용하였다. 본 연구에서는 결측치 보간을 위하여 널리 이용되고 있는 산술평균법(Arithmetic Average method), 역거리법(Reciprocal Distance Squared method), 거리고도비율법(Ratio of Distance and Elevation method), 인근관측소와의 관계식 이용, 크리깅방법(Simple Kriging method)을 비교, 검토 적용하였다. 중랑천 유역의 소배수구역을 대상으로 연중 발생하는 큰 호우사상에 대해 임의의 강우관측소를 결측지점으로 가정하고 주변의 강우관측소로부터 각각의 방법을 이용해 가중치들을 산정하여 결측지점의 강우량 값을 보정하고자 하였다. 또한 각각의 방법을 이용하여 얻어진 결과에 대해 실측값과 보정값의 오차정도를 평균절대오차법(Mean Absolute Error)과 제곱평균제곱근오차법(Root Mean Squared Error)에 의해 산정하여 보정 방법간의 효율성을 검토하고자 하였다.

  • PDF

시계열모형에 의한 전력판매량 예측 (Prediction of Electricity Sales by Time Series Modelling)

  • 손영숙
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.419-430
    • /
    • 2014
  • 전력수급의 정확한 예측은 국민들의 일상적 생활 유지, 산업활동, 그리고 국가경영을 위하여 매우 중요하다. 본 연구에서는 시계열모형화에 의해 전력판매량을 예측한다. 실제 자료분석을 통하여 입력시계열로서 냉난방도일과 개입변수로 펄스함수를 사용한 전이함수모형이 다른 시계열모형에 비해서 제곱근평균제곱오차 및 평균절대오차의 의미에서 더 우수하였다.

계절과 날씨에 따른 연간 대류권 지연오차량 변화 (Comparative Analysis of Annual Tropospheric Delay by Season and Weather)

  • 임수현;김지원;박정은;배태석;홍성욱
    • 한국측량학회지
    • /
    • 제37권1호
    • /
    • pp.1-7
    • /
    • 2019
  • 본 연구에서는 GNSS (Global Navigation Satellite System) 신호가 전송되는 동안 발생하는 오차 중 대류권 지연오차를 추정하고, 이를 날씨 및 계절별 요소와 비교 분석했다. 이를 위해, 내륙지역인 충주와 평창, 해안지역인 제주, 거문도의 총 4개의 상시관측소를 선정하고, 2016년 중 매주 하루씩, 각 상시관측소마다 총 48일의 데이터를 이용하여 과학기술용 자료처리 소프트웨어로 정밀절대측위를 수행했다. 겨울철 대류권 지연오차는 평균 2400mm 미만으로, 2600mm 수준인 여름의 경우와 비교했을 때 약 200mm 가량 차이가 발생했다. 추정한 대류권 지연오차는 절대적인 지연량의 차이를 제외하면 모든 상시관측소에 대해서 변화 양상이 비슷하며, 해안지역의 지연오차가 상대적으로 크게 나타났다. 또한, 겨울에는 24시간 대류권 지연오차의 변화량이 상대적으로 적으며, 평균적인 대류권 지연오차는 상시관측소의 표고와 직접적인 관계가 있는 것으로 나타났다. 건조하고 온도 차이가 큰 내륙지역에서는 습도보다 강수량에 영향을 받은 대류권 지연오차의 변화가 발생하고, 다습한 해안지역에서는 강수보다 바다의 습도로 인한 변화가 큰 것으로 판단된다. 온도와 증기압의 상관계수는 모든 지역에서 0.9 이상을 나타냈으며, 대류권 지연오차는 온도와 높은 선형적 상관성을 보였다. 향후 연간 데이터 전체를 이용하여 시간적 해상도를 높인 연구분석을 수행함으로써 보다 신뢰도 높은 상관성 분석이 이루어질 필요가 있다.

인공 신경망 모형을 이용한 한국프로야구 관중 수요 예측 (A Prediction of Demand for Korean Baseball League using Artificial Neural Network)

  • 박진욱;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.920-923
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 분석에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial Neural Network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 인공신경망의 가장 기본적인 종류인 전방향 신경망(Feedforward Neural Network)의 초모수(Hyperparameter) 선정에 그리드 탐색(Grid Search)을 적용하여 최적의 모형을 찾고자 하였다. 훈련 자료로는 2015년 3월부터 8월까지의 일별 KBO 관중 수 자료를 대상으로 하였고, 예측력 검증을 위해 2015년 9월 관중 수를 예측하여 실제 관측값과 비교하였다. 그 결과, 그리드 탐색법에서 최적 모형이라고 판단한 모형의 예측력은, 평균 절대 백분율 오차(MAPE) 기준으로 평균 27.14% 였다. 또한, 앙상블 기법에서 착안하여 오차율이 낮은 모형 5개의 예측값 평균의 MAPE는 평균 28.58% 였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 14%, 13.6% 높은 예측력을 보이고 있다.

우적 크기 탐지기 신호로 산출한 정량적 운동에너지 (Quantitative Kinetic Energy Estimated from Disdrometer Signal)

  • 마르시아 모라에스;엘사 삼파이오;히까르도 테노리오;윤홍주;권병혁
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.153-160
    • /
    • 2020
  • Brazil Alagoas 주의 동부 지역에서 우적 크기를 측정하는 디즈드로미터(disdrometer)로 산출한 강우량과 강우율의 관계로 우적의 역학 에너지가 예측되었다. 강우의 시작과 끝에서 측정되는 약한 강우 강도에서는 지수 형태의 방정식이 큰 우적의 영향을 억제하였다. 빗방울의 역학 에너지는 거의 모든 강우 강도 범위에서 과소평가 되었다. 결정 계수, 평균 절대 오차, 상대 오차 비율, 평균 절대 오차, 평균 제곱 오차, Willmott의 일치 지수 및 신뢰 지수와 같은 성과 지표에 기반을 두어 예측된 강우 역학 에너지가 유용한 결과로 평가되었다.