• 제목/요약/키워드: 시계열 데이터 분석

검색결과 737건 처리시간 0.05초

오차수정모형과 그래프 이론을 이용한 국제유가의 동시 및 단기 가격발견과정에 관한 연구 (A Study on Price Discovery Process for International Crude Oil using Error Correction Model and Graph Theory)

  • 박호정;윤원철
    • 자원ㆍ환경경제연구
    • /
    • 제15권3호
    • /
    • pp.479-504
    • /
    • 2006
  • 국제원유시장에서 대표적인 WTI, 브렌트, 두바이유의 현물 및 선물 가격 간의 인과관계를 분석함으로써 국제유가의 가격발견과정을 연구한다. 비순환성 그래프에서 도출된 국제유가의 동시적 인과관계를 이용하여 오차수정모형에서 유가간의 단기인과관계를 분석한다. 1999년 1월 4일~2005년 7월 15일까지의 시계열 데이터를 이용한 동시적 인과관계의 분석 결과 WTI 현물과 선물 가격에 대한 두바이의 동시적 영향은 통계적으로 유의미하지 않은 것으로 나타났으며, 반면 브렌트 현물 및 선물 가격에 대한 두바이의 영향은 유의미한 것으로 확인되었다. 단기적으로는 브렌트 가격의 확률충격 상당부분이 WTI에 의해 설명되는 것으로 나타났다. 이러한 결과는 브렌트가 두바이와 WTI를 연결하고 있어, 마커원유로서 브렌트에 더욱 주목할 필요가 있음을 시사한다.

  • PDF

앙상블 학습과 온도 변수를 이용한 A 호텔의 전력소모량 예측 (Prediction of electricity consumption in A hotel using ensemble learning with temperature)

  • 김재휘;김재희
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.319-330
    • /
    • 2019
  • 과거의 전력소모량을 분석하여 미래의 전력소모량을 예측하는 것은 에너지 계획과 정책 결정에 있어 많은 이점을 가져다준다. 기계학습은 최근 전력소모량을 예측하는 분석 방법으로 많이 사용하고 있다. 그중 앙상블 학습은 모형의 과적합 현상을 방지하고 분산을 줄여 예측의 정확성을 높이는 방법으로 알려져 있다. 하지만 일별 데이터에 앙상블 학습을 적용했을 때 분석 방법의 특성으로 인해 피크를 잘 나타내지 못하고 중심값으로 예측하는 단점을 보였다. 본 연구에서는 앙상블 학습 전에 온도 변수와의 상관성을 고려하여 선형모형으로 적합함으로써 앙상블 학습의 단점을 보완한다. 그리고 9개의 모형을 비교한 결과 온도 변수를 선형모형으로 적합하고 랜덤포레스트를 사용한 모형이 결과가 가장 좋음을 보여준다.

주성분 분석을 활용한 재현자료 생성 (Synthetic data generation by probabilistic PCA)

  • 박민정
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.279-294
    • /
    • 2023
  • 재현자료를 생성할 때 순차회귀 다중대체(SRMI)를 이용하는 방식이 가장 널리 알려져 있으며, 이를 구현한 소프트웨어로 R-패키지 synthpop이 활용되고 있다. 본 논문에서는 확률적 주성분 분석(PPCA)을 이용하여 재현자료를 생성하는 방안을 제안하고 2개의 데이터 세트를 이용한 모의실험으로 SRMI 방식과 PPCA 방식을 비교하였다. 모의실험에서 PPCA 방식으로 생성한 재현자료는 쌍별 상관계수를 기준으로 원자료와의 유사성이 가장 우수함을 확인하였다. 향후 PPCA 방식을 이용하여 시계열 자료에 대한 재현자료 생성을 연구하고자 한다.

다이나믹 토픽 모델을 활용한 D(Data)·N(Network)·A(A.I) 중심의 연구동향 분석 (Investigation of Research Trends in the D(Data)·N(Network)·A(A.I) Field Using the Dynamic Topic Model)

  • 우창우;이종연
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.21-29
    • /
    • 2020
  • 최근 디지털 사회의 도래로 다양한 데이터가 폭발적으로 증가하고, 그중 문헌 내 주제어를 도출하는 토픽 모델링에 관한 연구가 활발히 진행되고 있다. 본 논문의 연구목표는 토픽 모델링 방법 중 하나인 DTM(Dynamic Topic Model) 모델을 적용해 D.N.A.(Data, Network, A.I) 분야에 대한 연구동향을 탐색하는데 있다. 실험 데이터는 최근 6년간(2015~2020) ICT(Information and Communication Technology) 분야 중 기술대분류가 SW·AI에 해당하는 연구과제 1,519개 사업에 대해 DTM 모델을 적용하였다. 실험결과로, D.N.A. 분야의 기술 키워드 Big data, Cloud, Artificial Intelligence와 확장된 의미의 기술 키워드 Unstructured, Edge Computing, Learning, Recognition 등이 매년 연구에 표출되었으며, 해당 키워드 들이 특정 연구과제에 종속되지 않고 다른 연구과제에서도 포괄적으로 연구되고 있음을 확인하였다. 끝으로 본 논문의 연구결과는 향후 D.N.A. 분야에 대한 정책기획·과제기획 등 연구개발 기획 과정과 기업의 기술 확보전략·마케팅 전략 등 다양한 곳에 활용될 수 있을 것으로 기대한다.

Prediction of Solar Photovoltaic Power Generation by Weather Using LSTM

  • Lee, Saem-Mi;Cho, Kyu-Cheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.23-30
    • /
    • 2022
  • 딥러닝은 주가 및 농산물 가격 예측과 같이 데이터를 분석해 일련의 규칙을 발견하고 미래를 예상해 우리의 삶에서 다양한 도움을 주고 있다. 본 연구는 태양광 에너지 사용의 중요성이 늘어나는 상황에서 기상에 따른 태양광 발전 실적을 딥러닝을 통해 분석하고 발전량을 예측한다. 본 연구에서는 시계열 데이터 예측에서 두각을 나타내고 있는 LSTM(Long Short Term Memory network)을 사용한 모델을 제안하며 이미지를 비롯한 다양한 차원의 데이터를 분석할 때 사용되는 CNN(Convolutional Neural Network)과 두 모델을 결합한 CNN-LSTM과의 성능을 비교한다. 세 가지 모델의 성능은 태양광 발전 실적의 실제값과 딥러닝을 통해 예측한 값으로 MSE, RMSE, 결정계수를 계산하여 비교하였고 그 결과 LSTM 모델의 성능이 가장 우수한 것으로 나타났다. 따라서 본 연구는 LSTM을 사용한 태양광 발전량 예측을 제안한다.

특허 데이터 분석을 통한 헬스케어 기술 트렌드 연구 (A Study On the Healthcare Technology Trends through Patent Data Analysis)

  • 한정현;현영근;채우리;이기현;이주연
    • 디지털융복합연구
    • /
    • 제18권3호
    • /
    • pp.179-187
    • /
    • 2020
  • 지속적인 인구 증가율 하락에도 불구하고 평균 수명 상승에 따라 인구 고령화가 빠르게 진행되고 있는 사회환경에서 기술의 진화 및 소득 수준의 상승을 기반으로 건강과 삶의 질에 대한 관심이 증가하며 헬스케어 서비스 시장은 급속히 성장하고 있는 현실이다. 이에 본 연구에서는 2000년부터 2019년 10월까지 특허정보넷(KIPRIS)에 게재된 헬스케어 관련 한국과 미국의 특허데이터를 대상으로 Keyword를 추출한 후 빈도 분석, 시계열 분석, Keyword Network 분석을 수행하였으며, 이를 통하여 헬스케어 분야의 핵심 Keyword가 전통적인 의료 관련 Keyword에서 ICT관련 Keyword로 변화하고 있는 기술 트렌드가 파악되었다. 또한 미국과 비교하여 핵심 Keyword들이 55% 유사한 분포를 보이지만 특허생산량 면에서 절대적인 격차를 확인하였다. 향후에는 핵심 Keyword에 대하여 국내외 연구동향 등 다양한 자료를 분석하여 글로벌 시장에서 유의미한 시사점을 얻을 수 있는 연구를 진행하고자 한다.

부산광역시 온천천 유역의 RNN-LSTM 알고리즘을 이용한 DO농도 예측 (Prediction of the DO concentration using the RNN-LSTM algorithm in Oncheoncheon basin, Busan, Republic of Korea)

  • 임희성;안현욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.86-86
    • /
    • 2021
  • 온천천은 부산광역시 금정구, 동래구, 연제구를 흐르는 도심 하천으로 부산 시민들의 도심 속 산책길, 자전거 길 등으로 활용되는 도시하천이다. 그러나 온천천 양안의 동래 곡저 평야가 시가지화 되고 온천천 발원지인 금정산 주변에서 무허가 상수도를 사용하고 각종 쓰레기와 하수의 유입으로 인해 하천 전체가 하수관으로 변해왔다. 이에 따라 부산광역시는 온천천 정비 계획을 시행하여 하천 정비와 함께 자동측정망을 설치하여 하천의 DO (dissolved oxygen), 탁도, TDS농도 등 자료를 수집하고 있다. 그러나 자동측정망으로 쌓여가는 데이터를 활용하여 DO농도 예측은 거의 이뤄지지 않고 있다. DO는 하천의 수질 오염 정도를 판단하는 수질인자로 역사적으로 하천 연구의 주요 연구 대상이 되어 왔다. 본 연구에서는 일 자료 뿐만 아니라 시 자료를 기반으로 RNN-LSTM 알고리즘을 활용한 DO예측을 시도하였다. RNN-LSTM은 시계열 학습에 뛰어난 알고리즘으로 인공신경망의 발전된 형태인 순환신경망이다. 연구에 앞서 부산광역시 보건환경정보 공개시스템으로부터 받은 자료 중에서 교정, 보수 중, 비사용, 장비전원단절 등으로 인해 누락데이터를 2014년 1월 1일부터 2018년 12월 31일의 데이터 전수조사 후 이상데이터를 확인하여 선형 보간하여 데이터를 사용하였다. 연구에서는 Google에서 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하여 부산광역시 금정구 부곡동에 위치한 부곡교 관측소의 DO농도를 시간 또는 일 예측을 하였다. 일 예측 학습에는 2014년~ 2018년의 기상자료(기온, 상대습도, 풍속, 강수량), DO농도 자료를 사용하였고, 시 예측 학습에는 연속된 자료가 가장 많은 2015년 3월 ~ 12월까지의 데이터를 활용하여 연구를 진행하였다. 모형의 검증을 위해 결정계수(R square)를 이용하여 통계분석을 실시하였다.

  • PDF

개별 주가에 반영된 시변 무리행동 연구 (Study on time-varying herd behavior in individual stocks)

  • 박범조
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.423-436
    • /
    • 2011
  • 정보기술의 발달과 함께 금융 자유화 확대 및 글로벌 금융시장의 동조화 등으로 인해 금융시장의 변동성이 현저하게 증폭되는 현상을 나타내고 있다. 최근 행태경제학 분야에서 이에 대한 주요 원인으로 금융시장의 무리행동에 대한 이론적 연구가 활발하게 진행되고 있지만 무리행동의 동적 속성에 대한 계량적 측정이 쉽지 않기 때문에 무리행동의 시계열적 속성을 파악할 수 있는 경험적 연구는 거의 전무하다. 따라서 본 연구는 QR-GARCH (quantile regression for generalized autoregressive conditional heteroskedasticity)모형을 이용하여 시변 무리행동을 시계열적으로 측정할 수 있는 무리 행동 측정법을 새롭게 제안하였다. 이 무리행동 측정법의 유용성과 개별 주가의 시변 무리행동 행태를 분석하기 위해 기업 규모별 세 그룹 (대기업, 일반기업, 소기업)으로 나눈 개별 주가 자료를 이용한 실증분석 결과를 수행하였으며 몇 가지 의미 있는 사실을 발견하였다. 우선 일부 대기업을 제외한 대부분의 주식 거래자에게서 무리행동이 발생하고 있으며 특히 일반기업 주식 거래자들의 경우 대기업과 소기업 주식 거래자들에 비해 강한 무리행동과 함께 심한 무리행동의 변화를 보여준다. 또한 예상과 달리 일부 무리행동 파라미터 시계열 자료에서 자기상관이 지속적으로 나타나고 있는데 이런 결과는 기업에 따라 주식 거래자의 쏠림현상이 오래 지속될 수도 있음을 의미한다.

부산항 항만안전 주요 이슈 동향에 관한 연구 (A Study on Trends of Key Issues in Port Safety at Busan Port)

  • 이정민;하도연;김주혜
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.34-48
    • /
    • 2024
  • 글로벌 공급망에 예측 불가능한 위험성이 확산되면서 세계의존도가 높은 항만물류산업의 위험부담이 높아지고 있다. 이에 본 연구에서는 기초적인 연구로 국내 항만의 안전성에 위험을 주는 다양한 이슈들을 알아보고자 하였다. 이를 위해 부산항의 항만안전과 관련된 뉴스 기사 데이터를 활용하여 LDA토픽모델링 분석과 시계열 선형회귀분석을 진행하였고 부산항 항만안전 주요 이슈들의 변화와 그 동향을 파악하였다. 본 연구의 분석 결과는 다음과 같다. 지난 30년동안 부산항 항만안전과 관련된 주요 이슈는 총 9개이며 이들을 5년 주기의 시기별로 살펴본 결과, 지난 30년 동안 해상안전 이슈, 수입화물 검역 안전 이슈, 노조파업 관련 이슈, 자연재해 관련 이슈가 지속해서 등장했다. 부산항 항만안전 주요 이슈는 주로 예측 불가능한 성격이 큰 사회환경적 유형과 자연현상적 유형으로 글로벌 불확실성의 영향을 많이 받고 있음을 알 수 있었다. 따라서 분석 결과로 도출된 항만안전 주요 이슈들을 위주로 부산항 항만안전 강화를 위한 정책을 체계적으로 수립할 필요가 있으며 예측 불가능한 위험상황을 대비한 부산항 항만안전 회복탄력성을 강화할 필요가 있다. 끝으로 다양하게 변화하는 사회적 여건에 맞춰 항만안전 강화를 도모할 수 있는 선진적인 연구 활동이 필요할 것이다.

변기 및 세탁기 가정용수 사용량의 시계열모형 연구 (An analysis of time series models for toilet and laundry water-uses)

  • 명성민;김동건;이두진;김화수;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1141-1148
    • /
    • 2013
  • 가정용수의 용도별 사용량은 주거형태, 거주자 생활양식, 주택구조 등의 내부적인 요인과 온도, 날씨, 수도요금 등과 같은 외부요인들의 영향을 받게 된다. 장기적으로는 거주민의 생활양식, 주거형태, 수도관련 시설의 변화에 따라 사용량이 점진적으로 변화하게 되며, 단기적으로는 기온이나 가뭄과 같은 기후조건이나 절수정책과 같은 인위적인 영향에 의해 사용량이 크게 변화하기도 한다. 본 연구에서는 가정에서 사용하고 있는 변기 및 세탁기 용수의 물 사용량 특성을 파악하기 위하여 전국을 대상으로 실측자료를 모니터링하고 각 사용량의 기준이 되는 원단위 (${\ell}pcd$; liter per capita day)를 도출하였으며 향후 가정용수 사용량 예측을 위하여 변기 및 세탁기 용수를 대상으로 오차항이 자기상관을 따르는 시계열 회귀모형을 이용하였다. 분석결과, 자기회귀오차 모형으로 변기 및 세탁기 용수의 사용량을 71% 정도 설명할 수 있다.