• 제목/요약/키워드: 시계열 데이터 분석

검색결과 731건 처리시간 0.023초

퍼지 모델을 이용한 일별 주가 예측 (Daily Stock Price Prediction Using Fuzzy Model)

  • 황희수
    • 정보처리학회논문지B
    • /
    • 제15B권6호
    • /
    • pp.603-608
    • /
    • 2008
  • 본 논문에서는 주가의 일별 시가, 종가, 최고가, 최저가를 예측하기 위한 퍼지모델을 제안한다. 주가는 시장의 여러 경제 변수에 의존하므로 주가예측 모델의 입력변수를 선택하는 것은 쉽지 않은 일이다. 이와 관련하여 많은 연구가 있지만 정답이 있는 것은 아니다. 본 논문에서는 이를 해결하기 위해 주가 움직임 자체에 주목하는 스틱차트의 기술적 분석에 이용되는 정보를 퍼지규칙의 입력변수로 선택한다. 퍼지규칙은 사다리꼴 멤버쉽함수로 이루어진 전건부와 비선형 수식의 후건부로 구성된다. 최적의 퍼지규칙으로 구성된 퍼지모델을 찾아내기 위해 차분진화가 사용된다. 본 논문에 제안된 방법은 수치 예를 통해 다른 방법과의 비교로 타당성이 검토되며 KOSPI(KOrea composite Stock Price Index) 일별 데이터를 사용, 주가예측 퍼지모델을 구축하고 신경회로망 모델과 비교, 검토된다.

외재적 변수를 이용한 딥러닝 예측 기반의 도시가스 인수량 예측 (Deep Learning Forecast model for City-Gas Acceptance Using Extranoues variable)

  • 김지현;김지은;박상준;박운학
    • 한국가스학회지
    • /
    • 제23권5호
    • /
    • pp.52-58
    • /
    • 2019
  • 본 연구에서는 국내 도시가스 인수량에 대한 예측 모델을 개발하였다. 국내의 도시가스 회사는 KOGAS에 차년도 수요를 예측하여 보고해야 하므로 도시가스 인수량 예측은 도시가스 회사에 중요한 사안이다. 도시가스 사용량에 영향을 미치는 요인은 용도구분에 따라 다소 상이하나, 인수량 데이터는 용도별 구분이 어렵기 때문에 특정 용도에 관계없이 영향을 주는 요인으로 외기온도를 고려하여 모델개발을 실시하였다.실험 및 검증은 JB주식회사의 2008년부터 2018년까지 총 11년 치 도시가스 인수량 데이터를 사용하였으며, 전통적인 시계열 분석 중 하나인 ARIMA(Auto-Regressive Integrated Moving Average)와 딥러닝 기법인 LSTM(Long Short-Term Memory)을 이용하여 각각 예측 모델을 구축하고 두 방법의 단점을 최소화하기 위하여 다양한 앙상블(Ensemble) 기법을 사용하였다. 본 연구에서 제안한 일별 예측의 오차율 절댓값 평균은 Ensemble LSTM 기준 0.48%, 월별 예측의 오차율 절댓값 평균은 2.46%, 1년 예측의 오차율 절댓값 평균은 5.24%임을 확인하였다.

주가 예측 모델에서의 분할 예측을 통한 성능향상 탐구 (Exploring performance improvement through split prediction in stock price prediction model)

  • 여태건우;유도희;남정원;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.503-509
    • /
    • 2022
  • 본 논문의 연구 취지는 예측하고자 하는 다음 날과 이전 날의 시가 사이 변동률을 예측값으로 두고 시가를 예측하는 기존 논문들과는 다르게 예측하고자 하는 다음날의 주가 순위를 일정한 간격으로 분할하여 생성된 각 구간마다의 시가 변동률을 예측값으로 하는 모델을 통하여 최종적인 다음날의 시가 변동률을 예측하는 새로운 시계열 데이터 예측 방식을 제안하고자 한다. 예측값의 세분화 정도와 입력 데이터의 종류에 따른 모델의 성능 변화를 분석했으며 연구 결과 예측값의 세분화 정도에 따른 모델의 예측값과 실제값의 차이가 예측값의 세분화 개수가 3일 때 큰 폭으로 감소한다는 사실도 도출해 낼 수 있었다.

센서·OPC-UA 시뮬레이션을 통한 엣지 기반 경량화 플랫폼 스토리지 엔진 평가 (Evaluation of Storage Engine on Edge-Based Lightweight Platform using Sensor·OPC-UA Simulator)

  • 조우진;여채은;구재회;임채영
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.803-809
    • /
    • 2023
  • 본 논문은 공장에너지관리시스템에 필수적인 데이터 수집 시스템을 엣지 기반 경량화 플랫폼에서 최적으로 구축하고자 분석 및 평가한다. 실증 중인 제조 공장의 센서를 기반으로 시뮬레이션 하여 센서/OPC-UA 시뮬레이터를 개발하였으며, 개발한 시뮬레이터를 통해 엣지 디바이스의 스토리지 엔진을 평가한다. 엣지 디바이스에서 스토리지 엔진에 따른 성능을 평가하여 최적의 스토리지 엔진을 제시한다. 실험 결과 스토리지 엔진을 RoccksDB로 사용하였을 때 InnoDB를 사용하였을 때에 비해 절반 이하의 메모리와 데이터베이스 크기를 지니며 3.01배 빠른 소요시간을 지니는 것을 알 수 있다. 이 연구는 한정된 자원을 사용하는 디바이스에서 시계열 데이터를 관리할 때 유리한 스토리지 엔진을 선택할 수 있으며, 센서/OPC 시뮬레이터를 통한 해당 분야 추가 연구에 기여한다.

LSTM Networks 딥러닝 기법과 SWAT을 이용한 유량지속곡선 도출 및 평가 (A study on the derivation and evaluation of flow duration curve (FDC) using deep learning with a long short-term memory (LSTM) networks and soil water assessment tool (SWAT))

  • 최정렬;안성욱;최진영;김병식
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1107-1118
    • /
    • 2021
  • 지구온난화로 인해 발생한 기후변화는 한반도의 홍수, 가뭄 등의 발생빈도를 증가시켰으며, 이로 인해 인적, 물적 피해가 증가한 것으로 나타났다. 수재해 대비 및 대응을 위해서는 국가 차원의 수자원 관리 계획 수립이 필요하며, 유역 단위 수자원 관리를 위해서는 장기간 관측된 유량 자료를 이용하여 도출된 유량지속곡선이 필요하다. 전통적으로 수자원 분야에서 유량지속곡선을 도출하기 위하여 물리적 기반의 강우-유출 모형이 많이 사용되고 있으며, 최근에는 데이터 기반의 딥러닝 기법을 이용한 유출량 예측 기법에 관한 연구가 진행된 바 있다. 물리적 기반의 모형은 수문학적으로 신뢰도 높은 결과를 도출할 수 있으나, 사용자의 높은 이해도가 요구되며, 모형 구동 시간이 오래 걸릴 수 있는 단점이 있다. 데이터 기반의 딥러닝 기법의 경우 입력 자료가 간단하며, 모형 구동 시간이 비교적 짧으나 입력 및 출력자료 간의 관계가 블랙박스로 처리되어 수리·수문학적 특성을 반영할 수 없는 단점이 있다. 본 연구에서는 물리적 기반 모형으로 국내외에서 적용성이 검증된 Soil Water Assessment Tool (SWAT)의 매개변수 보정(Calibration)을 통해 장기간의 결측치 없는 데이터를 산출하고, 이를 데이터 기반 딥러닝 기법인 Long Short-term Memory (LSTM)의 훈련(Training) 데이터로 활용하였다. 시계열 데이터 분석 결과 검·보정 전체 기간('07-'18) 동안 Nash-Sutcliffe Efficiency (NSE)와 적합도 비교를 위한 결정계수는 각각 0.04, 0.03 높게 도출되어 모형에서 도출된 SWAT의 결과가 LSTM보다 전반적으로 우수한 것으로 나타났다. 또한, 모형에서 도출된 연도별 시계열 자료를 내림차순하여 산정된 유량지속곡선과 관측유량 기반의 유량지속곡선과 비교한 결과 NSE는 SWAT과 LSTM 각각 0.95, 0.91로 나타났으며, 결정계수는 0.96, 0.92로 두 모형 모두 우수한 성능을 보였다. LSTM 모형의 경우 저유량 부분 모의의 정확도 개선이 필요하나, 방대한 입력 자료로 인해 모형 구축 및 구동 시간이 오래 걸리는 대유역과 입력 자료가 부족한 미계측 유역의 유량지속곡선 산정 등에 활용성이 높을 것으로 판단된다.

인공지능 기반 콩 생장분석 방법 연구 (A Study on the Artificial Intelligence-Based Soybean Growth Analysis Method)

  • 전문석;김영태;정유석;배효준;이채원;김송림;최인찬
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.1-14
    • /
    • 2023
  • 콩은 세계 5대 식량작물 중 하나로 식물성 단백질의 주요 공급원이다. 작물 특성상 기후변화에 따라 곡물 생산량에 큰 영향을 받기 때문에 국립농업과학원에서는 콩 품종별 생장 분석을 통해 작물표현형 연구를 진행중이다. 콩 품종별 생장 분석을 위한 생장 과정 사진 촬영은 자동화된 시스템으로 이루어지지만 생장 상태를 확인, 기록, 분석하는 과정은 수작업으로 진행되고 있다. 본 논문에서는 이러한 과정을 자동화 할 수 있도록 콩 작물의 영상 데이터에서 콩잎 객체를 검출하는 YOLOv5s 모델과 검출된 콩잎의 전개 여부를 판단하는 합성곱 신경망(Convolution Neural Network; CNN) 모델을 설계, 학습하였다. 두 모델을 결합하고 검출된 콩잎의 좌표데이터로 층을 구분하는 알고리즘을 구현하여 콩 작물의 시계열 데이터를 입력하여 생장을 분석하는 프로그램을 개발하였고, 그 결과 콩 작물의 제2~3복엽까지 생장 시기를 판단할 수 있었다.

Granger-Sims 인과관계검정을 통한 전자상거래의 택배서비스시장에 대한 인과성(因果性) 분석 (Causality of E-Commerce on the Door-to-door Delivery Service Market Using the Granger-Sims Causality Test)

  • 이우승
    • 대한교통학회지
    • /
    • 제22권3호
    • /
    • pp.69-84
    • /
    • 2004
  • 1990년대 중반이후 정보통신의 발달에 의한 인터넷의 활용이 전세계적으로 급속히 팽창하면서 사이버마켓이라는 새로운 시장형태하에서 전자상거래가 급속히 성장하고 있다. 인터넷 전자상거래의 성장은 기존의 유통구조를 오프라인으로부터 온라인으로 전환시키고 물류체계까지 변화시키고 있다. 전자상거래의 경우 인터넷과 같은 정보시스템의 발달에 의해 독자적으로 성장할 수 있는 것은 아니며, 실제거래를 위한 물류와 연계해서만이 가능하다. 따라서 전자상거래의 급속한 성장과 더불어 문전배송서비스(door-to-door delivery service)가 가능한 택배서비스가 급속히 증가하고 있다. 이러한 관점에서 도시내에서의 전자상거래에 의한 택배서비스시장 환경변화를 고려하여 전자상거래를 촉진시키는 어떤 요인이 택배서비스에 영향을 미치고 성장에 중요한 역할을 하는지를 파악해 보는 것도 흥미있는 일이라 하겠다. 본 연구는 시계열데이터를 이용하여 전자상거래에 의한 택배서비스시장의 상관관계를 검토하고 전자에 의한 후자의 성장요인을 분석해 보는데 그 목적이 있다. 본 연구에서는 택배서비스시장의 성장요인을 시장내부의 내적요인과 외부의 외적요인으로 구분하고, 외적요인을 다시 교통요인과 사회경제적 요인으로 구분하여 전자상거래를 사회경제적 요인으로 간주하였다. 그리고 이 사회경제적 요인으로서의 전자상거래에 의한 택배서비스시장의 인과관계성을 그랜저-심즈(Granger-Sims) 인과관계검정을 이용하여 분석하였다. 분석결과, 한국의 전자상거래는 EDI(전자문서교환)도입업체수, 인터넷 쇼핑몰수, 인터넷 이용자수, 전자상거래를 위한 법제도 체계 등의 증가에 의해 촉진되었으며, 이에 따라 택배서비스시장도 성장한 것으로 나타났다. 특히 정부주도에 의한 정보화추진이 전자상거래를 촉진시켜 택배서비스시장에 영향을 미친 것으로 분석되었다.

Attention 기법을 적용한 LSTM-s2s 모델 기반 댐유입량 예측 연구 (Prediction of dam inflow based on LSTM-s2s model using luong attention)

  • 이종혁;최수연;김연주
    • 한국수자원학회논문집
    • /
    • 제55권7호
    • /
    • pp.495-504
    • /
    • 2022
  • 최근 인공지능의 발전으로 시계열 자료 분석에 효과적인 Long Short-Term Memory (LSTM) 모델이 댐유입량 예측의 정확도를 높이는 데 활용되고 있다. 본 연구에서는 그 중 LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence (s2s) 구조에 Attention 기법을 LSTM 모델에 첨가하여 소양강댐 유역의 유입량을 예측하였다. 분석 데이터는 2013년부터 2020년까지의 유입량 시자료와 종관기상관측기온 및 강수량 자료를 학습, 검증, 평가로 나누어 훈련한 후, 모델의 성능 평가를 진행하였다. 분석 결과, LSTM-s2s 모델보다 attention까지 첨가한 모델이 일반적으로 더 좋은 성능을 보였으며, attention 첨가 모델이 첨두값도 더 잘 예측하는 모습을 보였다. 그리고 두 모델 모두 첨두값 발생 동안 유량 패턴을 잘 반영하였지만 세밀한 시간 단위 변화량에는 어려움이 있었다. 이를 통해 시간 단위 예측의 어려움에도 불구하고, LSTM-s2s에 attention까지 첨가한 모델이 기존 LSTM-s2s의 예측 성능을 향상할 수 있음을 알 수 있었다.

집수역 규모 무인기상관측망을 위한 실황자료 표출시스템 구축 (Implementation of a Real-time Data Display System for a Catchment Scale Automated Weather Observation Network)

  • 정명룡;김진희;문영일;윤진일
    • 한국농림기상학회지
    • /
    • 제15권4호
    • /
    • pp.304-311
    • /
    • 2013
  • 악양기상관측망을 대상으로 소형 서버 기반의 기상자료 실시간 표출시스템을 구축하였다. 시스템은 기상관측장비로부터 실시간으로 수집되는 1분간격의 기상자료를 DB로 구축하는 데이터수집 단계와 최대, 최소, 평균, 적산 등의 통계처리에 의해 10분, 1시간, 1일간격의 기상자료를 생성하는 데이터통계 단계, 데이터수집과 통계처리 단계에서 수집된 DB정보를 활용하여 웹서비스 형태로 자료를 보여주는 정보서비스 단계로 각각 구성하였다. DB에 수집된 AWS 기상실황자료는 웹페이지에서 1개 지점, 전체지점, 분석자료의 형태로 서비스하며, 원하는 기간에 대한 기상요소를 사용자가 선택하여 다운로드 받을 수 있도록 구축하였다. 1개 지점에 대한 악양 AWS 정보서비스 페이지에서는 선택한 AWS지점에 대해 시계열 변화추이를 살펴볼 수 있으며, 전체지점에 대한 페이지에서는 악양면 내 고도와 지형특성에 따라 달라지는 기상반응을 지점별로 비교분석 할 수 있도록 서비스를 제공한다. 일별 분석자료 페이지는 하루 동안 수집된 1분 간격 데이터를 요소별로 통계처리하여 테이블 형태로 보여주도록 구성하였다.

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.