• Title/Summary/Keyword: 데이터예측

Search Result 6,642, Processing Time 0.065 seconds

The Performance evaluation of Data Value Predictor in ILP Processor (ILP 프로세서에서 데이터 값 예측기의 성능 평가)

  • 박희룡;전병찬;이상정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.21-23
    • /
    • 1998
  • 본 논문에서 ILP (Instruction Level Parallelism)의 성능향상을 위하여 데이터 값들을 미리 예측하여 병렬로 이슈(issue)하고 수행하는 기존의 데이터 값 예측기(data value predictor)를 비교 분석하여 각 예측기의 예측율을 측정하고, 2-단계 데이터 값 예측기(Two-Level Data Value Predictor)와 혼합형 데이터 값 예측기(Hydrid Data Value Predictor)에서 발생되는 aiasing 을 측정하기 위해 수정된 데이터 값 예측기를 사용하여 측정한 결과 aliasing은 50% 감소하였지만 예측율에는 영향을 미치지 못함과 데이터 값 예측기의 예측율을 측정한 결과 혼합형 데이터 값 예측기의 예측율이 2-단계 데이터 값 예측기와 스트라이드 데이터 값 예측기(Stride Data Value Predictor)에서 평균 5.7%, 최근 값 예측기(Last Data Value Predictor)보다는 평균 38%의 예측 정확도가 높음을 입증하였다.

  • PDF

A Prediction of Baseball Game Results Using Recurrent Neural Netowrks (순환신경망을 활용한 야구승부예측)

  • Jeong, Kyeong-Seok;Kim, Jin-Hak;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.

A Study on Design of Metadata Management Demonstration System for damage prediction from storm and flood (풍수해 피해예측지도 메타데이터 관리 시범 시스템 설계에 대한 연구)

  • Lim, So Mang;Baeck, Seung Hyub;Hwang, Eui Ho
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.472-472
    • /
    • 2017
  • 재해로 인한 피해가 급증함에 따라 이를 예방하기 위한 풍수해 피해예측의 필요성이 증가하였고 관련된 다양한 연구가 진행되고 있다. 타 부처 및 각 지자체에서는 각종 재해지도들을 작성하여 만들어진 재해지도는 작성 유형과 방법 등에 따라 다양한 데이터와 서로 다른 정보를 포함하고 있어 데이터 정보를 표준화 시키고 필요한 정보를 효율적으로 찾아 연계 활용하기 위하여 본 연구를 수행하고자 한다. 메타데이터란 데이터에 대한 정보를 의미하며 데이터 변화의 근원과 변화의 흐름을 말한다. 메타데이터 관련 표준으로는 ISO19115(국제표준), KSXISO19115(국가표준), TTAS.KO-10.0139(유통목록 표준), TTAS.IS-19115(관리용 표준)이 있다. 본 연구에서는 국제표준을 준용하여 풍수해 피해 예측지도의 체계적 관리를 위한 메타데이터 설계 및 관리 시스템 구축 방안을 제시하고자 하였다. 풍수해 피해예측지도 메타데이터 관리 시범 시스템 구축을 위한 표준, 정보의 특성, 사용자 수준 등을 고려하여 설계 기본방향 설정하였으며, 풍수해 피해예측지도 정보 메타데이터 표준안 수립에 반영하였다. 그 결과, 메타데이터 패키지는 총 9개의 섹션(클래스)으로 구성하여 정의하였고 하위개체를 설정 및 연계하여 메타데이터 개체셋 정보를 구성하였다. 풍수해 피해예측지도 메타데이터 관리 시범 시스템 설계 제시를 위해 DB항목 조사 및 도출, 데이터 연계 활용 모델 구축, 프로토타입 개발순으로 연구를 수행하였다. 또한 표출 대상 데이터 항목별 분류, 방재활용 단계, 지역구분 등을 주제로 데이터 Mapping 자료를 작성하였고, 설계 기본 방향에 의하여 설정된 기준으로 데이터 항목별 메타데이터 DB를 작성하여 풍수해 피해예측지도 메타데이터 관리 시범 시스템을 설계하였다. 본 연구 결과는 추후 풍수해 피해예측지도 표준 데이터 및 풍수해 피해예측지도 표준 데이터 모델 구축에 활용 가능하며 표준화 연계활용을 위한 연구에 기여할 것으로 판단된다.

  • PDF

Load Forecasting for the Holidays Using a Data mining with the Coefficient of Determination (결정계수 기반의 데이터 마이닝을 이용한 특수일 최대 전력 수요 예측)

  • Wi, Young-Min;Song, Kyung-Bin;Joo, Sung-Kwan
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.552-553
    • /
    • 2008
  • 본 논문에서는 특수일 전력 수요 예측을 위한 알고리즘을 제시하였다. 논문에서 제안하는 전력 수요 예측 알고리즘은 데이터 마이닝을 이용한 데이터 전처리 부분과 전처리된 데이터를 사용하여 특수일 수요를 예측하는 다항 회귀분석 부분으로 나누어진다. 데이터 전처리에서는 전력 수요 예측을 위한 과거 데이터 중에 과거 특수일 수요의 패턴을 잘 보여주는 데이터를 찾기 위해 온도와 수요의 관계를 이용한다. 데이터 마이닝의 기준으로 결정계수를 사용하였으며, 알고리즘은 k-nearest neighbor 절차를 사용하였다. 또한 제안된 기법은 2006년 특수일 전력 수요 예측을 통하여 기존 논문의 결과와 비교 분석하여 기존 방식 대비 특수일 전력 수요예측 관련 우수성을 검증하였다.

  • PDF

Data Flow Prediction Scheme using ARIMA Model (ARIMA 모델을 이용한 데이터 흐름 예측 기법)

  • Kim, Dong-Hyun;Kim, Min-Woo;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.141-142
    • /
    • 2018
  • 기존 데이터의 패턴 예측에는 통계를 기반으로 한 수학적 모델이 주로 사용되었으나 새로운 데이터에 대한 피드백이 부족하기 때문에 장기간의 데이터 예측에 한계가 있다. 또한 데이터의 특성이 다양하고 복잡한 경우에는 수학적 모델의 결합 및 계산과정이 어려워진다. 따라서 본 논문에서는 데이터의 학습 및 예측에 기존 정적 모델이 아닌 기계학습 중 시계열 데이터 분석 (Time Series Analysis) 을 기반으로 연구를 진행하였다. 기계학습은 복잡한 특성을 가진 데이터를 학습하여 미래의 데이터 값을 예측하거나 분류하는데 있어서 정확도 및 처리시간 측면에서의 성능을 향상시킬 수 있다.

  • PDF

A Practical Methodology of Preparing Data for Generating Prediction Model using Heterogeneous Data Sources (이형 데이터 기반의 예측 모델 생성을 위한 데이터 정제 방법론)

  • Lee, EunKyung;Yoo, Yeontaek;Lee, Keonsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.674-677
    • /
    • 2019
  • 예측 모델은 어떤 상황이 주어졌을 때, 다음 상황에 대한 예측을 수행하는 시스템으로, 현재 상황을 올바르게 인지하고, 그 인지된 상황을 토대로 미래를 예측할 수 있는 지능을 갖고 있어야 한다. 이러한 예측 모델이 올바르게 동작하기 위해서는 상황을 올바르게 인지하는 기능이 우선되어야 하지만, 원시 데이터로부터 상황을 인지하기 위해서는 원시 데이터를 올바르게 해석하기 위한 데이터 정제 과정이 필요하다. 이에 본 연구에서는 다양한 형태의 원시 데이터를 예측 모델의 유효한 입력 값으로 변환시키기 위한 데이터 정제 방법을 제안한다. 본 방법은 윈시 데이터의 형태 정의, 데이터 정규화, 속성 관계 검증, 결측치 보정, 그리고 신뢰도 적용의 5단계로 구성되어 있다.

Predictive Modeling for the Data having Marcov property (마코프성분을 갖는 데이터셋의 예측모델링)

  • 김선철;서성보;이준욱;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.172-174
    • /
    • 2000
  • 기업과 산업등 여러분야에 적용하기 위하여 인공지능, 통계학, 데이터베이스등의 각 분야에서 활발히 연구되고 있는 데이터마이닝은 알 수 없는 미래에 대한 예측이 가능하다는 장점을 갖기 때문에 더욱 가치가 있다. 데이터셋을 설명하기 위한 설명모델링과 예측을 하기 위한 예측모델링의 두 가지 범주로 나뉘어 발전되어왔으나, 데이터셋을 설명하기 위한 분석보다는 미래를 예측하기 위한 분석의 중요성이 점점 증가되고 있다. 이 논문에서는 마코프 성분을 갖는 과거의 이력 데이터를 기반으로 일정한 시점 또는 일정 기간동안의 변화량을 예측할 수 있는 예측모델링 방법을 제시한다.

  • PDF

Data Mining for Water Supply Forecasting (물 공급량 예측을 위한 데이터 마이닝 기법)

  • Shin, Gang-Wook;Kim, Youn-Kwon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.233-235
    • /
    • 2021
  • 본 논문에서는 물 공급량 예측을 위한 다양한 알고리즘 적용에 있어서 데이터 마이닝의 효용성을 검토하고자 하였다. 물 공급분야에 있어서, 물 이용 지역의 특성에 따라 공급량과 이용 시간이 매우 상이한 특성을 나타낸다. 물 이용 지역은 주택지역, 상업지역, 산업단지지역 등 다양한 형태로 분류할 수 있고, 이에 따라 물 이용 시간의 상이함에 따른 물 공급패턴이 일정하지 않게 된다. 특히, 주택지역과 상업지역이 복합적으로 이루어진 경우, 물 이용 단위인 블록 단위에서의 물 특성이 불규칙적인 패턴을 나타낸다. 따라서, 각 블록 단위 특성에 적합한 물 이용량을 예측하여 효율적 물 공급 방안을 마련할 필요가 있다. 또한, 물 이용량 데이터 중 이상 데이타 감지와 이상 데이터 보정을 통하여 물 이용량 예측의 정확도가 향상된다. 따라서, 블록 단위의 물 이용량에 대한 원시데이타의 효율적인 데이터 마이닝 방안이 요구된다. 본 연구에서는 물 공급지역의 특성에 따른 물 공급 패턴을 분석하고, 이에 적합한 데이터 마이닝 기법을 제시하고 비교 분석하였다. 제안된 데이터 마이닝 기법은 딥러닝 예측모델을 적용하여 적합성을 검증하고, 이를 물 공급량 예측알고리즘에 폭넓게 활용될 수 있음을 확인하였다.

  • PDF

Prediction of Water Quality Factor for River Basin using RNN-LSTM Algorithm (RNN-LSTM 알고리즘을 이용한 하천의 수질인자 예측)

  • Lim, Hee Sung;An, Hyun Uk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.219-219
    • /
    • 2020
  • 하천의 수질을 나타내는 환경지표 중 국가 TMS(Tele Monitoring system)의 수질측정망을 통해 관리되고 있는 지표로는 DO, BOD, COD, SS, TN, TP 등 여러 인자들이 있다. 이러한 수질인자는 하천의 자정작용에 있어 많은 영향을 나타내고 있다. 이를 활용한 경제적이고 합리적인 수질관리를 위해 하천의 자정작용을 활용하는 것이 중요하다. 생물학적 작용을 가장 효과적으로 활용하기 위해서는 수질오염 데이터에 기초한 수질예측을 채택하여 적절한 대책이 필요하다. 이를 위해서는 수질인자의 데이터를 측정하고 축적해 수질오염을 예측하는 것이 필수적인데, 실제적으로 수질인자의 일일 측정은 비용 관점에서 쉽게 접근할 수 없다. 본 연구에서는 시계열 학습으로 알려진 RNN-LSTM(Recurrent Neural Network-Long Term Memory) 알고리즘을 활용하여 기존에 측정된 수질인자의 데이터를 통해 시간당 및 일일 수질인자를 예측하려고 했다. 연구에 앞서, 기존에 시간단위로 측정된 수질인자 데이터의 이상 유무를 확인 후, 에러값은 제거하고 12시간 이하 데이터가 누락되었을 때는 선형 보간하여 데이터를 사용하고, 1일 데이터도 10일 이하 데이터가 누락되었을 때 선형 보간하여 데이터를 활용하여 수질인자를 예측하였다. 수질인자를 예측하기 위해 구글이 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하였고, 연구지역으로는 대한민국 부산에 위치한 온천천의 유역을 선정하였다. 수질인자 데이터 수집은 부산광역시에서 운영하는 보건환경정보 공개시스템의 자료를 활용하였다. 모델의 연구를 위해 하천의 수질인자, 기상자료 데이터를 입력자료로 활용하였다. 분석에서는 입력자료와, 반복횟수, 시계열의 길이 등을 조절해 수질 요인을 예측했고, 모델의 정확도도 분석하였다.

  • PDF

A New Pattern Analysis Methodology for Time-Series Data using Symbol String Quantization (시계열 데이터의 양자화된 문자열 변환을 통한 새로운 패턴 분석 기법)

  • Kim, Hyong-Jun;Yoon, Taijin;Cho, Hwan-Gue
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.523-526
    • /
    • 2009
  • 시계열 데이터에서 패턴을 분석하는 기법은 많은 발전이 이루어져 오고 있으나 주식시장의 경우 패턴 분석 및 예측에 관련되어 많은 연구가 이루어져 있지 않고 있다. 이는 주가의 등락 자체가 본질적으로 무작위하다고 생각되어지고 있기 때문이다. 본 연구에서는 주가의 등락이 보여주는 무작위성의 정도를 Kolmogorov Complexity로 측정, 그 무작위성의 정도와 본 논문에서 제시한 반전역정렬로 예측하는 주가의 예측 간의 상관관계를 보인다. 이를 위하여 KOSPI 주식 데이터 28년 690개의 데이터를 수집하여 이들 주식 데이터의 등락을 양자화된 문자열로 변환하여 본 논문에서 제시한 방법의 의미를 평가하였다. 그 결과 Kolmogorov Complexity가 높은 경우에는 주가 변동 예측이 어려우며, Kolmogorov Complexity가 낮은 경우에는 주식 변동 예측은 가능하나 등락 예측 율은 단기 예측은 12%이상의 예측율을 보일 수 없으며, 장기 예측의 경우 54%의 예측율로 수렴함을 확인하였다.