• Title/Summary/Keyword: 시계열 데이터 마이닝

Search Result 70, Processing Time 0.023 seconds

Data Mining Time Series Data With Virtual Transaction (가상 트랜잭션을 이용한 시계열 데이터의 데이터 마이닝)

  • Kim, Min-Su;Kim, Cheol-Hwan;Kim, Eung-Mo
    • The KIPS Transactions:PartD
    • /
    • v.9D no.2
    • /
    • pp.251-258
    • /
    • 2002
  • There has been much research on data mining techniques for applying more advanced applications. However, most of those techniques has focused on transaction data rather than time series data. In this paper, we introduce a approach to convert time series data into virtual transaction data for more useful data mining applications. A virtual transaction is defined to be a collection of events that occur relatively close to each other. A virtual transaction generator uses time window or event window methods. Our approach based on time series data can be used with most conventional transaction algorithms without further modification.

Mining Time Series Data With Virtual Transaction (트랜잭션이 없는 시계열 데이터로 부터 가상 트랜잭션을 이용한 데이터 마이닝)

  • Kim, Min-Soo;Lee, Joon-Sub;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.31-34
    • /
    • 2001
  • 대용량의 데이터들로부터 사용자가 원하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝의 기술 중 연관규칙은 항목들의 집합으로 표현되는 트랜잭션에서 각 항목간의 연관성을 찾는데 사용된다. 그러나 실세계에는 트랜잭션이 없이 일련의 이벤트만 시간에 따라서 발생하는 데이터들이 많이 존재한다. 이러한 시계열 이벤트 데이터들로부터 다양한 가상 트랜잭션을 생성하는 기법들을 제시한다. 이러한 가상 트랜잭션 데이터로 변환된 시계열 데이터에 연관규칙, 순차패턴, 주기패턴과 관련된 여러 가지 알고리즘을 바로 적용 함으로서 유용한 규칙들을 발견해 낼 수 있다.

  • PDF

Selection of Discriminative Genes for Data Mining of Time-series Microarray Data (시계열 마이크로어레이 데이터 마이닝을 위한 분별력 있는 유전자 선정 방법)

  • Lee Min-Su;Park Seung-Soo;Kang Sung-Hee;Park Woong-Yang
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.25-27
    • /
    • 2006
  • 본 논문에서는 시계열 마이크로어레이데이터 마이닝을 위한 전처리 작업으로 시계열 마이크로어레이 데이터에 특징 추출 방법 및 상관관계 분석을 이용하여 분화 과정에 대해 분별력 있는 유전자들을 선정하기 위한 방법을 제안하고, 줄기세포가 신경세포로 분화하는 과정에서 특이적으로 발현되는 유전자들을 찾기 위한 시계열 마이크로어레이 데이터 분석 과정을 하나의 예로 제시한다. 분석 결과, 제안한 방법이 분화 특이적으로 발현되는 분별력 있는 유전자들, 분화 과정에서 공통적으로 발현되는 유전자들, 그리고 경계선에 존재하는 유전자들을 통해서 줄기세포 신경분화의 특징들을 규명하는데 매우 유용함을 보였다.

  • PDF

Defect Analysis of the SBR Wastewater Treatment Plant for Unmanned Automation Based on Time-series Data Mining (시계열 데이터 마이닝을 이용한 하수처리 연속 회분식 반응기 장비 진단)

  • Bae Hyeon;Choi Dae-Won;Cheon Seong-Pyo;Kim Sungshin;Kim Yejin
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.177-180
    • /
    • 2005
  • 본 연구는 연속 회분식 반응기(SBR) 공정에서 시계열 데이터 마이닝을 이용하여 공정에 사용된 기기의 고장 진단 알고리즘 개발에 대한 내용을 보여주고 있다. 공정에서 비정상적인 반응을 유발하는 장비 관리에 대한 연구는 폭넓게 수행되고 있지 않으므로, 이러한 장비 진단은 소규모 하$\cdot$폐수처리장을 무인자동화로 통합관리에 유용하게 적용될 수 있다. 본 연구에서는 진동신호를 이용하여 무인자동화를 위해 선행되어야 하는 공정기기의 공장진단에 관한 알고리즘을 개발하였다.

  • PDF

Data mining analysis for short-term water demand forecasting (물 수요예측을 위한 데이터 마이닝 기법 분석)

  • Shin, Gang-Wook;Hong, Sung-Taek
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.1771_1772
    • /
    • 2009
  • 본 연구에서는 안정적인 물 공급과 에너지의 효율적 사용을 위한 단기 물 수요예측에 대하여 데이터 마이닝 기법의 적용성을 검토하고자 한다. 물 공급이 이루어진 요일과 특이일에 대한 시계열 분석을 통한 단기 물 수요예측과 데이터 마이닝 기법을 적용한 결과를 상호 비교하여 데이터 마이닝 기법의 적용성을 제시하고자 한다. 이를 통하여 단기 물 수요예측알고리즘의 실용화 가능성을 높일 뿐만 아니라 실시간 예측을 위한 기초 데이터 마이닝 체계를 구축하고자 한다.

  • PDF

Noise Averaging Effect on Privacy-Preserving Clustering of Time-Series Data (시계열 데이터의 프라이버시 보호 클러스터링에서 노이즈 평준화 효과)

  • Moon, Yang-Sae;Kim, Hea-Suk
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.3
    • /
    • pp.356-360
    • /
    • 2010
  • Recently, there have been many research efforts on privacy-preserving data mining. In privacy-preserving data mining, accuracy preservation of mining results is as important as privacy preservation. Random perturbation privacy-preserving data mining technique is known to well preserve privacy. However, it has a problem that it destroys distance orders among time-series. In this paper, we propose a notion of the noise averaging effect of piecewise aggregate approximation(PAA), which can be preserved the clustering accuracy as high as possible in time-series data clustering. Based on the noise averaging effect, we define the PAA distance in computing distance. And, we show that our PAA distance can alleviate the problem of destroying distance orders in random perturbing time series.

Stock Prediction Using News Text Mining and Time Series Analysis (뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예측)

  • Ahn, Sung-Won;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.364-369
    • /
    • 2010
  • 본 논문에서는 뉴스 텍스트 마이닝을 수행하여 2005년 1월부터 2008년 12월까지 4년 간의 뉴스 데이터에 대해 주가에 호재인지 악재인지 여부에 대해 학습을 하고, 이를 근거로 신규 발행된 뉴스가 주가 상승 또는 하락에 영향을 미치는지를 예측하는 알고리즘을 제안한다. 뉴스 텍스트 마이닝을 위해 변형된 Bag of Words 모델과 Naive Bayesian 분류기법을 사용하였으며, 특히 주가 예측에 있어서 뉴스 마이닝에만 의존하던 기존의 관련 연구와는 달리 예측의 정확성을 높이기 위해 주가의 시계열 데이터 분석기법인 RSI를 추가로 작용하였다. 2009년 11월부터 2010년 2월까지 4개월간 42,355건의 뉴스 데이터에 대해 실험한 결과, 기존 연구 대비 의미 있는 결과인 55.01%의 예측성공률을 얻었다.

  • PDF

A study on the effect of cognitive style and physiological phenomena on judgemental time-series forecasting (시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성분석에 관한 연구)

  • 박흥국;유현중;송병호
    • Science of Emotion and Sensibility
    • /
    • v.3 no.2
    • /
    • pp.41-55
    • /
    • 2000
  • 경영활동에 있어서 직관력은 잘 알려진 인지능력이지만 효과적인 의사결정지원시스템의 개발 목적으로는 거의 고려되고 있지 않다. 본 연구는 의사결정자의 인지 유형에 따른 시계열 예측의 정확성과 뇌파의 차이를 통계적 검증, 인공신경망, 데이터 마이닝의 세 가지 접근방법으로 탐색하여 그 결과를 비교 분석함으로써 시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성을 도출함으로써 효과적인 의사결정환경을 조성하는데 공헌하고자 하였다. 실험결과 통계적 분석에서는 아무런 유의성을 찾을 수 없었으나, 인공신경망 분석에서는 인지유형과 감성유형이 모두 시계열 예측 정확도와 상관성이 있는 것으로 나타났으며, 데이터 마이닝 분석에서는 보다 의미 있는 상관관계를 찾아낼 수 있었다.

  • PDF

Design and Implementation of Rule Discovery Algorithm strongly coupled with Time-series databases (시계열 데이터베이스와 강결합된 규칙발견 알고리즘 설계와 구현)

  • 박인창;김성규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.43-45
    • /
    • 2001
  • 마이닝 시스템은 그 특성에 따라 매우 다른 형태의 구현 방법이 존재한다. 그러므로 마이닝 시스템간 호환성이나 재사용성은 매우 낮다. 본 노문에서는 이 문제를 시계열 데이터베이스를 통한 RDB와 강 결합함으로써 표준화에 대한 문제를 해겨라고자 시도하였다. RDB와의 강 결합은 표준화 문제를 해결함과 더불어 마이닝 시스템에 DBMS의 관련 기술을 이용함으로써 성능을 극대화시킨다. 특히 DBMS의 인텍스 기능을 이용함으로써 마이닝 시스템의 성능 향상을 시도하였다. 본 논문에서는 기존의 순차패턴 탐사의 시간개념 부재, 트랜잭션 데이터베이스 기반구조, 그리고 알고리즘 수행에 있어서 메모리 한계에 따른 문제등의 단점을 지적하고, 이를 수정하고 보완하기 위해서 시간 거리와 패턴 길이의 개념을 확장하였으며 그에 따른 연관규칙의 관련 공식을 수정 보완하여 제안한다. 또한 RDB와의 강 결합되어 기존의 트랜잭션 데이터베이스 구조를 벗어나 시계열 데이터에 보다 쉽게 적용할 수 있는 절차와 알고리즘을 제안한다.

  • PDF

Defect Analysis of the SBR Wastewater Treatment Plant for Unmanned Automation Based on Time-series Data Mining (시계열 데이터 마이닝을 이용한 하수처리 연속 회분식 반응기 장비 진단)

  • Bae, Hyeon;Choi, Dae-Won;Cheon, Seong-Pyo;Kim, Sung-Shin;Kim, Ye-Jin
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.4
    • /
    • pp.431-436
    • /
    • 2005
  • This paper describes how to diagnose SBR plant equipment using time-series data mining. It shows the equipment diagnostics based upon vibration signals that are acquired front each device lot process control. Data transform techniques including two data preprocessing skills and data mining methods were employed in the data analysis. The proposed method is not only suitable for SBR equipment, but is also suitable for other Industrial devices. The experimental results performed on a lab-scale SBR plant show a good equip-ment-management performance.