• 제목/요약/키워드: 시계열 데이터 마이닝

검색결과 70건 처리시간 0.031초

가상 트랜잭션을 이용한 시계열 데이터의 데이터 마이닝 (Data Mining Time Series Data With Virtual Transaction)

  • 김민수;김철환;김응모
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.251-258
    • /
    • 2002
  • 대용량의 데이터들로부터 사용자가 인하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝 기술들은 시계열 데이터를 이용하는 경우보다 트랜잭션 데이터를 이용하여 유용한 정보를 찾는 경우에 초점이 맞춰져 있다. 본 논문에서는 시계열 데이터를 트랜잭션 데이터로 변환하는 접근방법을 소개한다. 가상 트랜잭션은 서로 상대적으로 근접한 시간에 발생하는 이벤트의 집합이라고 정의하며, 가상 트랜잭션 생성기는 가상 트랜잭션을 생성시 시간윈도우와 이벤트 윈도우 방법을 사용한다. 본 논문의 접근 방법을 사용하여 기존의 트랜잭션 데이터를 이용하는 많은 데이터 마이닝 알고리즘들을 수정 없이 시계열 데이터에 적용하여 유용한 정보를 찾을 수 있다.

트랜잭션이 없는 시계열 데이터로 부터 가상 트랜잭션을 이용한 데이터 마이닝 (Mining Time Series Data With Virtual Transaction)

  • 김민수;이준섭;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.31-34
    • /
    • 2001
  • 대용량의 데이터들로부터 사용자가 원하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝의 기술 중 연관규칙은 항목들의 집합으로 표현되는 트랜잭션에서 각 항목간의 연관성을 찾는데 사용된다. 그러나 실세계에는 트랜잭션이 없이 일련의 이벤트만 시간에 따라서 발생하는 데이터들이 많이 존재한다. 이러한 시계열 이벤트 데이터들로부터 다양한 가상 트랜잭션을 생성하는 기법들을 제시한다. 이러한 가상 트랜잭션 데이터로 변환된 시계열 데이터에 연관규칙, 순차패턴, 주기패턴과 관련된 여러 가지 알고리즘을 바로 적용 함으로서 유용한 규칙들을 발견해 낼 수 있다.

  • PDF

시계열 마이크로어레이 데이터 마이닝을 위한 분별력 있는 유전자 선정 방법 (Selection of Discriminative Genes for Data Mining of Time-series Microarray Data)

  • 이민수;박승수;강성희;박웅양
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.25-27
    • /
    • 2006
  • 본 논문에서는 시계열 마이크로어레이데이터 마이닝을 위한 전처리 작업으로 시계열 마이크로어레이 데이터에 특징 추출 방법 및 상관관계 분석을 이용하여 분화 과정에 대해 분별력 있는 유전자들을 선정하기 위한 방법을 제안하고, 줄기세포가 신경세포로 분화하는 과정에서 특이적으로 발현되는 유전자들을 찾기 위한 시계열 마이크로어레이 데이터 분석 과정을 하나의 예로 제시한다. 분석 결과, 제안한 방법이 분화 특이적으로 발현되는 분별력 있는 유전자들, 분화 과정에서 공통적으로 발현되는 유전자들, 그리고 경계선에 존재하는 유전자들을 통해서 줄기세포 신경분화의 특징들을 규명하는데 매우 유용함을 보였다.

  • PDF

시계열 데이터 마이닝을 이용한 하수처리 연속 회분식 반응기 장비 진단 (Defect Analysis of the SBR Wastewater Treatment Plant for Unmanned Automation Based on Time-series Data Mining)

  • 배현;최대원;천성표;김성신;김예진
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.177-180
    • /
    • 2005
  • 본 연구는 연속 회분식 반응기(SBR) 공정에서 시계열 데이터 마이닝을 이용하여 공정에 사용된 기기의 고장 진단 알고리즘 개발에 대한 내용을 보여주고 있다. 공정에서 비정상적인 반응을 유발하는 장비 관리에 대한 연구는 폭넓게 수행되고 있지 않으므로, 이러한 장비 진단은 소규모 하$\cdot$폐수처리장을 무인자동화로 통합관리에 유용하게 적용될 수 있다. 본 연구에서는 진동신호를 이용하여 무인자동화를 위해 선행되어야 하는 공정기기의 공장진단에 관한 알고리즘을 개발하였다.

  • PDF

물 수요예측을 위한 데이터 마이닝 기법 분석 (Data mining analysis for short-term water demand forecasting)

  • 신강욱;홍성택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1771_1772
    • /
    • 2009
  • 본 연구에서는 안정적인 물 공급과 에너지의 효율적 사용을 위한 단기 물 수요예측에 대하여 데이터 마이닝 기법의 적용성을 검토하고자 한다. 물 공급이 이루어진 요일과 특이일에 대한 시계열 분석을 통한 단기 물 수요예측과 데이터 마이닝 기법을 적용한 결과를 상호 비교하여 데이터 마이닝 기법의 적용성을 제시하고자 한다. 이를 통하여 단기 물 수요예측알고리즘의 실용화 가능성을 높일 뿐만 아니라 실시간 예측을 위한 기초 데이터 마이닝 체계를 구축하고자 한다.

  • PDF

시계열 데이터의 프라이버시 보호 클러스터링에서 노이즈 평준화 효과 (Noise Averaging Effect on Privacy-Preserving Clustering of Time-Series Data)

  • 문양세;김혜숙
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.356-360
    • /
    • 2010
  • 최근, 개인 데이터의 프라이버시 보호에 대한 문제가 대두됨에 따라 대용량 데이터를 대상으로 하는 데이터 마이닝 분야에서도 프라이버시 보호 문제에 대한 활발한 연구가 진행되고 있다. 데이터 마이닝에서의 프라이버시 보호 문제는 정보제공자에 의해 제공된 정보 중 민감한 개인 정보의 노출이 없이도 가능한 정확한 마이닝 결과를 얻는 것이다. 데이터 마이닝의 프라이버시 보호 기법에서는 데이터의 보호뿐만 아니라 결과의 정확도 또한 중요한 요인이다. 이에 따라, 본 논문에서는 시계열 데이터 클러스터링을 기반으로 랜덤 데이터 교란 기법에서 결과의 정확도를 높이는 기법으로 노이즈 평준화 개념을 제시한다. 기존의 랜덤 데이터 교란 기법은 데이터의 프라이버시는 잘 보호하지만 시계열간의 거리-순서가 보존되지 않아 결과의 정확도가 크게 떨어지는 문제점을 가진다. 이를 위해, 본 논문에서는 PAA를 기반으로 하는 노이즈 평준화 개념을 제시하고, 구체적인 예를 통해, 제안한 노이즈 평준화 개념이 랜덤 데이터 교란 기법에서 클러스터링 결과의 정확도를 높일 수 있음을 체계적으로 설명한다.

뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예측 (Stock Prediction Using News Text Mining and Time Series Analysis)

  • 안성원;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.364-369
    • /
    • 2010
  • 본 논문에서는 뉴스 텍스트 마이닝을 수행하여 2005년 1월부터 2008년 12월까지 4년 간의 뉴스 데이터에 대해 주가에 호재인지 악재인지 여부에 대해 학습을 하고, 이를 근거로 신규 발행된 뉴스가 주가 상승 또는 하락에 영향을 미치는지를 예측하는 알고리즘을 제안한다. 뉴스 텍스트 마이닝을 위해 변형된 Bag of Words 모델과 Naive Bayesian 분류기법을 사용하였으며, 특히 주가 예측에 있어서 뉴스 마이닝에만 의존하던 기존의 관련 연구와는 달리 예측의 정확성을 높이기 위해 주가의 시계열 데이터 분석기법인 RSI를 추가로 작용하였다. 2009년 11월부터 2010년 2월까지 4개월간 42,355건의 뉴스 데이터에 대해 실험한 결과, 기존 연구 대비 의미 있는 결과인 55.01%의 예측성공률을 얻었다.

  • PDF

시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성분석에 관한 연구 (A study on the effect of cognitive style and physiological phenomena on judgemental time-series forecasting)

  • 박흥국;유현중;송병호
    • 감성과학
    • /
    • 제3권2호
    • /
    • pp.41-55
    • /
    • 2000
  • 경영활동에 있어서 직관력은 잘 알려진 인지능력이지만 효과적인 의사결정지원시스템의 개발 목적으로는 거의 고려되고 있지 않다. 본 연구는 의사결정자의 인지 유형에 따른 시계열 예측의 정확성과 뇌파의 차이를 통계적 검증, 인공신경망, 데이터 마이닝의 세 가지 접근방법으로 탐색하여 그 결과를 비교 분석함으로써 시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성을 도출함으로써 효과적인 의사결정환경을 조성하는데 공헌하고자 하였다. 실험결과 통계적 분석에서는 아무런 유의성을 찾을 수 없었으나, 인공신경망 분석에서는 인지유형과 감성유형이 모두 시계열 예측 정확도와 상관성이 있는 것으로 나타났으며, 데이터 마이닝 분석에서는 보다 의미 있는 상관관계를 찾아낼 수 있었다.

  • PDF

시계열 데이터베이스와 강결합된 규칙발견 알고리즘 설계와 구현 (Design and Implementation of Rule Discovery Algorithm strongly coupled with Time-series databases)

  • 박인창;김성규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.43-45
    • /
    • 2001
  • 마이닝 시스템은 그 특성에 따라 매우 다른 형태의 구현 방법이 존재한다. 그러므로 마이닝 시스템간 호환성이나 재사용성은 매우 낮다. 본 노문에서는 이 문제를 시계열 데이터베이스를 통한 RDB와 강 결합함으로써 표준화에 대한 문제를 해겨라고자 시도하였다. RDB와의 강 결합은 표준화 문제를 해결함과 더불어 마이닝 시스템에 DBMS의 관련 기술을 이용함으로써 성능을 극대화시킨다. 특히 DBMS의 인텍스 기능을 이용함으로써 마이닝 시스템의 성능 향상을 시도하였다. 본 논문에서는 기존의 순차패턴 탐사의 시간개념 부재, 트랜잭션 데이터베이스 기반구조, 그리고 알고리즘 수행에 있어서 메모리 한계에 따른 문제등의 단점을 지적하고, 이를 수정하고 보완하기 위해서 시간 거리와 패턴 길이의 개념을 확장하였으며 그에 따른 연관규칙의 관련 공식을 수정 보완하여 제안한다. 또한 RDB와의 강 결합되어 기존의 트랜잭션 데이터베이스 구조를 벗어나 시계열 데이터에 보다 쉽게 적용할 수 있는 절차와 알고리즘을 제안한다.

  • PDF

시계열 데이터 마이닝을 이용한 하수처리 연속 회분식 반응기 장비 진단 (Defect Analysis of the SBR Wastewater Treatment Plant for Unmanned Automation Based on Time-series Data Mining)

  • 배현;최대원;천성표;김성신;김예진
    • 한국지능시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.431-436
    • /
    • 2005
  • 본 연구는 연속 회분식 반응기(SBR) 공정에서 시계열 데이터 마이닝을 이용하여 공정에 사용된 기기의 고장 진단 알고리즘 개발에 대한 내용을 보여주고 있다. 공정에서 비정상적인 반응을 유발하는 장비 관리에 대한 연구는 폭넓게 수행되고 있지 않으므로, 이러한 장비 진단은 소규모 하$\cdot$ 폐수처리장을 무인자동화로 통합관리에 유용하게 적용될 수 있다. 본 연구에서는 진동신호를 이용하여 무인자동화를 위해 선행되어야 하는 공정기기의 공장진단에 관한 알고리즘을 개발하였다.