• Title/Summary/Keyword: 시계열 데이터 분석

Search Result 740, Processing Time 0.032 seconds

Analysis of Intrinsic Patterns of Time Series Based on Chaos Theory: Focusing on Roulette and KOSPI200 Index Future (카오스 이론 기반 시계열의 내재적 패턴분석: 룰렛과 KOSPI200 지수선물 데이터 대상)

  • Lee, HeeChul;Kim, HongGon;Kim, Hee-Woong
    • Knowledge Management Research
    • /
    • v.22 no.4
    • /
    • pp.119-133
    • /
    • 2021
  • As a large amount of data is produced in each industry, a number of time series pattern prediction studies are being conducted to make quick business decisions. However, there is a limit to predicting specific patterns in nonlinear time series data due to the uncertainty inherent in the data, and there are difficulties in making strategic decisions in corporate management. In addition, in recent decades, various studies have been conducted on data such as demand/supply and financial markets that are suitable for industrial purposes to predict time series data of irregular random walk models, but predict specific rules and achieve sustainable corporate objectives There are difficulties. In this study, the prediction results were compared and analyzed using the Chaos analysis method for roulette data and financial market data, and meaningful results were derived. And, this study confirmed that chaos analysis is useful for finding a new method in analyzing time series data. By comparing and analyzing the characteristics of roulette games with the time series of Korean stock index future, it was derived that predictive power can be improved if the trend is confirmed, and it is meaningful in determining whether nonlinear time series data with high uncertainty have a specific pattern.

Selection of Discriminative Genes for Data Mining of Time-series Microarray Data (시계열 마이크로어레이 데이터 마이닝을 위한 분별력 있는 유전자 선정 방법)

  • Lee Min-Su;Park Seung-Soo;Kang Sung-Hee;Park Woong-Yang
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.25-27
    • /
    • 2006
  • 본 논문에서는 시계열 마이크로어레이데이터 마이닝을 위한 전처리 작업으로 시계열 마이크로어레이 데이터에 특징 추출 방법 및 상관관계 분석을 이용하여 분화 과정에 대해 분별력 있는 유전자들을 선정하기 위한 방법을 제안하고, 줄기세포가 신경세포로 분화하는 과정에서 특이적으로 발현되는 유전자들을 찾기 위한 시계열 마이크로어레이 데이터 분석 과정을 하나의 예로 제시한다. 분석 결과, 제안한 방법이 분화 특이적으로 발현되는 분별력 있는 유전자들, 분화 과정에서 공통적으로 발현되는 유전자들, 그리고 경계선에 존재하는 유전자들을 통해서 줄기세포 신경분화의 특징들을 규명하는데 매우 유용함을 보였다.

  • PDF

Dimension Reduction in Time-series Gene Expression Data using incremental PCA (점진적 주성분 분석을 이용한 시계열 유전자 발현 데이터의 효율적인 차원 축소)

  • Kim, Sun-Hee;Kim, Man-Sun;Yang, Hyung-Jeong
    • Annual Conference of KIPS
    • /
    • 2007.11a
    • /
    • pp.733-736
    • /
    • 2007
  • 최근 생명 공학 기술의 발달로 마이크로 단위의 실험이 가능해지고 하나의 칩상에 수 만개의 유전자들의 발현 양상을 보다 쉽게 관찰할 수 있게 되었다. DNA 칩 기술에 의해 얻어지는 마이크로어레이(microarray) 데이터는 세포나 조직 내의 유전자 발현도(expression level)를 측정한 것으로 질병 진단이나 유전자 기능 예측 등에 이용되고 있다. 본 논문에서는 대량의 시계열 마이크로어레이 데이터 분석을 위해 효율적으로 데이터의 차원을 판단하는 점진적 주성분 분석을 이용하여 데이터의 차원을 축소 한다. 제안된 방법은 실제 시계열 마이크로어레이 데이터인 yeast cell cycle 데이터에 적용되었고, 데이터 차원 축소에 대한 효율성을 검증하기 위해 클러스터링을 수행하였다. 그 결과 데이터를 축소하여 클러스터링을 수행한 경우 학습 성능이 향상 된 결과를 보였다.

Design and implementation of a cache manager for pipeline time-series data (배관 시계열 데이터를 위한 캐시 관리자의 설계 및 구현)

  • Kim, Seon-Hyo;Kim, Won-Sik;Shin, Je-Yong;Han, Wook-Shin
    • Annual Conference of KIPS
    • /
    • 2005.11a
    • /
    • pp.109-112
    • /
    • 2005
  • 배관에 생기는 구멍이나 틈은 대형 사고의 원인이 될 수 있다. 이러한 배관의 결함을 찾기 위해서는 먼저 센서를 부착한 배관 탐사 장비를 배관에 통과시키고, 배관을 통과하는 중에 센서가 읽은 정보들을 배관 탐사 장비의 하드 디스크에 저장한다. 배관 통과가 완료된 후, 분석가는 분석 프로그램을 사용하여 탐사 장비에서 얻은 데이터에서 결함을 수동적으로 찾는다. 분석가가 데이터를 분석할 때 일반적으로 두 가지 패턴이 존재한다. 첫 번째 패턴은 일정한 구간의 센서 데이터를 순차적으로 분석하는 패턴이고, 두 번째 패턴은 현재 구간에서 이전 구간으로 되돌아가서 다시 분석하는 반복적인 패턴이다. 현재까지 만족할 만 한 수준으로 자동적으로 분석이 되지 않으므로, 분석가는 수작업으로 분석을 하는 경우가 많은데 이로 인해 최근에 읽은 부분을 전후 반복해서 액세스하는 반복적인 패턴이 많이 사용된다. 반복적 패턴의 경우 시스템의 성능을 향상시키기 위해, 이전에 읽은 배관 센서 데이터를 캐싱 할 필요가 있다. 그러나 기존의 분석 소프트웨어에는 캐싱 기능이 없으므로 반복적 패턴일 경우 데이터베이스에서 동일한 데이터를 반복적으로 읽는 문제를 가지고 있다. 본 논문에서는 배관 센서 데이터를 효율적으로 관리하는 캐쉬 관리자를 설계하고 구현하였다. 세부적으로는, 배관 센서 데이터를 시계열 데이터로 간주하고, 시계열 데이터에 대한 캐시 관리자를 제안하였다. 본 논문은 배관 탐사 장비에서 획득한 데이터들을 시계열 데이터로 간주하여 데이터베이스 측면에서 이러한 문제들을 접근하였다는 점에서 의미가 있으며, 향후 이 분야에 대한 많은 연구들이 나올 것으로 기대한다.

  • PDF

Study on the Development of a Time-Series Prediction Application Software (시계열 예측 Application S/W 개발에 관한 연구)

  • Kim, Chi-Ho;Hong, Tae-Hwa;Kim, Hag-Bae
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2983-2985
    • /
    • 2000
  • 이 논문의 목적은 시계열 예측 엔진의 개발과 그 엔진을 Application S/W로 구현하는 것이다 시계열 예측 엔진은 과거의 데이터를 분석하여 예측을 위한 식의 차수와 형태를 결정하고 이를 바탕으로 파라미터를 결정한 후 미래의 간을 예측하는 3가지 단계를 거친다. 석기에 쓰이는 기법들은 여러 가지가 있는데 본 논문에서는 ARMA(Auto Regressive Moving Average)를 기본으로 분석하였다 Application S/W는. 개발된 예측 엔진에서 분석될 과거 데이터를 입력받아 예측 엔진 구동에 사용되고 그 결과를 그래프로 나타내는 일련의 과정을 거친다. Application S/W 개발의 많은 Programming Language가 존재하지만 본 논문에서는 Visual C누 +을 사용하였다. 또한 이 논문에선, 특정 교차로를 통과하는 교통량 변화에 대한 데이터를 이용하여 예측을 수행하고. 그 결과를 Application S/W에 적용시켰다.

  • PDF

Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data (제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법)

  • Oh, Sanghoun;Ahn, Chang Wook
    • Smart Media Journal
    • /
    • v.10 no.3
    • /
    • pp.23-30
    • /
    • 2021
  • Although the manufacturing time series data clustering technique is an important grouping solution in the field of detecting and improving manufacturing large data-based equipment and process defects, it has a disadvantage of low accuracy when applying the existing static data target clustering technique to time series data. In this paper, an evolutionary computation-based time series cluster analysis approach is presented to improve the coherence of existing clustering techniques. To this end, first, the image shape resulting from the manufacturing process is converted into one-dimensional time series data using linear scanning, and the optimal sub-clusters for hierarchical cluster analysis and split cluster analysis are derived based on the Pearson distance metric as the target of the transformation data. Finally, by using a genetic algorithm, an optimal cluster combination with minimal similarity is derived for the two cluster analysis results. And the performance superiority of the proposed clustering is verified by comparing the performance with the existing clustering technique for the actual manufacturing process image.

Analysis on Temporal Pattern of Location Data with Time Series Model (시계열 모델을 활용한 위치 데이터의 시간적 패턴 분석)

  • Song, Ha Yoon;Lee, Da Som;Jung, Jun Woo
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.768-771
    • /
    • 2021
  • 시계열 분석은 이전 시점들의 데이터를 기반으로 미래 시점의 데이터를 예측하는 기술을 제공하며, SARIMA는 이러한 시계열 분석에서 활용되는 통계 모델의 일종이다. 본 연구는 직접 수집한 실시간 위치 데이터에 SARIMA를 적용하여 개인의 이동 패턴을 추출하고 이를 예측에 활용하는 전반적인 프로세스를 제작하였다. 첫째, DB에 업로드된 위치 데이터를 비지도 학습의 일종인 EM-clustering을 활용해 핵심 방문 장소들로부터의 거리에 따라 군집화했다. 둘째, 해당 장소에 입장하고 퇴장하는 시간 간격에 SARIMA를 적용해 주기성을 추출했다. 마지막으로, 이 주기성들을 군집의 중요도에 따라 순차적으로 분석하여 유의미한 예측 결과를 도출해냈다.

Design and Implementation of a Time-series Index for Blockchain Analysis Platform (블록체인 분석 플랫폼을 위한 시계열 인덱스 설계 및 구현)

  • Jongho Won;Mi-Young Jang;Dong-Myung Sul;Ji-Yong Kim
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.245-247
    • /
    • 2023
  • 블록체인 분석 플랫폼은 블록체인에 저장된 데이터 기반의 다양한 산업분야 활용성 증대를 위하여 분산 블록체인 기반 대규모/대용량 데이터에 대한 고속 분석을 통하여 신뢰성이 보장되는 보안과 신뢰 기반의 데이터 서비스를 제공하기 위한 분석 플랫폼이다. 본 논문에서는 블록체인 분석 플랫폼에서 제공하는 데이터 분석 중 시계열 데이터에 대한 고성능의 분석을 제공하기 위한 시계열 데이터 인덱스의 설계와 구현에 대하여 기술한다.

Efficient Time-Series Similarity Measurement and Ranking Based on Anomaly Detection (이상탐지 기반의 효율적인 시계열 유사도 측정 및 순위화)

  • Ji-Hyun Choi;Hyun Ahn
    • Journal of Internet Computing and Services
    • /
    • v.25 no.2
    • /
    • pp.39-47
    • /
    • 2024
  • Time series analysis is widely employed by many organizations to solve business problems, as it extracts various information and insights from chronologically ordered data. Among its applications, measuring time series similarity is a step to identify time series with similar patterns, which is very important in time series analysis applications such as time series search and clustering. In this study, we propose an efficient method for measuring time series similarity that focuses on anomalies rather than the entire series. In this regard, we validate the proposed method by measuring and analyzing the rank correlation between the similarity measure for the set of subsets extracted by anomaly detection and the similarity measure for the whole time series. Experimental results, especially with stock time series data and an anomaly proportion of 10%, demonstrate a Spearman's rank correlation coefficient of up to 0.9. In conclusion, the proposed method can significantly reduce computation cost of measuring time series similarity, while providing reliable time series search and clustering results.

Time Series Analysis of Engine Test Data (엔진 시험 데이터에 대한 시계열 분석)

  • Kim, Il-Doo;Yoon, Hyun-Gull;Lim, Jin-Shik
    • Proceedings of the Korean Society of Propulsion Engineers Conference
    • /
    • 2011.11a
    • /
    • pp.241-245
    • /
    • 2011
  • In an engine test, data are collected in a form of a time series. Usually only the time average of a time series is interesting to engineers while its stochastic fluctuation is being ignored. In this paper, we collect pressure and fuel flux data from an air-breathing engine test and analyze their fluctuations using the multiscale sample entropy analysis, which is suggested as a measure of the complexity of a time series. It is shown that different physical quantities indeed have different complexities at each timescales, suggesting a possibility of an instantaneous tool which evaluates the engine test.

  • PDF