• 제목/요약/키워드: Kolmogorov Complexity

검색결과 7건 처리시간 0.023초

서열 정렬 알고리즘을 이용한 주가 패턴 탐색 시스템 개발 (Developing Stock Pattern Searching System using Sequence Alignment Algorithm)

  • 김형준;조환규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권6호
    • /
    • pp.354-367
    • /
    • 2010
  • 시계열 데이터에서 패턴을 분석하는 기법은 많은 발전이 이루어져 오고 있다. 그러나 주식시장의 경우 시계열 데이터임에도 불구하고 패턴 분석 및 예측은 많은 연구가 이루어지지 않고 있으며 예측도가 매우 낮다. 그 이유는 주가의 등락 자체가 본질적으로 무작위하다고 하면 어떠한 과학적 방법으로도 그 예측은 불가능하다. 본 연구에서는 주가의 등락이 보여주는 무작위성의 정도를 Kolmogorov 복잡도를 이용해 측정하여 그 무작위의 정도와 본 논문에서 제시한 반 전역정렬(semi-global alignment)로 예측할 수 있는 주가의 예측의 정확간의 깊은 상관관계가 있음을 보인다. 이를 위해서 주가지수의 등락을 양자화된 문자열로 변환하고 그 문자열의 Kolmogorov 복잡도를 이용해 주가 변동의 무작위성을 측정하였다. 우리는 KOSPI 주식 데이터 28년 690개의 데이터를 수집하여 이를 실험용 데이터로 사용하여 본 논문에서 제시한 방법의 의미를 평가하였다. 그 결과 Kolmogorov 복잡도가 높은 경우에는 변동 예측이 어려우며, Kolmogorov 복잡도가 낮은 경우에는 주식 변동 예측은 가능하나 3종류의 예측율에 대해서 투자자들이 관심이 많은 등락 예측율은 단기 예측은 12% 이상의 예측율을 보일 수 없으며, 장기 예측의 경우 54%의 예측율로 수렴함을 확인하였다.

임펄스성 잡음의 유무를 결정하는 Kolmogorov-Smirnov 검증의 수치적 접근의 효율성 (Numerical Approach with Kolmogorov-Smirnov Test for Detection of Impulsive Noise)

  • 오형국;남해운
    • 한국통신학회논문지
    • /
    • 제39C권9호
    • /
    • pp.852-860
    • /
    • 2014
  • 본 논문에서 임펄스성 잡음의 유무를 검증하는 알고리즘을 제안한다. 본 알고리즘을 제안하는 이유는 기존의 Kolmogorov-Smirnov 검증의 단점으로 낮은 분류 성공률 및 높은 복잡도가 있기 때문이다. 이는 이론적으로 문제가 없으나 실제로 구현함에 있어 많은 문제를 야기한다. 먼저 기존의 검증 방법을 설명 후 제안하는 알고리즘을 설명한다. 이 알고리즘은 기존의 Kolmogorov-Smirnov 검증 방법의 이론적 배경으로부터 제안된다. 알고리즘의 효율성을 증명하기 위해 임펄스성 잡음의 샘플을 이용하여 실험 후, 검증 실패 확률을 조사한다. 검증 실패 확률에 기반한 실험 결과는 제안한 알고리즘의 효율성을 증명한다.

시계열 데이터의 양자화된 문자열 변환을 통한 새로운 패턴 분석 기법 (A New Pattern Analysis Methodology for Time-Series Data using Symbol String Quantization)

  • 김형준;윤태진;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.523-526
    • /
    • 2009
  • 시계열 데이터에서 패턴을 분석하는 기법은 많은 발전이 이루어져 오고 있으나 주식시장의 경우 패턴 분석 및 예측에 관련되어 많은 연구가 이루어져 있지 않고 있다. 이는 주가의 등락 자체가 본질적으로 무작위하다고 생각되어지고 있기 때문이다. 본 연구에서는 주가의 등락이 보여주는 무작위성의 정도를 Kolmogorov Complexity로 측정, 그 무작위성의 정도와 본 논문에서 제시한 반전역정렬로 예측하는 주가의 예측 간의 상관관계를 보인다. 이를 위하여 KOSPI 주식 데이터 28년 690개의 데이터를 수집하여 이들 주식 데이터의 등락을 양자화된 문자열로 변환하여 본 논문에서 제시한 방법의 의미를 평가하였다. 그 결과 Kolmogorov Complexity가 높은 경우에는 주가 변동 예측이 어려우며, Kolmogorov Complexity가 낮은 경우에는 주식 변동 예측은 가능하나 등락 예측 율은 단기 예측은 12%이상의 예측율을 보일 수 없으며, 장기 예측의 경우 54%의 예측율로 수렴함을 확인하였다.

k-fold Wiener Process의 생성에 관한 연구 (A Study on the Generations of k-fold Wiener Process)

  • 최성희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.676-678
    • /
    • 1998
  • 본 논문에서는 Information-Based Complexity분양의 문제들 중 그 complexity를 계산하기 매우 어렵거나 불가능한 문제들의 오차를 분석하기 위해서 k-fold Wiener process를 생성하는 algorithm에 대해 연구하고, 이 algorithm을 실제 프로그램 하였다. 또한 이 프로그램이 생성한 함수가 실제 k-fold Wiener process와 아주 근사하다는 것을 Kolmogorov-Smirnov test를 통하여 보여준다. 이 프로그램을 이용하면 여러 문제들의 average case error를 Monte-Carlo Simulation 과 같은 방법을 사용하여 실험적으로 계산할 수 있다.

A View on the Validity of Central Limit Theorem: An Empirical Study Using Random Samples from Uniform Distribution

  • Lee, Chanmi;Kim, Seungah;Jeong, Jaesik
    • Communications for Statistical Applications and Methods
    • /
    • 제21권6호
    • /
    • pp.539-559
    • /
    • 2014
  • We derive the exact distribution of summation for random samples from uniform distribution and then compare the exact distribution with the approximated normal distribution obtained by the central limit theorem. To check the similarity between two distributions, we consider five existing normality tests based on the difference between the target normal distribution and empirical distribution: Anderson-Darling test, Kolmogorov-Smirnov test, Cramer-von Mises test, Shapiro-Wilk test and Shaprio-Francia test. For the purpose of comparison, those normality tests are applied to the simulated data. It can sometimes be difficult to derive an exact distribution. Thus, we try two different transformations to find out which transform is easier to get the exact distribution in terms of calculation complexity. We compare two transformations and comment on the advantages and disadvantages for each transformation.

Tree Size Distribution Modelling: Moving from Complexity to Finite Mixture

  • Ogana, Friday Nwabueze;Chukwu, Onyekachi;Ajayi, Samuel
    • Journal of Forest and Environmental Science
    • /
    • 제36권1호
    • /
    • pp.7-16
    • /
    • 2020
  • Tree size distribution modelling is an integral part of forest management. Most distribution yield systems rely on some flexible probability models. In this study, a simple finite mixture of two components two-parameter Weibull distribution was compared with complex four-parameter distributions in terms of their fitness to predict tree size distribution of teak (Tectona grandis Linn f) plantations. Also, a system of equation was developed using Seemingly Unrelated Regression wherein the size distributions of the stand were predicted. Generalized beta, Johnson's SB, Logit-Logistic and generalized Weibull distributions were the four-parameter distributions considered. The Kolmogorov-Smirnov test and negative log-likelihood value were used to assess the distributions. The results show that the simple finite mixture outperformed the four-parameter distributions especially in stands that are bimodal and heavily skewed. Twelve models were developed in the system of equation-one for predicting mean diameter, seven for predicting percentiles and four for predicting the parameters of the finite mixture distribution. Predictions from the system of equation are reasonable and compare well with observed distributions of the stand. This simplified mixture would allow for wider application in distribution modelling and can also be integrated as component model in stand density management diagram.

Does a Frontal 2-Electrode Electroencephalogram Provide Sufficient Neuropsychological Information in Various Major Psychiatric Disorders?

  • Sol Han;Hyen-Ho Hwang;Kang-Min Choi;Sungkean Kim;Seung-Hwan Lee
    • 대한불안의학회지
    • /
    • 제20권1호
    • /
    • pp.8-16
    • /
    • 2024
  • Objective : The purpose of this study is to compare the signal obtained from the frontal 2-electrodes EEG with that obtained from the temporal, central, and parietal 2 electrodes. Methods : EEGs were recorded in a total of 67 patients with major depressive disorder (MDD), 104 patients with schizophrenia (SCZ), and 29 patients with Alzheimer's disease (AD). For each disease group, there were healthy controls (HC) that were paired accordingly (HC1=69, HC2=104, HC3=27). The following measurements were compared across electrodes: band power, alpha peak frequency (APF), APF power, alpha asymmetry (AA), and Kolmogorov complexity (KC). Results : Statistically significant differences were found in band power measured from frontal electrodes compared to electrodes placed in other locations. Specifically, the power of theta waves was measured higher in the temporal electorodes, alpha 1 and alpha 2 waves in the parietal, beta 1 and beta 2 in the central, and gamma waves in the temporal electrodes. Both SCZ and AD patients showed increased theta power in all electrodes. In SCZ patients, APF decreased in the central and temporal electrodes, but the APF power analysis showed no difference between the patients and controls. Additionally, AD patients exhibited increased AA in the central EEG, while SCZ patients showed decreased KC in the parietal and temporal electrodes. Conclusion : Depending on the electrode location, sensitive EEG frequencies differed. Compared with signals from other electrodes, frontal EEG in MDD patients revealed generally constant signal values, though the temporo-parieto-central electrodes appeared to be more reliable in SCZ and AD patients.