1. 서론
주가시계열이 정상성(stationarity)을 유지하고 있지 않은 경우에는 ARMA(p,q) 과정의 사용이 불가능하다. 이때는 시계열에 차분을 수행하여 정상성을 얻는다. 시계열의 차분을 정수로 수행하면 정수적분 ARMA(p,d,q) 과정을 얻는다. 여기에서 적분 모수 d는 정수이다. 실증분석에 의하면 정수 차분의 경우 일반적으로 적분 모수 d의 값은 0, 1 또는 2이다. 그런데 어떤 비정상 시계열은 정수로 차분하면, 즉 I(0), I(1), 또는 I(2)를 적용하면, 과도한 차분 또는 적분이 발생하는 경우가 존재하고 있다는 현상도 실증분석이 제시하고 있다. 이때에는 정수차분 대신 분수차분 (fractional differencing)을 수행해야 비로소 정상 시계열을 얻는다. 분수적분 (fractional integration)으로 형성되는 ARMA 과정은 ARFIMA(p,d,q)이며 이 때 d는 정수가 아닌 실수이다.
재무시계열은 I(0)이나 I(1) 과정을 따르고 있지 않는다는 실증 분석이 많다. 이러한 시계열에는 자기상관이 시차가 매우 길어도 존재하고 있다. 다시 말하면 자기 상관이 쌍곡선적으로 감소한다. I(1)를 차분할 때 과도하게 차분(overdifference)되는 재무시계열은 장기 기억 과정을 따를 수 있으며 이 때 d는 실수이다. d값이 0보다 작으면 기억이 없거나 미약한 과정이다. 정상시계열에 있어서 d값이 d ∈(0,1/2)이면 장기기억이 존재한다. 비정상 장기기억 과정에서는 d값이 d∈( 1/2,∞)이다.
시계열의 행동을 규명하는 모형들은 대개가 이 시계열의 정상성(stationarity)을 가정하여 정립되었다. 비정상성을 그대로 두고 시계열의 행동을 해명할 수 있는 시계열 모형의 정립은 극히 초보단계에 있다. 자기회귀(AR) 모형, 이동평균(MA) 모형, 또는 자기회귀 이동평균(ARMA) 모형이 대표적인 정상적 시계열 모형이다. 자기회귀 적분 이동평균 모형인 ARIMA(p,1,q)은 I(1) 과정을 따르는 시계열의 지기회귀 이동평균 ARMA(p,q) 과정인 것이다. ARIMA(p,1,q)과정은 강한 장기기억을 갖고 있는 모형이다. 이 모형에서는 이동 평균 과정을 나타내는 계수가 시간이 흘러가도 0으로 축소되지 않는다. 따라서 이 시계열에 가해진 과거의 충격이 시간의 흐름에 따라 소멸하지 않고 영원히 그 효과를 발휘하고 있다. 이에 비해 ARMA 과정은 단기기억 과정이다. 따라서 이 과정에 가해진 충격은 매우 빠른 시간 내에 소멸하고 만다.
한국 종합 주가지수와 미국의 Dow Jones, Nasdaq, S&P 500, 독일의 Dax와 이탈리아의 Mib30를 사용하여 GPH 통계량을 수정한 통계량을 도출하여 한국 주식시장이 장기기억 과정에 의해 생성되고 있는지 그렇지 않은지를 검정하는데 연구의 목적이 있다.
논문의 순서는 다음과 같다. 제 2장에서는 선행연구를 고찰하고, 제 3장에서는 장기기억 과정과 추정방법을 서술하고, GPH 통계량의 수정통계량을 유도하며 Whittle 통계량을 논의한다. 제 4장에서는 한국 종합 주가지수를 사용하여 장기기억 과정 모수를 추정하고 검정한다. 제 5장에서는 결론 및 시사점을 제시한다.
2. 선행연구 고찰
장기기억 모수는 Hurst(1951)가 추정한 바 있다. 그는 재축적 범위 (R/S) 통계량에 의해 장기기억 모수를 추정하고 있으며 Mandelbrot (1972, 1975)도 이 방법을 사용하여 장기 지속성은 이산시간(fraction Gaussian noise)를 갖는다고 주식 시장을 연구한 바 있다. R/S 통계량은 평균으로부터의 편차의 부분합의 범위를 표준편차를 사용하여 재축적한 수치이다. 다시 말하면,
\(\overline{Q_{n}}=\frac{R_{n}}{S_{n}}=\frac{\max _{1 \leq k \leq n} \sum_{j=1}^{k}\left(X_{j}-\overline{X_{n}}\right)-\min _{1 \leq k} \leq n^{\sum_{j=1}^{k}\left(X_{j}-\overline{X_{n}}\right.}}{\sqrt{\frac{1}{n} \sum_{j=1}^{n}\left(X_{j}-\overline{X_{n}}\right)^{2}}}\) (1)
여기서 \(\overline{\mathrm{X}_{\mathrm{n}}}=\frac{1}{\mathrm{n}} \Sigma_{\mathrm{j}=1}^{\mathrm{n}} \mathrm{X}_{\mathrm{j}}\)로 표본평균이고 Sn은 표본표준편차이다.
그런데 R/S 통계량은 단기기억과 이분산이 존재할 때 강건성(robustness)을 결여하고 있다는 것이 Mandelbrot (1975)와 Lo(1991)에 의해 증명된 바 있다. 이에 따라 Lo(1991)는 수정 재축적 통계량을 다음과 같이 도출한 바 있다.
\(\mathrm{Q}_{\mathrm{n}}=\frac{\mathrm{R}_{\mathrm{n}}}{\widehat{\sigma_{\mathrm{n}}}(\mathrm{q})}\) (2)
\(\hat{\sigma_{\mathrm{n}}}(\mathrm{q})=\hat{\mathrm{c}_{0}}+2 \sum_{j=1}^{\mathrm{k}} \mathrm{w}_{\mathrm{j}}(\mathrm{q}) \hat{\mathrm{c}_{j}}\) (3)
여기서 \(\hat{\mathrm{c}_{j}}\)는 xj의 j번째 차수(order) 표본 공분산이고wj(q) = 1 - j/(q+1) (단, q
Robinson(1994a)은 시계열이 Gauss 분포를 따르고 있다는 가정 아래 최대 가능도법을 사용하여 장기기억과정의 추정량을 도출하였다. Sowell(1990,1992)은 잔차가 무조건부 Gauss 분포를 따른 다는 가정에 입각하여 ARFIMA의 최대 가능도 추정량을 정립하였다. Beran(1994b)은 Gauss 장기 기억 과정을 추정하는 일반 선형 회귀분석법과 M추정량을 제시하였다. Giraitis et al.(2003)은 모수 스펙트럼 밀도함수의 추정법을 개발하였다. Zaffaroni(2003)는 장기 의존 진폭성(volatility) 방법을 정립하였다.
위의 모수적 방법 이외에 반모수적 방법도 정립되었다. Geweke와 Porter Hudak(GPH, 1983)은 주파수 정의역 (frequence domain)에서 d값을 얻는 반모수적 추정량을 제시하고 있다. 이 방법에서는 먼저 페리오도그램(periodogram)을 시계열에서 추정하고 이 값의 로그값을 삼각함수에 회귀하여 d의 값을 얻는다. 이일균(1995)은 GPH 방법을 한국 종합 주가지수에 적용하였는 바 d의 값이 ½ 근방에 머물고 있음을 발견하였다. 그런데 Agiakloglou등 (1992)에 의하면 잔차항이 AR(1)이거나 MA(1)이면 이 방법에는 편의(bias)와 비효율성이 존재하고 있음을 증명하였다. Smith(2005)는 시계열에 level shift가 존재하면 GPH에 의한 장기기억 모수의 값은 정확하지 못하다는 점을 제시하고 있다. 아울러 level shifs가 존재할 때 추정할 수 있는 모형을 정립하였다. 이 점은 절을 달리하여 상술하고자 한다.
Rhee(1999)는 ARFIMA(long memory)모델 (p,d,q,)를 한국 종합 주가 지수를 사용하여 추정하였는 바, 이 지수가 장기기억 과정을 따르고 있음을 발견하였다. Rhee(2003)는 모수 추정 방법을 사용하여 장기기억 모수를 추정하고 Rhee(2003)는 wavelet 변환을 사용하여 한국 주식 시장의 장기기억 과정을 검증하였다. 그 결과 한국 주식시장이 장기기억 과정에 의하여 생성하고 있음 을 발견하였다.
3. 장기기억과정과 추정방법
3.1. 장기기억 과정
국·내외 경제 생태계 환경에 영향력을 행사한 충격이 일시적으로 존재하고 사라지느냐 아니면 영원히 또는 장기적으로 존재하느냐하는 것은 경제 현상을 시계열적으로 파악하고 이해하는 데 중요한 요소이다. 충격이 경제내에 장기기억으로 존재한다면 경제 현상은 경제가 시작되는 순간부터 현재까지의 충격들의 결합적 집합이라 할 수 있다.
시간 정의역에서 정상적 이산시간 시계열은 j 자기상관 함수 (j는 시차)가 다음을 만족하면 장기기억 또는 장기의존성(long range dependence)을 나타내고 있다고 정의된다.
\(\lim _{j \rightarrow \infty} \frac{\rho_{j}}{\mathrm{c}_{\rho} \mathrm{j}^{-\alpha}}=1\) (4)
이때 cp는 상수로 α < cp < ∞이다. 그리고 α는 실수로 0 < α < 1 이다. 이 정의가 함의하고 있는 것은 서로 이어지는 관찰치들 간의 의존성은 시차의 수가 무한으로 접근함에 따라 아주 느리게 천천히 감소해 나간다는 것이다. McLeod와 Hipel(1978)은 장기기억을 다음과 같이 정의하고 있다.
\(\lim _{n \rightarrow \infty} \sum_{j=-n}^{n}\left|\rho_{j}\right|=\infty\) (5)
이때 n은 관찰 개수이다. 위의 두 정의는 단위근을 가지고 있지 않지만 자기상관 함수가 빨리 소멸하지 않고d 있는 과정과 일치한다.
스펙트럼 밀도 함수(spectral density)를 사용하여 장기 기억을 정의 할 수 있다.
밀도 f를 갖는 과정은 다음을 만족할 때 장기기억을 나타내고 있다고 정의한다.
\(\lim _{\lambda \rightarrow \infty} \frac{f(\lambda)}{c_{f}|\lambda|^{-\beta}}=1\) (6)
이때 cf는 상수로 0 < cf < ∞이고 0 < β < 1 이다. 이 정의는 스펙트럼 밀도가 낮은 주파수에서 비유계(unbounded)라는 것을 함의 하고 있다.
Beran(1994a)에 의하면 H를 Hurst 지수 또는 Hurst 계수라 할 때 ½ < H < 1이면 α = 2 -2H이고 β = 2H -1 이다. Hurst 지수(계수)는 장기기억 모수를 나타내는 모수이다. ½ < H < 1 일 때 장기기억이 발생한다. -1 < β < 0 이면 음의 기억(negative memory) 또는 반지속성(antipersistence)이 발생한다.
3.2. 장기기억 반모수 추정량
장기기억의 추정량은 반모수 방법(semiparametric method)에 의하여 도출될 수 있다. Geweke와 Porter-Hudak (GPH, 1983)이 이 모형을 정립하였다. GPH(1983)와 Reisen(1994)을 요약하여 추정량을 제시하고자 한다.
ARFIMA(long memory)models ARIMA(p,d,q)의 d가 정수가 아닌 실수라고 하자. {εt}가 E(εt)이고 \(\sigma_{\epsilon}^{2}>0\)인 백색잡음 과정이라고 하자. B를 BXt = Xt-1로 정의하자. Φ(B)와 Θ(B)를 차수가 p와 q인 다항식이라 하자.
Φ(B) = 1 = Φ1B-…-ΦpBp이고, Θ(B) = 1-Θ1B=-…-ΘqBq로 정의 하자.
시계열 {Χ1}가 다음을 만족하는 선형과정이라 하자.
Φ(B)(1-B)dXt = Θ(B)εt (단, d∈(-0.5,0.5)) (7)
그러면 {Xt}는 일반 분수차분 백색잡음 (GFDWN) 과정이라 한다. 이 때 d를 차분의 정도 (degree)라고 부른다. 다항식 Φ(B)와 Θ(B)는 단위원 외부에서 모든 근을 가지며 같은 근은 없다. Φ(B) = Θ(B) = 1 일 때 {Xt}는 분수차분 백색과정이고 {1-B}dXt = εt로 표시된다. (1-B)d (단, d∈ℝ)는 이항 전개에 의하여 다음과 같다.
\((1-\mathrm{B})^{\mathrm{d}}=\sum_{\mathrm{k}=0}^{\infty}\left(\begin{array}{l} \mathrm{d} \\ \mathrm{k} \end{array}\right\}(-\mathrm{B})^{\mathrm{k}}=1-\mathrm{d} \mathrm{B}-\frac{\mathrm{d}}{2 !} \mathrm{B}^{2}-\ldots\) (8)
Hosking(1981)이 d가 분수값을 취할 때의 GFDWN 과정을 정립하고 그 성질들을 밝힌 바 있으며 이 성질들을 요약하면 다음과 같다.
차분모수 d가 d∈(-0.5, 0.5)라고 하자. 그러면 다음이 성립한다.
(i) GFDWN 과정은 정상적이고 가역적이다.
(ii) 이 과정의 스펙트럼 밀도는 다음과 같다.
\(\mathrm{f}(\mathrm{w})=\mathrm{f}_{\mathrm{u}}(\mathrm{w})\left\{2 \sin \left(\frac{w}{2}\right)\right\}^{-2 d}\) (9)
여기서 fu(w)는 ARIMA(p,q) 과정 Ut = (1 - B)dXt 스펙트럼 밀도이다. 따라서 f(w)는 다음과 같다.
\(\mathrm{f}(\mathrm{w})=\sigma_{\epsilon}^{2} \frac{\left|\theta\left(\mathrm{e}^{-\mathrm{iw}}\right)\right|^{2}}{2 \pi\left|\phi\left(\mathrm{e}^{-\mathrm{iw}}\right)\right|^{2}}\left\{2 \sin \left(\frac{w}{2}\right)\right\}^{-2 d}\) (10)
w→0일 때 lim{w2d f(w)}는 존재하고 유한이다.
(iii) \(\rho_{\mathrm{k}}^{\mathrm{x}}\)가 {Xt}의 자기상관 함수라 하자. 그러면 k→∞일 때 \(\lim \left(\mathrm{k}^{1-2 \mathrm{~d}} \rho_{\mathrm{k}}^{\mathrm{x}}\right)\)가 존재하고 유한이다.
위의 성질 (ii)와 (iii)은 GFDWN 과정이 위에서 정한 d 값 중 양 수값에 대하여 장기기억의 성질을 가진다. 즉 스펙트럼 밀도가 0 의 주파수에서 비유계이고 자기상관 함수는 절대 합산이 가능하지 않다. Geweke와 Porter-Hudak(1983)도 GFDWN 과정을 사용하고 있다.
조화주파수 (harmonic frequencies)
wj = 2π/n, (단, j = 0.1, …, [n/2])의 집합을 고려하자. 여기서 n은 표본의 크기이고 [ ]은 Euler 함수이다. {Xt}가 d∈(-0.5, 0.5)인 ARIMA(p,d,q) 과정이라 하자. 식 (3-2)의 스펙트럼 밀도에 로그를 취하면 다음 식과 같다.
\(\ln \left\{\mathrm{f}\left(\mathrm{w}_{\mathrm{j}}\right)\right\}=\ln \left\{f_{u}(w)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}\) (11)
\(\ln \left\{\mathrm{f}\left(\mathrm{w}_{\mathrm{j}}\right)\right\}=\ln \left\{f_{u}(0)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}+\ln \left\{\frac{f_{u}\left(w_{j}\right)}{f_{u}(0)}\right\}\) (12)
식(12)에 의해 회귀식을 얻을 수 있다.
{Xt}의 관찰치를 X1, X2, …, Xu이라 하자. 그러면 페리오도그램은 다음과 같이 정의된다.
\(\mathrm{I}_{\mathrm{X}}(\mathrm{w})=\frac{1}{2 \pi}\left\{\mathrm{R}(0)+2 \sum_{\mathrm{s}=1}^{\mathrm{n}-1} \mathrm{R}(\mathrm{s}) \cos (s w)\right\},(w \in(-\pi, \pi))\) (13)
여기서 R(s)는 표본자기 공분산 함수로 다음과 같다.
\(\mathrm{R}(\mathrm{s})=\frac{1}{\mathrm{n}} \sum_{\mathrm{i}=1}^{\mathrm{n}-\mathrm{s}}\left(\mathrm{X}_{\mathrm{i}}-\overline{\mathrm{X}}\right)\left(\mathrm{X}_{\mathrm{i}+\mathrm{s}}-\overline{\mathrm{X}}\right), \mathrm{s}=0 .\pm 1, \cdots, \pm(\mathrm{n}-1)\) (14)
여기서 \(\overline{\mathrm{x}}\)는 표본평균이다.
식 (12)의 양 변에 ln{I(wj)}를 더하면 다음 식과 같다.
\(\ln \left\{\mathrm{I}\left(\mathrm{w}_{\mathrm{j}}\right)\right\}=\ln \left\{f_{u}(0)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}+\ln \left\{\frac{f_{u}\left(w_{j}\right)}{f_{u}(0)}\right\}+\ln \left\{\frac{I\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}\) (15)
Reisen(1994)은 ln{fu (wj)/fu (0)}는 위 식의 우변의 다른 항들과 비교할 때 무시해도 좋을 정도라는 것을 보여주었다. 따라서 식 (15)는 다음과 같다.
\(\ln \left\{\mathrm{I}\left(\mathrm{w}_{\mathrm{j}}\right)\right\} \approx \ln \left\{f_{u}(0)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}+\ln \left\{\frac{I\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}\) (16)
위 식은 회귀 방정식으로 표현하면 다음과 같다.
yj = a+bxj + ej, j = 1, 2, …,g(n) (17)
여기서
\(\begin{array}{l} y_{i}=\ln \left\{I\left(w_{j}\right)\right\} \\ x_{j}=\ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2} \\ e_{j}=\ln \left\{\frac{I\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}+c \\ b=-d \\ a=\ln \left\{f_{u}(0)\right\}-c \\ c=E\left[-\ln \left\{\frac{I\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}\right] \end{array}\)
위에서 g(n)은 j의 상극한으로 n→∞ 일 때 g(n)/n→0이 되도록 선택된 수이다.
식 (17)의 추정량은 회귀 방정식의 성질에 의하여 다음과 같다.
\(\hat{b}=\frac{\sum_{i-1}^{g(n)}\left(x_{i}-\bar{x}\right) y_{i}}{\sum_{1=1}^{g(n)}\left(x_{i}-\bar{x}\right)^{2}}\) (18)
회귀방법에서 페리오도그램을 사용하여 얻게 되는 d의 추정량은 \(\hat{\mathrm{d}}_{\mathrm{p}}=-\hat{\mathrm{b}}\)이다. 여기서\(E\left(\widehat{\mathrm{d}}_{\mathrm{p}}\right)=\mathrm{d}\)이고 분산은 다음과 같다.
\(\operatorname{var}\left(\widehat{\mathrm{d}}_{\mathrm{p}}\right)=\frac{\pi^{2}}{6 \sum_{\mathrm{i}=1}^{\mathrm{g}(\mathrm{n})}\left(\mathrm{x}_{\mathrm{i}}-\overline{\mathrm{x}}\right)^{2}}\) (19)
GPH(1983)는 \(\hat{\mathrm{d}}_{\mathrm{p}}\)의 점근분포를 제시하였다. GPH는 g(n) = nα(단, 0<α<1)로 취할 것을 권고하고 있다.
lim(lnn)2 /g(n)}=0이면 \(\left(\hat{\mathrm{d}}_{\mathrm{p}}-\mathrm{d}\right) /\left\{\operatorname{var}\left(\hat{\mathrm{d}}_{\mathrm{p}}\right)\right\}^{1 / 2}\)은 N(0,1)의 점근분포를 가진다는 것을 GPH는 증명하였다.
페리오도그램은 lag window를 사용하여 매끄럽게 (smooth) 할 수 있다. 매끄러운 페리오도그램을 fs(w)라 하면 이것은 다음 형태를 취한다.
\(\mathrm{f}_{\mathrm{s}}(\mathrm{w})=\frac{1}{2 \pi} \sum_{\mathrm{s=-m}}^{\mathrm{m}} \mathrm{k}\left(\frac{\mathrm{s}}{\mathrm{m}}\right) \mathrm{R}(\mathrm{s}) \cos \left(s w_{j}\right)\) (20)
위에서 k(u)는 lag window 작용소이다. k(u)는 –1 < u < 1 이고 k(0)=1, k(-u)=u인 고정된 연속 우함수 (even function)이다. 모수 m은 n→∞일 때 (m/n)→0이 되도록 선택된 표본의 크기 n의 함수이다. m=nβ (단, 0<β<1)로 선택할 수 있다. 많이 사용되는 lag window 생성소 중의 하나인 Parzen lag window를 제시하면 다음과 같다.
\(\mathrm{k}(\mathrm{u})=\left\{\begin{array}{cl} 1-6 \mathrm{u}^{2}+6|\mathrm{u}|^{3} & \frac{|\mathrm{u}| \leq 1}{2} \\ 2(1-|\mathrm{u}|)^{3} & -\frac{1}{2}<\mathrm{u} \leq 1 \\ 0 & |\mathrm{u}|>1 \end{array}\right.\) (21)
식 (12)에 의하여 매끄러운 페리오도그램에 입각한 회귀 방정식은 다음의 형태를 가진다.
\(\ln \left\{\mathrm{f}_{\mathrm{s}}\left(\mathrm{w}_{\mathrm{j}}\right)\right\}=\ln \left\{f_{u}(0)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}+\ln \left\{\frac{f_{s}\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}+\ln \left\{\frac{f_{u}\left(w_{j)}\right.}{f_{u}(0)}\right\}\) (22)
앞에서와 같이 j의 범위를 1≤j≤g(n)으로 정의하면 위 식은 다음과 같다.
\(\ln \left\{\mathrm{f}_{\mathrm{s}}\left(\mathrm{w}_{\mathrm{j}}\right)\right\} \approx \ln \left\{f_{u}(0)\right\}-d \ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2}+\ln \left\{\frac{f_{s}\left(w_{j}\right)}{f\left(w_{j}\right)}\right\}\) (23)
위 식은 다음과 같이 간단히 표현할 수 있다.
\(\begin{array}{l} y_{j}=a+b x_{j}+e_{j}, j=1,2, \cdots, g(n) \\ y_{i}=\ln \left\{f_{s}\left(w_{j}\right)\right\} \\ x_{j}=\ln \left\{2 \sin \left(\frac{w_{j}}{2}\right)\right\}^{2} \\ e_{j}=\ln \left\{\frac{f_{s}\left(w_{j}\right)}{f\left(w_{j}\right)}\right\} \\ b=-d \\ a=\ln \left\{f_{u}(0)\right\} \end{array}\)
위의 회귀 방정식의 추정량은 다음과 같다.
\(\hat{b}=\frac{\sum_{i-1}^{g(n)}\left(x_{i}-\bar{x}\right) y_{i}}{\sum_{i=1}^{g(n)}\left(x_{i}-\bar{x}\right)^{2}}\) (24)
이에 대응되는 분산은 다음과 같다.
\(\operatorname{var}\left(\widehat{\mathrm{d}_{\mathrm{sp}}}\right) \approx 0.35928 \frac{\mathrm{m}}{\mathrm{n} \sum_{\mathrm{i}=1}^{\mathrm{g}(\mathrm{n})}\left(\mathrm{x}_{\mathrm{i}}-\overline{\mathrm{x}}\right)^{2}}, \mathrm{w} \neq 0, \pi\) (25)
3.3. 수정 반모수 추정
장기 기억 과정은 충격이 발생하면 지수함수적으로 소멸하지 않고 쌍곡선적으로 무척 느리게 감소하다가 소멸하는 과정이다. 따라서 무척 지속적이다. 그러나 궁극적으로는 평균에 회귀하는 과정이다. 이 성질로 인하여 주가의 진폭성(volatility), 상품 가격, 이자율과 같은 재무시계열에 많이 적용되고 있다. 시계열에서 나타나는 장기기억은 level shifts에 의한 환상에 불과하는 연구가 Granger & Ding(1996), Breidt & Hsu(2002) 등에 의해 진행되었다. 이 같은 제안이 옳다면 몇몇 개의 충격은 지속성을 갖고 있지만 많은 충격은 급속히 소멸하는 것이다. 반면 장기기억에서는 모든 충격이 지속성을 가지는 것이다. 따라서 장기 기억과 level shifts의 구별이 중요시된다.
Smith(2005)는 level shifts가 시계열을 장기기억과정으로 표현 시키고 있다는 점을 고려하며 장기기억에 대한 여러 검정이 평균이 천천히 변하는 단기기억 과장에 적용할 때 상당한 편의를 가지고 있다는 점을 지적하고 이로 인해 level shifts를 갖는 시계열이 장기 기억을 가진다는 그릇된 결론을 이끌어 내게 되었다는 점을 증명하고 있다.
Smith(2005)를 요약하고 그 결과를 GPH 추정량에 적용해 보도록 하자. 위에서 제시한 장기기억 모수 d의 GPH 추정치는 \(\mathrm{X}_{\mathrm{j}}=\ln \left(2-2 \cos \left(w_{j}\right)\right) \approx-\ln w_{j}^{2}(j=1,2, \cdots, J)\)에 대한 로그 페리오도그램의 회귀식의 최소자승 계수로 요약 할 수 있다. 이 때 wj = 2πj/n이고 J1/2로 제시하고 있다.
GPH 추정치는 다음과 같이 쓸 수 있다.
\(\hat{\mathrm{d}}=\mathrm{d}_{*}+\frac{\sum_{j=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\overline{\mathrm{X}}\right) \ln \left(\hat{f}_{j} / f_{j}\right)}{\sum_{\mathrm{j}=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\hat{\mathrm{X}}\right)^{2}}\) (26)
여기서 \(\hat{\mathrm{f}}_{\mathrm{j}}\)는 wj에서 평가된 페리오도그램이고 fj는 wj에서 평가 된 스펙트럼이다. 그리고 d는 다음과 같다.
\(\mathrm{d}_{*}=\frac{\sum_{\mathrm{j}=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\overline{\mathrm{X}}\right) \ln f_{j}}{\Sigma_{\mathrm{j}=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\hat{\mathrm{X}}\right)^{2}}\) (27)
단기기억을 갖는 평균 플러스 잡음 (mean-plus-noise : MN) 과정은 다음과 같다.
\(\begin{aligned} \mathrm{z}_{\mathrm{t}} &=\mu_{\mathrm{t}}+\epsilon_{\mathrm{t}} \\ \mu_{\mathrm{t}} &=(1-\mathrm{p}) \mu_{\mathrm{t}-1}+\sqrt{\mathrm{p}} \eta_{\mathrm{t}} \end{aligned}\) (28)
여기서 ∈t와 ηt는 분산이 0이 아니고 유한인 단기 과정이다. 정규 분포성을 가정하면 GPH 추정량은 이 과정에 적용할 때 일치성과 점근적 정규성을 가진다.
MN 과정에서 d의 참값은 0이고 GPH 추정량의 편의는 다음과 같다.
\(\text { bias }(\hat{\mathrm{d}})=\mathrm{d}_{*}+\frac{\sum_{\mathrm{j}=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\overline{\mathrm{X}}\right) \mathrm{E}\left(\ln \left(\hat{f}_{j} / f_{j}\right)\right.}{\sum_{\mathrm{j}=1}^{\mathrm{J}}\left(\mathrm{X}_{\mathrm{j}}-\overline{\mathrm{X}}\right)^{2}}\) (29)
이 때 우변의 첫 항 d*는 시계열의 단기 기억 성분에 의해 유도되는 편의이다. 두째 항은 대수 페리오도그램이 대수 스펙트럼의 편의된 추정량이기 때문에 발생한다. MN 과정에 의해 시계열이 생성될 때 GPH 통계값은 장기기억 과정이 아닌 과정을 장기기억 과정이라고 잘못 평가하는 오류를 갖는다.
Smith (2005)는 pn = kJ/n (단, k는 상수로 k>0임)으로 놓고 d의 가능 추정량을 도출하였다. 그가 제시하고 있는 회귀식은 다음과 같다.
\(\ln \hat{\mathrm{f}}_{\mathrm{j}}=\alpha+\mathrm{d} \mathrm{X}_{\mathrm{j}}+\beta \mathrm{Z}_{\mathrm{kj}}+\hat{\mu}_{\mathrm{j}}\) (30)
여기서
\(\begin{array}{l} \mathrm{Z}_{\mathrm{kj}}=-\ln \left(\frac{(k J)^{2}}{n^{2}}+w_{j}^{2}\right) \\ \mathrm{X}_{\mathrm{j}}=-\ln \left(2-2 \cos \left(w_{j}\right)\right) \end{array}\)
수정 GPH 추정량은 아래와 같다.
\(\widehat{\mathrm{d}}^{2}=\mathrm{d}_{*}^{\mathrm{k}}+\left(\tilde{\mathrm{X}}^{\prime} \mathrm{M}_{\mathrm{Z}} \tilde{\mathrm{X}}\right)^{-1} \tilde{\mathrm{X}}^{\prime} \mathrm{M}_{\mathrm{Z}} \ln (\hat{f} / f)\) (31)
여기서
\(\begin{array}{l} \tilde{\mathrm{X}}=\mathrm{X}-\overline{\mathrm{X}} \\ \mathrm{M}_{\mathrm{Z}}=1-\widetilde{\mathrm{Z}}_{\mathrm{k}}\left(\widetilde{\mathrm{Z}}_{\mathrm{k}}^{\prime} \overline{\mathrm{Z}}_{\mathrm{k}}\right)^{-1} \widetilde{\mathrm{Z}}_{\mathrm{k}}^{\prime} \\ \quad{\widetilde{Z}}_{\mathrm{k}}=Z_{\mathrm{k}}-\bar{Z} \\ \overline{\mathrm{X}}=\mathrm{J}^{-1} \sum_{\mathrm{j}=1}^{\mathrm{J}} \mathrm{X}_{\mathrm{j}} \\ \overline{\mathrm{Z}}=\mathrm{J}^{-1} \sum_{j=1}^{\mathrm{J}} \mathrm{Z}_{\mathrm{kj}} \end{array}\)
그리고 \(\mathrm{d}_{*}^{\mathrm{k}}\)는 페리오도그램이 아니라 스펙트럼으로부터 계산된 추정량이다.
Smith(2005)는 k =1,3,5를 선택할 것을 시뮬레이션을 통하여 권하고 있다. 그리고 J = n1/2이 적당하다고 주장하고 있다.
Whittle(1951), Tox & Taggu(1986), Beran(1994a)은 Whittle 추정량을 개발하였다. Whittle 추정량은 페리오도그램에 입각하고 있다. 이 추정량은 다음 함수를 최소화하는 벡터 η이다.
\(\mathrm{Q}(\eta)=\int_{-\pi}^{\pi} \frac{\mathrm{I}(\lambda)}{\mathrm{f}(\lambda ; \eta)} \mathrm{d} \lambda\) (32)
여기서 I(λ)는 페리오도그램이고 f(λ;η)는 주파수 λ에서의 스펙 트럼 밀도이다. 주파수가 이산적인 경우 이 추정량은 다음 형태를 취한다.
\(\mathrm{Q}(\eta)=\frac{1}{2 \pi \mathrm{n}} \sum_{j=1}^{\mathrm{n}} \frac{\mathrm{I}\left(\lambda_{\mathrm{j}}\right)}{\mathrm{f}\left(\lambda_{\mathrm{j}} ; \eta\right)}\) (33)
위에서 λj = 2πj/n은 Fourier 주파수이다. ARFIMA(long memory; p,d,q)에서 벡터 η가 자기회귀, 이동평균과 장기기억 계수들의 추정치이다. 분수 백색잡음 과정에서 η는 장기 모수 d로 귀결된다.
4. 실증분석 결과
주식유통시장이 장기기억과정에 의해 행동하고 있는지의 특성을 분석하기 위해 사용된 데이터는 1980년 이후부터의 한국종합주가지수이다. 기간은 1980년부터 2004년이다. 일별주가지수를 사용하였으며 수익률은 로그 수익률이다.
[Figure 1] Since 1980, the Korea Composite Stock Price Index Trend
Source: wikipedia (2014).
[Figure 2] 1993-2008 monthly composite index trend
Source: wikipedia (2015).
장기기억 모수 또는 분수차분 모수의 추정값은 [Table 1]과 같다. GPH 추정값은 0.1765이다. 따라서 GPH추정방법에 의할 때 한국종합주가지수의 일별 로그 수익률은 장기기억과정을 따르고 있다. 이 검정방법이 정확하다면 주가에 대하여는 ARIMA 과정보다는 ARFIMA과정을 사용해야 한다.
[Table 1] Long-term memory parameters
[Table 1]에 의하면, GPH방법을 level shifts를 고려하여 수정한 수정한 방법을 따라 추정한 값은 주식시장이 장기기억 과정을 따르고 있지 않음을 보여주고 있다. [Table1 1]에서 보는 바와 같이 장기기억 모수가 모두 기각에 실패되고 있기 때문이다. 그뿐만 아니라 k값에 따라 모수 추정값이 상당한 변화를 보이고 있다. k가 증가함에 따라 장기기억 모수는 0에 접근하고 있다. 이것은 종합주가지수의 로그 수익률 시계열이 I(0)의 차분과정을 따르고 있음을 의미한다. 따라서 ARIMA과정이나 ARFIMA과정보다는 ARMA과정이 주식시장의 운동을 설명하고 있다고 보아야 할 것이다.
주식시장에는 구조변화가 존재하고 있으며, 구조변화는 level shifts(층위이동)를 함의한다. 층위이동이 주식시장에 존재하고 있음에 불구하고 이 사실을 고려하지 않고 장기기억을 검정하면 층위이동이 야기시키는 편의(bias)가 검정통계량에 존재하여 비장기 기억 과정도 장기기억인것양 에러를 범하게 할 수 있다. 이런 결과는 분명히 오도된 결과인 것이다. 층위이동을 고려할 때 주식시장은 장기기억 과정이나 분수차분과정을 따르고 있지 않는다는 것이 표가 제시하고 있는 증거이다. 나아가 정수차분과정도 성립하고 있지 않다. 따라서 단순한 자기회귀 이동평균 모형인 ARMA과정이 주식시장의 운동법칙이라고 할 수 있을 것이다.
분수차분모수는 시계열상관을 기본으로 하여 추정되고 있다. 이 상관계수의 움직임을 파악하기 위하여 시계열 상관계수를 구하였는 바, 이를 제시하면 [Table 2]와 같다.
[Table 2] Autocorrelation
주식유통시장의 일별 KOSPI지수의 전일 대비 증가 변화폭과 변화률 및 종합주가지수의 추이를 100포인트 종가 기준 돌파일을 조사한 바 이를 제시하면 [Table 3]와 [Table 4]와 같다.
[Table 3] Retail market shares rise and fall : Monthly changes KOSPI index Top 20
Note: The KOSPI increased compared to previous day variation and change, Baedangrakil the beginning of each year, except that reflect work
Source: smallake (2015).
[Table 4] Previous KOSPI stocks secondary market trends
Note: Based on the closing price surpassed 100 points per day
[Table 2]의 시계열 상관계수는 지수율로 급격히 소멸하는 양태를 띄고 있음을 볼 수 있다. 시차 초기의 시계열 상관만으로서는 주가수익률이 장기기억과정을 따르고 있는지의 여부를 판별하기가 용이하지 않다. 오히려 단기과정을 따르고 있는 것 같이 보인다. 그러나 시차 10에 이르면 상당히 안정되어 있으므로 주가시계열은 초기단계는 지수감소율로 감소하다가 일정 기간이 경과한 후에 쌍곡선율로 감소하는 양태를 따를 수 있다. 따라서 초기에는 지수율로 그 다음에는 쌍곡선율로 주가의 시계열 상관이 감소하여 소멸하는 과정을 따르고 있다는 상정도 가능하다.
이 점을 보다 잘 살펴보기 위하여 Kospi의 시계열 상관을 그래프화하였다. 이를 제시하 면 [Figure 3]과 같다. [Figure 3]에 의하면 시계열 상관이 궁국적으로 소멸하고 있으나 상당한 변동성을 가지고 있음을 알 수 있다. 따라서 시계열 상관이 지수적 감소율로 소멸한다고 보기는 어렵다. 그러나 일정기간이 지나면 시계열 상관은 상당한 안정성을 유지하면서서서히 감소하고 있음을 볼 수 있다.
[Figure 3] Any time series of returns
Note: The KOSPI increased compared to previous day variation and change, Baedangrakil the beginning of each year, except that reflect work
Source: smallake (2015).
주가 수익률의 시계열상관만으로서는 수익률시계열이 단기기억과정에 의하여 생성되고 있는지 또는 장기기억과정에 의하여 생성되고 있는지를 판단하기가 어려우므로 주가수익률의 제곱값과 절대값의 시계열 상관을 하였다. 이를 [Figure 4]와 [Figure 5]로 제시한다. 이 그림에 의하면 초기에는 시계열 상관이 지수율로 감소하고 있다. 그러나 일정시간이 지나면 무척 완만한 속도로 감소하여 소멸함을 볼 수 있다. 따라서 주가시계열이 장기기억과정에 의하여 생성되고 있을 가능성이 상당히 높다.
[Figure 4] Time series of squares yields
Note: Based on the closing price surpassed 100 points per day
[Figure 5] Any time series of absolute return
6. 결론 및 시사점
어느 한 시계열에 층위이동이 존재할 때 Geweke & Porter-Hudak(1983)이 정립한 장기기억과정에 대한 검정방법은 무시할 수 없는 상당량의 편의를 가지고 있다. 주식시장에는 구조변화가 실제로 존속하고 있다는 실증분석이 있으며 구조변화는 필연적으로 층위이동을 함의한다. 층위이동을 반영하여 GPH방법의 수정이 가능하고 이때 GPH방법에 내재하고 있는 편의가 제거된다.
층위이동일 고려하여 수정된 GPH방법을 한국종합주가지수의 일별 로그 수익률에 적용하여 실증분석을 수행하였다. 그 결과 주가는 장기기억과정 또는 분수차분과정을 따르고 있지 않고 있음이 발견되었다. 그 뿐만 아니라 주가는 정수차분과정도 따르지 않고 있다. 오히려 I(0)적분과정을 따르고 있음이 밝혀졌다. 따라서 ARMA과정이 주가의 운동법칙을 해명하는 적절한 모형인 것이다. 층위이동을 고려하지 않은 GPH방법을 사용하여 장기기억 모수를 검정하였는 바, 주가가 장기기억과정에 생성되고 있다는 결과를 얻었다. 층위이동이 주식시장에 엄연히 존재하고 있는 만큼 층위 이동을 고려하지 않은 검정은 편의를 야기시켜 그릇된 결과를 도출시킨다.
장기기억 특성의 변화는 두 가지 시사점을 제시한다. 첫 번째, 어떠한 충격이 유입되는 경우 오랜 기간 동안 천천히 평균 회귀하는 특성인 장기기억의 존재를 알게 되었다. 이는 투자자들이 향후 장기기억 특성까지 고려하는 투자의사결정이 필요함을 시사하고 있다. 특히, 글로벌 금융위기와 같은 거대한 충격에 의해 비효율성이 강해짐으로써 랜덤워크를 따르지 않으며 시장과 투자자들에게 정보전달이 신속, 정확하게 전달되지 않아 불확실성 증가의 원인이 될 수 있기 때문에 이와 관련된 장기기억의 특성은 보다 신중히 고려되어져야 함을 시사하고 있다.
두 번째 시사점은 장기기억의 특성을 고려함에 있어서도 시간의 변화까지 생각하여야 하며, 이러한 변화는 투자자들이 목표투자기간에 맞추어 시간창을 달리하여야 한다는 것이다.
실제의 투자활동에 있어서 정확한 예측을 이루어 낼 수 없다. 그뿐만 아니라 주가시계열이 단위근 비정상적 과정에 의해 생성되는 시기에는 비정상적 시계열 모형을 사용하여 이 시계열의 성질과 특성을 밝혀야 한다. 주가 시계열이 비정상적 과정에 의하여 생성되는 경우에는 시계열 내에 장기기억이 존재할 수 있으며 재무시계열 상의 수익률과 위험에 관한 연구에는 시간 가변적인 장기기억 특성이 있음을 조합하여야 앞으로 더 높은 예측력을 가질 수 있는 것이다.
향후 주가 시계열이 정상적 과정에서 비정상적 장기기억 과정으로 변환하고 있는지에 대한 연구도 요청되고 있다.