• 제목/요약/키워드: volatility models

검색결과 191건 처리시간 0.023초

DSGE 모형을 이용한 추세와 경기순환변동분의 분해 (Trend/Cycle Decomposition Using DSGE Models)

  • 황영진
    • KDI Journal of Economic Policy
    • /
    • 제34권4호
    • /
    • pp.117-156
    • /
    • 2012
  • 본 논문은 간단한 동태적 확률 일반균형(DSGE) 모형과 탄력적 추세를 고려한 비관측인자모형을 결합하여, DSGE 모형의 추정과 추세/순환변동분의 분해를 동시에 시도하였다. 이를 통해 추정된 GDP 순환변동분은 공식 경기순환 국면과 상당 정도 부합하는 등 전반적으로 경기순환을 잘 반영하는 것으로 나타났다. 하지만 변동성과 지속성의 측면에서 통상적 필터링 방법을 이용한 경우와는 적지 않은 차이가 있었으며, 특히 GDP의 추세분은 상당한 변동성을 보이며 경기순응적 모습을 보였다. 추정된 순환변동분의 성격을 변수별로 살펴보면, GDP와 이자율의 경우는 HP 필터의 결과와 유사한 반면, 인플레이션의 경우는 (불규칙 변동분을 추가로 제외한 경우) BK 필터를 이용한 결과와 상대적으로 더 유사한 것으로 나타났다. 이는 분석대상 변수들에 임의의 단일한 필터링 방법을 적용할 경우, 경기순환분의 성격이 잠재적으로 왜곡되어 추출될 우려가 있음을 보여준다. 습관 및 가격연동을 포함한 확장모형을 고려한 경우, 습관은 경기변동의 지속성을 설명함에 있어 중요한 요소인 것으로 평가된 반면, 가격연동은 그 중요성이 제한적인 것으로 나타났다. 이러한 모형의 개별 요소들에 대한 평가 결과는, 사전 필터링된 자료를 이용하여 추정한 경우와 적지 않은 차이를 보여, 자료의 필터링과 모형의 추정을 분리하여 고려하는 일반적인 DSGE 모형의 추정 및 분석은 잠재적으로 오류의 가능성이 있음을 시사한다. 마지막으로 결과에 대한 다양한 민감도 분석 결과, (i) 순환변동 충격과 추세 충격이 상관관계를 가지는 경우, 추세 충격의 성격에 따라 추정된 GDP갭의 성격이 상당 부분 달라지기도 했으며, (ii) 불규칙 변동분의 포함 여부가 추정된 인플레이션갭의 성격 및 필립스 곡선의 기울기 등에 중요한 함의를 지니는 것으로 나타났다. 또한 (iii) 경기변동분을 VAR로 모형화한 경우, DSGE 모형을 이용한 경우에 나타나는 경기변동의 비대칭성을 제대로 나타내지 못하는 것으로 나타났다.

  • PDF

인공지능의 사회적 수용도에 따른 키워드 검색량 기반 주가예측모형 비교연구 (Comparison of Models for Stock Price Prediction Based on Keyword Search Volume According to the Social Acceptance of Artificial Intelligence)

  • 조유정;손권상;권오병
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.103-128
    • /
    • 2021
  • 최근 주식의 수익률과 거래량을 설명하는 주요 요인으로서 투자자의 관심도와 주식 관련 정보 전파의 영향력이 부각되고 있다. 또한 인공지능과 같은 혁신 신기술을 개발보급하거나 활용하려는 기업의 경우 거시환경 및 시장 불확실성 때문에 기업의 미래 주식 수익률과 주식 변동성을 예측하기 어렵다는 문제를 가지고 있다. 이는 인공지능 활성화의 장애요인으로 인식되고 있다. 따라서 본 연구의 목적은 인공지능 관련 기술 키워드의 인터넷 검색량을 투자자의 관심 척도로 사용하여, 기업의 주가 변동성을 예측하는 기계학습 모형을 제안하는 것이다. 이를 위해 심층신경망 LSTM(Long Short-Term Memory)과 벡터자기회귀(Vector Autoregression)를 통해 주식시장을 예측하고, 기술의 사회적 수용 단계에 따라 키워드 검색량을 활용한 주가예측 성능 비교를 통해 기업의 투자수익 예측이나 투자자들의 투자전략 의사결정을 지원하는 주가 예측 모형을 구축하였다. 또한 인공지능 기술의 세부 하위 기술에 대한 분석도 실시하여 기술 수용 단계에 따른 세부 기술 키워드 검색량의 변화를 살펴보고 세부기술에 대한 관심도가 주식시장 예측에 미치는 영향을 살펴보았다. 이를 위해 본 연구에서는 인공지능, 딥러닝, 머신러닝 키워드를 선정하여, 2015년 1월 1일부터 2019년 12월 31일까지 5년간의 인터넷 주별 검색량 데이터와 코스닥 상장 기업의 주가 및 거래량 데이터를 수집하여 분석에 활용하였다. 분석 결과 인공지능 기술에 대한 키워드 검색량은 사회적 수용 단계가 진행될수록 증가하는 것으로 나타났고, 기술 키워드를 기반으로 주가예측을 하였을 경우 인식(Awareness)단계에서 가장 높은 정확도를 보였으며, 키워드별로 가장 좋은 예측 성능을 보이는 수용 단계가 다르게 나타남을 확인하였다. 따라서 기술 키워드를 활용한 주가 예측 모델 구축을 위해서는 해당 기술의 하위 기술 분류를 고려할 필요가 있다. 본 연구의 결과는 혁신기술을 기반으로 기업의 투자수익률을 예측하기 위해서는 기술에 대한 대중의 관심이 급증하는 인식 단계를 포착하는 것이 중요하다는 점을 시사한다. 또한 최근 금융권에서 선보이고 있는 빅데이터 기반 로보어드바이저(Robo-advisor) 등 투자 의사 결정 지원 시스템 개발 시 기술의 사회적 수용도를 세분화하여 키워드 검색량 변화를 통해 예측 모델의 정확도를 개선할 수 있다는 점을 시사하고 있다.

한국 주식시장에서 총수익성 프리미엄에 관한 분석 및 펀드 유통산업에 주는 시사점 (Gross Profitability Premium in the Korean Stock Market and Its Implication for the Fund Distribution Industry)

  • 윤보현;유원석
    • 유통과학연구
    • /
    • 제13권9호
    • /
    • pp.37-45
    • /
    • 2015
  • Purpose - This paper's aim is to investigate whether or not gross profitability explains the cross-sectional variation of the stock returns in the Korean stock market. Gross profitability is an alternative profitability measure proposed by Novy-Marx in 2013 to predict cross-sectional variation of stock returns in the US. He shows that the gross profitability adds explanatory power to the Fama-French 3 factor model. Interestingly, gross profitability is negatively correlated with the book-to-market ratio. By confirming the gross profitability premium in the Korean stock market, we may provide some implications regarding the well-known value premium. In addition, our empirical results may provide opportunities for the fund distribution industry to promote brand new styles of funds. Research design, data, and methodology - For our empirical analysis, we collect monthly market prices of all the companies listed on the Korea Composite Stock Price Index (KOSPI) of the Korea Exchanges (KRX). Our sample period covers July1994 to December2014. The data from the company financial statementsare provided by the financial information company WISEfn. First, using Fama-Macbeth cross-sectional regression, we investigate the relation between gross profitability and stock return performance. For robustness in analyzing the performance of the gross profitability strategy, we consider value weighted portfolio returns as well as equally weighted portfolio returns. Next, using Fama-French 3 factor models, we examine whether or not the gross profitability strategy generates excess returns when firmsize and the book-to-market ratio are controlled. Finally, we analyze the effect of firm size and the book-to-market ratio on the gross profitability strategy. Results - First, through the Fama-MacBeth cross-sectional regression, we show that gross profitability has almost the same explanatory power as the book-to-market ratio in explaining the cross-sectional variation of the Korean stock market. Second, we find evidence that gross profitability is a statistically significant variable for explaining cross-sectional stock returns when the size and the value effect are controlled. Third, we show that gross profitability, which is positively correlated with stock returns and firm size, is negatively correlated with the book-to-market ratio. From the perspective of portfolio management, our results imply that since the gross profitability strategy is a distinctive growth strategy, value strategies can be improved by hedging with the gross profitability strategy. Conclusions - Our empirical results confirm the existence of a gross profitability premium in the Korean stock market. From the perspective of the fund distribution industry, the gross profitability portfolio is worthy of attention. Since the value strategy portfolio returns are negatively correlated with the gross profitability strategy portfolio returns, by mixing both portfolios, investors could be better off without additional risk. However, the profitable firms are dissimilar from the value firms (high book-to-market ratio firms); therefore, an alternative factor model including gross profitability may help us understand the economic implications of the well-known anomalies such as value premium, momentum, and low volatility. We reserve these topics for future research.

서울 오피스 신규 공급 결정요인과 동태적 관계분석 (The Determinants of New Supply in the Seoul Office Market and their Dynamic Relationship)

  • 양혜선;강창덕
    • 지적과 국토정보
    • /
    • 제47권2호
    • /
    • pp.159-174
    • /
    • 2017
  • 오피스의 수급 불균형은 도시 성장을 약화시킨다. 오피스의 초과공급이 공실률을 높이고 임대료가 하락하는 등 시장의 불안정성을 키울 수 있기 때문이다. 또한 오피스의 초과수요가 기업의 임차비용을 상승시켜 도시의 산업 성장을 제한할 수 있다. 최근 대규모의 신규 공급이 서울 오피스시장의 변동성을 높였다. 그럼에도 불구하고 오피스 공급에 대한 연구는 미미한 실정이다. 따라서 본 연구는 서울 오피스 신규 공급의 영향요인을 확인하고 수급 불균형의 주요 원인인 시차를 고려하여 결정요인들의 동태적 구조적인 움직임을 분석하였다. 이를 위해 시계열모형인 벡터오차수정모형(VECM)을 활용하여 2003년부터 2015년까지 서울 오피스시장의 분기별 자료를 분석하였다. 분석결과, 서울 오피스 신규 공급에 영향을 주는 요인은 1분기 전 오피스 신규 공급량(-), 1분기 전 오피스 고용자 수(+), 2분기 전 이자율(+), 1분기 전 cap rate(-), 2분기 전 cap rate(-)으로 확인되었다. 이를 바탕으로 영향요인들 간의 시간에 따른 상호의존성과 변동에 따른 상대적 기여도를 분석한 결과, 이자율과 cap rate은 신규 공급량에 단기적인 영향을 미친 반면 고용과 공실률은 장기적이고 지속적인 영향을 미쳤다. 따라서 예측 가능한 오피스 시장 전망을 위해서는 이러한 오피스 신규 공급 영향요인에 대한 공신력 있는 자료 구축이 필요하고 지속적인 모니터링이 필요하다. 오피스는 기업과 산업의 성장을 이끄는 핵심적인 도시인프라이기 때문이다.

BTO 민간투자사업 해지시지급금 매수청구권 가치에 관한 연구 (A Study on Early Termination Payment Option of BTO PPI Projects)

  • 신성환
    • 한국건설관리학회논문집
    • /
    • 제12권3호
    • /
    • pp.121-130
    • /
    • 2011
  • 본 논문에서는 민간투자사업에서 사업시행자가 보유하고 있는 해지시지급금에 대한 매수청구권의 가치를 이항모형을 통한 실물옵션 가치추정 방법론을 사용하여 추정하였다. 매수청구권은 사업시행자의 부도조건부 매수청구권과 부도조건이 없는 매수청구권으로 구분하여 가치를 추정하였고, 해지시지급금은 사업자귀책인 경우의 금액으로 가정하였다. 운영수입, 운영비용, 사업수익률, 부채비율, 운영수입의 변동성 등에 따라 매수청구권의 가치는 달라지는데, 부도조건이 없는 매수청구권 가치는 대략 총사업비의 1%~7% 수준으로 추정되었고 부도조건부 매수청구권의 경우 0%~1.89% 수준으로 추정되었다. 민간투자사업의 수요예측위험의 영향을 파악하기 위해 실제 운영수입이 예상수입과 다른 경우의 매수청구권 가치도 추정하였다. 실제 운영수입이 예상수입에 못 미치는 경우 매수청구권 가치는 큰 폭으로 상승하는 반면 반대의 경우는 매수청구권 가치가 소폭 하락하는 것으로 추정되었다. 이는 수요예측의 불확실성이 큰 경우 실시협약 시점에서의 매수청구권 가치는 예상수입을 가정한 매수청구권 가치보다 상당히 클 수 있다는 점을 의미한다. 본 논문은 향후 해지시지급금 제도를 개선하는데 기여할 수 있을 것으로 기대된다.

케이프사이즈와 파나막스 시장간의 비대칭 시간가변 파급효과에 관한 분석 (An Analysis on the Asymmetric Time Varying Spillover Effect between Capesize and Panamax Markets)

  • 정상국
    • 한국항만경제학회지
    • /
    • 제27권3호
    • /
    • pp.41-64
    • /
    • 2011
  • 이 연구는 케이프사이즈 시장과 파나막스 시장간의 비대칭 시간 가변 파급효과를 분석하기 위해서 조건부 평균에 전통적인 공적분항과 부분공적분항을 고려하고 있고, 조건부 분산에 레버리지 효과를 고려한 고정상관관계 GARCH와 동적상관관계 GARCH 모형을 이용하였다. 연구결과는 다음과 같다. 첫째, 두 시장간의 선-후행관계에 대해서 부분공적분항을 고려한 결과로부터 전기의 케이프사이즈 가격은 파나막스 시장가격에 유의적으로 정(+)의 영향을 미치고, 일반적인 공적분항을 고려하는 경우 두 시장간의 선-후행효과는 모두 유의적으로 정(+)의 효과를 갖는 것으로 나타났다. 둘째, 두 시장간의 장기적인 균형관계가 성립하지 않는 경우, 개별시장은 어떻게 반응하는가를 나타내는 오차항의 계수는 모두 통계적으로 유의적이고, 케이프사이즈 시장에서는 모두 음(-)의 값을 가지고 파나막스 시장의 경우에는 모두 정(+)의 값을 갖는 것으로 나타났다. 셋째, 두 시장간의 변동성의 파급효과에 대해서는 모든 모형에서 서로 영향을 주고 받는 것으로 나타났고, 통계적으로 유의하게 나타났다. 넷째, 레버리지 효과는 케이프사이즈 시장에서는 모두 유의적으로 정(+)의 값을 가지나, 파나막스 시장에서는 모두 통계적으로 유의적인 결과를 얻지 못하였다. 그러나 두 시장 모두에서 비대칭의 효과는 통계적으로 유의적인 것으로 나타나고 있다.

통화선물시장의 헤징유효성 비교 : 신흥통화 대 선진통화 (The Analysis and Comparison of the Hedging Effectiveness for Currency Futures Markets : Emerging Currency versus Advanced Currency)

  • 강석규
    • 재무관리연구
    • /
    • 제26권2호
    • /
    • pp.155-180
    • /
    • 2009
  • 본 연구에서는 한국의 원화, 멕시코의 페소화, 브라질의 리알화 등 신흥 통화선물시장과 유럽의 유로화, 일본의 엔화, 영국의 파운드화 등 선진 통화선물시장을 대상으로 최적헤지비율을 추정하고, 외표본헤지기간을 두고 헤징유효성을 측정 및 비교하고자 하였다. 헤지비율은 모수의 추정기간을 한기간씩 이동하여 모수를 추정하는 롤링 윈도우즈(rolling windows)에 따른 OLS 모형, 오차수정모형과 일정 조건부 상관관계 이변량 GARCH(1, 1) 모형에 의해 추정하였다. 본 연구의 주요 결과는 다음과 같이 요약할 수 있다. 첫째, 일별, 주별, 월별 등 헤징기간에 관계없이 어떠한 헤징모형을 이용하더라도 한국 원/달러 선물을 이용한 헤징은 현물환율의 가격변동위험을 97% 상회할 정도로 감소시키고 있음을 보여주고 있다. 둘째, 일별, 주별, 월별 등 헤징기간에 관계없이 한국 원화 선물시장은 브라질 리알화, 멕시코 페소화 등 신흥통화 선물시장과 유럽 유로화, 영국 파운드화, 일본 엔화 등의 선진통화 선물시장보다 현물환율의 변동위험에 대한 헤징수단으로 우월함을 보여주고 있다. 이는 한국 원/달러 통화선물이 현물환율의 위험관리수단으로 유용성이 매우 높고 위험관리도구로서 역할을 성실히 수행하고 있음을 보여주는 것이라 할 수 있다. 셋째, 헤징모형 간의 헤징유효성을 비교하면, 신흥통화와 선진통화에 관계없이 최적헤지 비율의 추정에 이용된 단순모형, OLS 모형, 오차수정모형, 그리고 CCC BGARCH(1, 1) 모형에 따른 헤징성과에 유의한 차이가 없음을 보여준다. 이러한 결과에 비추어 볼 때, OLS 모형, 오차 수정모형, 이변량 GARCH(1, 1) 모형 등의 복잡한 계량모델을 이용한 헤징보다 단순히 현물보유 포지션과 반대되는 동일한 금액의 포지션을 선물시장에 취하는 단순모형을 이용한 헤징이 유용할 수 있음을 시사하고 있다. 넷째, 신흥통화와 선진통화에 관계없이 헤징기간이 늘어날수록 헤징유효성 또는 헤징성과가 높아지고 있음을 보여주고 있다.

  • PDF

한국주식시장에서 기업특성모형 적용에 관한 실증연구 (An Empirical Study on Korean Stock Market using Firm Characteristic Model)

  • 김수경;박종해;변영태;김태혁
    • 경영과정보연구
    • /
    • 제29권2호
    • /
    • pp.1-25
    • /
    • 2010
  • 본 논문은 우리나라 주식시장을 대상으로 Haugen Baker(1996)가 제시한 기업특성요인모형을 적용하여 주식수익률 결정요인을 분석하였다. 분석기간은 1999년부터 2007년까지 총 8년간이며, 총 690개의 상장기업의 월별 자료를 이용하였다. 기존 연구에서 제시된 변수를 바탕으로 유동성, 위험, 과거주가, 가격수준, 수익성 등과 관련된 16개의 변수를 독립변수로, 690개 주식의 월별 수익률을 종속변수로 하여 시간가변 회귀분석을 통해 분석결과의 강건성을 높이고자 하였다. 본 연구의 결과는 다음과 같이 요약될 수 있다. 첫째, 기업특성정보가 주식수익률 결정에 미치는 사전적 영향을 분석한 결과 해당기업이 공개한 직전월의 기업특성 정보 중 당월의 주가에 유의적인 영향을 나타내는 기업특성은 유동성, 모멘텀 지표인 1개월, 3개월, 6개월 초과수익률, 주가 승수 중 PSR, PBR, 수익성을 나타내는 ROE와 EPS 등의 8개 요인이다. 예측된 수익률을 이용하여 구축한 10개의 분위별 포트폴리오를 대상으로 실현수익률을 분석한 결과 예측수익률이 높을수록 실현된 수익률이 일관되게 높게 나타나는 것으로 분석되었다. 둘째, Haugen Baker가 제안한 기업특성모형을 이용한 주가예측모형을 바탕으로 구성된 포트폴리오를 Fama French가 제안한 3요인 모형에 적용시킨 결과 수익률이 높을 것으로 예측된 포트폴리오의 실현수익률이 높게 나타남을 확인하였다. 즉, 우리나라 주식시장의 수익률을 예측하는 데는 Haugen Baker의 기업특성 요인모형을 응용한 모형이 더욱 적합할 수 있으며, 이를 이용하는 것이 실무적으로도 유용성이 높을 것으로 기대할 수 있다. 본 연구는 기존연구를 보완하여 보다 강건한 예측 및 운영성과를 보여주기 위해 노력하였다. 이를 위해, 시간 가변적으로 (1) 요인프리미엄을 추정, (2) 수익률예측 및 포트폴리오 조정, (3) 실현수익률 측정의 과정을 반복적으로 수행하였으며, 예측수익률이 높은 포트폴리오의 실현수익률이 상대적으로 높게 나타나는 일관된 결과를 강건하게 보여주고 있다.

  • PDF

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.