• 제목/요약/키워드: 주식 시장 예측

검색결과 183건 처리시간 0.022초

A Delphi study on how to vitalize the blockchain-based NFT

  • Sang-yub Han;Ho-kyoung Ryu
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.77-87
    • /
    • 2024
  • 본 연구에서는 블록체인 및 NFT 분야 전문가들을 대상으로 델파이 기법을 활용하여 PEST(Political, Economic, Social, Technological 4가지 관점의 거시환경분석) 및 디지털 자산으로서의 3가지 조건 (가치 측정, 가치 저장, 가치 교환)에 대해 NFT 활성화 요건들을 조사하였다. 정치적/법적 요인으로 선정된 항목은 없었고, 경제적 요인으로 'NFT에 대한 소유 가치 및 투자 가치 확보', 사회적 요인으로 'NFT 거래에도 주식거래와 유사한 토대 마련', 기술적 요인으로 '사용하기 쉽고 보안성 높은 전자지갑', '손쉬운 사용자 접근성', 가치 측정 수단 및 교환의 매개 수단으로 선정된 요인은 없었으며, 가치 저장 수단으로 '저장된 가치에 대한 안전한 관리 및 소유 증명', '실물 자산과의 연계를 통한 시장 신뢰 확보' 등 NFT 상거래 활성화를 위한 6개의 요인들이 중요하다는 결과를 확인하였다. 본 연구에서 활용된 델파이 기법은 불확실한 미래 예측을 위해 전문가들을 대상으로 익명에 기반한 복수의 라운드 진행을 통해 합의된 의견에 수렴하였으며 전문가 선정의 대표성 및 의견 편향 등의 단점을 보완하기 위해 라운드별 추가 의견 수렴 및 질문 항목에의 반영 검토 과정도 병행하였다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

방향성매매를 위한 지능형 매매시스템의 투자성과분석 (Analysis of Trading Performance on Intelligent Trading System for Directional Trading)

  • 최흥식;김선웅;박성철
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.187-201
    • /
    • 2011
  • 방향성(Direction)과 변동성(Volatility)에 대한 분석은 증권투자를 위한 시장분석의 기초가 된다. 변동성분석이 옵션 투자에서 중요하다면 주식이나 주가지수선물투자는 방향성분석에 의하여 투자성과가 결정된다. 기존의 금융분석에서 기계학습을 이용한 방향성에 대한 연구는 주가나 투자위험의 예측을 중심으로 이루어졌으며, 최근에 와서야 실전투자를 위한 매매시스템(trading system) 개발에 대한 연구가 이루어지고 있다. 인공지능형 주가예측모형에서는 ANN(artificial neural networks), fuzzy system, SVM(Support Vector Machine) 등의 기법이 주로 활용되고 있다. 본 연구에서는 방향성매매를 위한 지능형 기계학습방법 중에서도 패턴인식에서 좋은 성과를 보이고 있는 은닉마코프 모형(Hidden Markov Model)을 이용한다. 실무적으로는 방향성 예측을 위해 주로 주가의 추세분석(Trend Analysis)을 활용한다. 다양한 기술적 지표를 이용한 추세분석에 기반한 시스템트레이딩(System Trading) 기법은 실전투자에서 점차 확대추세에 있다. 본 연구에서는 시스템트레이딩 기법 중 실무에서 많이 이용되는 이동평균교차전략(moving average cross)에 연속 은닉마코프모형을 적용한 지능형 매매시스템을 제안하고, 실제 주가자료를 이용한 시뮬레이션 결과를 제시한다. 세계적 선물시장으로 성장한 KOSPI200 선물시장에서 제안된 매매시스템의 장기간의 투자성과를 분석하기 위하여 지난 21년 동안의 KOSPI200 주가지수자료를 실증 분석하였다. 분석결과는 KOSPI200 주가지수선물의 방향성매매에서 제안된 CHMM기반 지능형 매매시스템이 실전에서 일반적으로 활용되는 시스템트레이딩 기법의 투자성과를 개선할 수 있음을 보여주었다.

반려동물용 화장품 기술 및 산업 동향 분석 (Analysis of Cosmetic Technology and Industry Trends Companion Animals)

  • 박형범;박정연
    • 산업융합연구
    • /
    • 제21권2호
    • /
    • pp.133-138
    • /
    • 2023
  • 우리나라의 급속한 고령화와 핵가족화, 미혼, 저출산 등의 사회적 현상으로 1인 가구 증가에 따른 반려동물 수와 보유 가구가 증가하고 있다. 실제 4가구 중 1가구가 반려동물을 기르고 있으며, 해당 산업의 규모는 2027년 6조원에 달할 것으로 예측하고 있다. 특히 반려동물 산업의 다양화 속에서 반려동물용 화장품 시장이 각광받고 있는 상황에서 이와 관련된 연구를 고찰하고 산업발전 방안에 대한 연구들은 매우 부족한 상황이다. 이에 본 연구는 반려동물용 화장품과 관련한 학술자료, 특허기술, 최신자료를 검색 분석하여 펫화장품 산업의 기초자료로 제공하고자 시도하였으며, 그 결과는 다음과 같다. 학술 자료는 반려견 피부상태 개선을 위한 천연소재 효과성 검증과 반려동물용 화장품 산업 분석, ICT 융합 반려동물용 화장품에 관한 연구들이 진행되었고, 해당 산업은 아모레퍼시픽, LG생활건강, 애경에서 반려동물용 샴푸 출시가 이루어져 대부분 세정용 화장품이 주를 이루고 있었다. 반려동물용 특허기술에는 피부보습, 피부개선, 가렴움, 염증 증상 완화를 위한 천연물 소재 조성물과 배합비에 대한 특허등록이 이루어졌다. 이 상의 결과 반려동물용 화장품 시장의 소비 수요에 비해 연구와 개발이 아직까지는 미흡함을 확인하였고, 이에 관련 분야의 산업 분석 및 개발 연구가 활발히 이루어져야 할 것으로 생각된다.

선도환시장(先渡換市場)에서의 위험회피도(危險回避度)에 관한 연구(硏究) (Risk Aversion in Forward Foreign Currency Markets)

  • 장익환
    • 재무관리연구
    • /
    • 제8권1호
    • /
    • pp.179-197
    • /
    • 1991
  • 선도환의 가격을 결정하는 접근방법에는 2차자산(derivative assets)이라는 선도계약의 기본특성에 기초한 재정거래(arbitrage)에 의한 방법이 가장 많이 이용되고 있다. 재정거래방식에는 선도환과 현물외환가격간의 상호관련성에 의하여 선도환가격을 이자율평가설(covered interest rate parity : CIRP), 즉 현물가격과 양국간의 이자율차이의 합으로 표시하고 있다. 특히 현물가격과 이자율은 모두 현재시점에서 의사결정자에게 알려져 있기때문에 선도환가격은 확실성하에서 결정되어 미래에 대한 예측이나 투자자의 위험회피도와는 관계없이 결정된다는 것이 특징이다. 이자율평가설에 관한 많은 실증연구는 거래 비용을 고려한 경우 현실적으로 적절하다고 보고 있다(Frenkel and Levich ; 1975, 1977). 다른 방법으로는 선도환의 미래예측기능에만 촛점을 맞추어 가격결정을 하는 투기, 예측접근방법(speculative efficiency approach : 이하에서는 SEA라 함)이 있다. 이 방법 중에서 가장 단순한 형태로 표시된 가설, 즉 '선도환가격은 미래기대현물가격과 같다'는 가설은 대부분의 실증분석에서 기각되고 있다. 이에 따라 SEA에서는 선도환가격이 미래에 대한 기대치뿐만 아니라 위험프리미엄까지 함께 포함하고 있다는 새로운 가설을 설정하고 이에 대한 실증분석을 진행한다. 이 가설은 이론적 모형에서 출발한 것이 아니기 때문에, 특히 기대치와 위험프레미엄 모두가 측정 불가능하다는 점으로 인하여 실증분석상 많은 어려움을 겪게 된다. 이러한 어려움을 피하기 위하여 많은 연구에서는 이자율평가설을 이용하여 선도환가격에 포함된 위험프레미엄에 대해 추론 내지 그 행태를 설명하려고 한다. 이자율평가설을 이용하여 분석모형을 설정하고 실증분석을 하는 것은 몇가지 근본적인 문제점을 내포하고 있다. 먼저, 앞서 지적한 바와 같이 이자율평가설을 가정한다는 것은 SEA에서 주된 관심이 되는 미래예측이나 위험프레미엄과는 관계없이 선도가격이 결정 된다는 것을 의미한다. 따라서 이자율평가설을 가정하여 설정된 분석모형은 선도환시장의 효율성이나 균형가격결정에 대한 시사점을 제공할 수 없다는 것을 의미한다. 즉, 가정한 시장효율성을 실증분석을 통하여 다시 검증하려는 것과 같다. 이러한 개념적 차원에서의 문제점 이외에도 실증분석에서의 추정상의 문제점 또한 존재한다. 대부분의 연구들이 현물자산의 균형가격결정모형에 이자율평가설을 추가로 결합하기 때문에 이러한 방법으로 설정한 분석모형은 그 기초가 되는 현물가격모형과는 달리 자의적 조작이 가능한 형태로 나타나며 이를 이용한 모수의 추정은 불필요한 편기(bias)를 가지게 된다. 본 연구에서는 이러한 실증분석상의 편기에 관한 문제점이 명확하고 구체적으로 나타나는 Mark(1985)의 실증연구를 재분석하고 실증자료를 통하여 위험회피도의 추정치에 편기가 발생하는 근본원인이 이자율평가설을 부적절하게 사용하는데 있다는 것을 확인 하고자 한다. 실증분석결과는 본문의 <표 1>에 제시되어 있으며 그 내용을 간략하게 요약하면 다음과 같다. (A) 실증분석모형 : 본 연구에서는 다기간 자산가격결정모형중에서 대표적인 Lucas (1978)모형을 직접 사용한다. $$1={\beta}\;E_t[\frac{U'(C_{t+1})\;P_t\;s_{t+1}}{U'(C_t)\;P_{t+1}\;s_t}]$$ (2) $U'(c_t)$$P_t$는 t시점에서의 소비에 대한 한계효용과 소비재의 가격을, $s_t$$f_t$는 외환의 현물과 선도가격을, $E_t$${\beta}$는 조건부 기대치와 시간할인계수를 나타낸다. Mark는 위의 식 (2)를 이자율평가설과 결합한 다음의 모형 (4)를 사용한다. $$0=E_t[\frac{U'(C_{t+1})\;P_t\;(s_{t+1}-f_t)}{U'(C_t)\;P_{t+1}\;s_t}]$$ (4) (B) 실증분석의 결과 위험회피계수 ${\gamma}$의 추정치 : Mark의 경우에는 ${\gamma}$의 추정치의 값이 0에서 50.38까지 매우 큰 폭의 변화를 보이고 있다. 특히 비내구성제품의 소비량과 선도프레미엄을 사용한 경우 ${\gamma}$의 추정치의 값은 17.51로 비정상적으로 높게 나타난다. 반면에 본 연구에서는 추정치가 1.3으로 주식시장자료를 사용한 다른 연구결과와 비슷한 수준이다. ${\gamma}$추정치의 정확도 : Mark에서는 추정치의 표준오차가 최소 15.65에서 최대 42.43으로 매우 높은 반면 본 연구에서는 0.3에서 0.5수준으로 상대적으로 매우 정확한 추정 결과를 보여주고 있다. 모형의 정확도 : 모형 (4)에 대한 적합도 검증은 시용된 도구변수(instrumental variables)의 종류에 따라 크게 차이가 난다. 시차변수(lagged variables)를 사용하지 않고 현재소비와 선도프레미엄만을 사용할 경우 모형 (4)는 2.8% 또는 2.3% 유의수준에서 기각되는 반면 모형 (2)는 5% 유의수준에서 기각되지 않는다. 위와같은 실증분석의 결과는 앞서 논의한 바와 같이 이자율평가설을 사용하여 균형자산가격 결정모형을 변형시킴으로써 불필요한 편기를 발생시킨다는 것을 명확하게 보여주는 것이다.

  • PDF

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

HBR-Tree를 이용한 실시간 모바일 GIS의 개발 (Development of a Real-Time Mobile GIS using the HBR-Tree)

  • 이기영;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.73-85
    • /
    • 2004
  • 최근 들어 무선 인터넷이 발전하고, PDA, HPC의 보급이 늘어남에 따라 GIS(Geographic Information System)와 관련된 연구 및 개발이 점차적으로 위치 기반 서비스(LBS: Location Based Service)를 제공하기 위한 실시간 모바일 GIS로 변화해 가고 있다. LBS를 효과적으로 제공하기 위해서는 이동 객체의 동적인 상황을 효과적으로 처리할 수 있는 실시간 GIS 플랫폼과 위치 데이타의 특성을 반영한 위치 인덱스가 필요하다. 위치 데이타는 이전의 GIS에서 사용되는 것과 동일한 데이타 타입(예, 점)이 사용되지만 위치 데이타의 관리는 이전 GIS와는 다른 처리 방식을 사용해야 한다. 이를 위하여 본 논문에서는 대용량의 위치 데이타를 효율적으로 처리할 수 있는 HBR-tree를 이용한 실시간 모바일 GIS의 개발에 대하여 연구하였다. 본 연구에서 개발된 실시간 모바일 GIS는 HBR-tree와 실시간 GIS 플랫폼으로 구성되어 있다. HBR-tree는 R-tree와 공간 해쉬가 결합된 위치 인덱스이다. 그러므로, 위치 데이타가 빈번하게 변경되더라도 갱신 연산은 HBR-tree의 동일한 해쉬 테이블에서 일어나기 때문에 다른 트리 기반 인덱스에 비하여 갱신 연산이 적으며, 검색 연산은 R-tree의 검색 메커니즘을 이용하기 때문에 공간 데이타를 신속하게 검색할 수 있다. 본 논문에서 실시간 GIS 플랫폼은 주기억장치 데이타베이스 시스템의 기능이 확장된 실시간 GIS 엔진, 공간 및 비공간 데이타를 서버와 클라이언트로 전송하기 위한 미들웨어, 그리고 모바일 장치에서 동작하는 모바일 클라이언트로 구성되어 있다. 특히, 본 논문에서는 실험적 방법을 사용하여 HBR-tree와 실시간 GIS 엔진의 성능 평가 결과에 대해서도 기술하였다. 확보하며 이루어져야 가능하다. 여러 지자체를 중심으로 수행된 지자체 GIS 감리와 컨설팅의 경험을 통해 도출된 문제점들을 일반화시켜 정리하였으며, 이를 통해 지자체 GIS사업의 추진 및 운영모델을 제시하였다. 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수

  • PDF

통신서비스 업종 개별주식 현물과 선물 간 선도-지연 효과: 한국통신과 SK텔레콤을 중심으로 (Study on Lead-Lag Relationship between Individual Spot and Futures of Communication Service Industries: Focused on KT and SK Telecom)

  • 김주일
    • 서비스연구
    • /
    • 제5권1호
    • /
    • pp.91-103
    • /
    • 2015
  • 본 논문은 한국거래소(KRX)에서 제공한 KT(한국통신)와 SK텔레콤의 현물수익률 및 KT와 SK텔레콤 선물수익률 간의 선도-지연효과를 분석하였다. 분석을 위한 통계분석 기간은 2012년 1월 1일부터 2014년 12월 31일까지이며, 자료는 일별 종가자료 608개를 사용하였고, 분석도구로는 E-Views 6을 이용하여 VAR 모형을 통한 그랜저 인과관계분석(Granger Causality test)과 충격반응분석(Impulse Response Function) 및 분산분해(Variance Decomposition)를 실시하였다. 주요 분석결과는 다음과 같다. 첫째, 그랜저 인과관계분석결과 KT선물수익률과 SK텔레콤 선물수익률은 KT현물수익률과 SK텔레콤 현물수익률에 대하여 강한 예측력이 있다는 것으로 추론할 수 있다. 그러나 KT현물수익률과 SK텔레콤 현물수익률은 KT선물수익률과 SK텔레콤 선물수익률에 대한 예측력이 존재하지 않고 있다는 것을 알 수 있었다. 둘째, 충격반응분석결과 KT선물수익률과 SK텔레콤 선물수익률은 KT현물수익률과 SK텔레콤 현물수익률에 즉각적으로 영향을 미치다 일정시차가 지난 후에 사라지는 것으로 나타났다. 마지막으로 분산분해 분석결과 KT현물수익률과 SK텔레콤 현물수익률의 변화 중에 많은 변화가 KT선물수익률과 SK텔레콤 선물수익률의 변화에 의하여 설명되어짐을 추론할 수 있다. 이러한 분석결과는 개별 주식 현물과 선물을 운용하고 있는 개인투자자 뿐만 아니라 집합투자업자 및 연기금들이 투자정책을 수립하는데 있어서 여러 가지 의미있는 시사점을 제공해 줄 것으로 판단된다. 또한 선물과 옵션시장을 담당하는 한국거래소와 국내외 투자자들이 자산배분정책과 포트폴리오 정책을 수립하는데도 있어서도 유익한 시사점을 제공할 것으로 판단된다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.