• 제목/요약/키워드: stock market prediction

검색결과 139건 처리시간 0.022초

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.

Prediction of the price for stock index futures using integrated artificial intelligence techniques with categorical preprocessing

  • Kim, Kyoung-jae;Han, Ingoo
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1997년도 추계학술대회발표논문집; 홍익대학교, 서울; 1 Nov. 1997
    • /
    • pp.105-108
    • /
    • 1997
  • Previous studies in stock market predictions using artificial intelligence techniques such as artificial neural networks and case-based reasoning, have focused mainly on spot market prediction. Korea launched trading in index futures market (KOSPI 200) on May 3, 1996, then more people became attracted to this market. Thus, this research intends to predict the daily up/down fluctuant direction of the price for KOSPI 200 index futures to meet this recent surge of interest. The forecasting methodologies employed in this research are the integration of genetic algorithm and artificial neural network (GAANN) and the integration of genetic algorithm and case-based reasoning (GACBR). Genetic algorithm was mainly used to select relevant input variables. This study adopts the categorical data preprocessing based on expert's knowledge as well as traditional data preprocessing. The experimental results of each forecasting method with each data preprocessing method are compared and statistically tested. Artificial neural network and case-based reasoning methods with best performance are integrated. Out-of-the Model Integration and In-Model Integration are presented as the integration methodology. The research outcomes are as follows; First, genetic algorithms are useful and effective method to select input variables for Al techniques. Second, the results of the experiment with categorical data preprocessing significantly outperform that with traditional data preprocessing in forecasting up/down fluctuant direction of index futures price. Third, the integration of genetic algorithm and case-based reasoning (GACBR) outperforms the integration of genetic algorithm and artificial neural network (GAANN). Forth, the integration of genetic algorithm, case-based reasoning and artificial neural network (GAANN-GACBR, GACBRNN and GANNCBR) provide worse results than GACBR.

  • PDF

딥러닝을 활용한 실시간 주식거래에서의 매매 빈도 패턴과 예측 시점에 관한 연구: KOSDAQ 시장을 중심으로 (A Study on the Optimal Trading Frequency Pattern and Forecasting Timing in Real Time Stock Trading Using Deep Learning: Focused on KOSDAQ)

  • 송현정;이석준
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권3호
    • /
    • pp.123-140
    • /
    • 2018
  • Purpose The purpose of this study is to explore the optimal trading frequency which is useful for stock price prediction by using deep learning for charting image data. We also want to identify the appropriate time for accurate forecasting of stock price when performing pattern analysis. Design/methodology/approach In order to find the optimal trading frequency patterns and forecast timings, this study is performed as follows. First, stock price data is collected using OpenAPI provided by Daishin Securities, and candle chart images are created by data frequency and forecasting time. Second, the patterns are generated by the charting images and the learning is performed using the CNN. Finally, we find the optimal trading frequency patterns and forecasting timings. Findings According to the experiment results, this study confirmed that when the 10 minute frequency data is judged to be a decline pattern at previous 1 tick, the accuracy of predicting the market frequency pattern at which the market decreasing is 76%, which is determined by the optimal frequency pattern. In addition, we confirmed that forecasting of the sales frequency pattern at previous 1 tick shows higher accuracy than previous 2 tick and 3 tick.

자료편집기법과 사례기반추론을 이용한 한국종합주가지수 예측 (Prediction of KOSPI using Data Editing Techniques and Case-based Reasoning)

  • 김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.287-295
    • /
    • 2007
  • 본 연구에서는 한국종합주가지수 (KOSPI)의 예측을 위하여 사례기반추론에서의 유전자 알고리즘을 이용한 새로운 자료편집기법을 제안한다. 사례기반추론은 복잡한 문제 해결에서의 편의성과 강점으로 인하여 여러 분야에서 광범위하게 활용되고 있다. 그럼에도 불구하고 사례기반추론은 다른 기계학습기법에 비하여 낮은 예측정확도를 나타내기에 비판을 받아 왔다. 일반적으로 사례기반추론으로부터 성공적인 성과를 도출하기 위해서는 주어진 문제에 유용한 선행 사례를 효과적으로 추출하는 것이 핵심이다. 그러나 사례기반추론 시스템에서 우수한 대응과 추출방법을 설계하는 것은 여전히 논란이 있는 연구 주제이다. 본 연구에서는 사례기반추론 시스템에서 우수한 대응과 추출을 위하여 유전자 알고리즘이 동시에 속성 가중치와 적합한 사례를 선택하는 것을 최적화한다. 본 연구에서는 제안된 모형을 주식시장분석에 응용한다. 실험결과는 유전자 알고리즘 접근법이 사례기반추론에서 유망한 사례편집기법이라는 것을 보여준다.

  • PDF

LSTM 기반 COVID-19 공포지수의 주가 예측 성과: 언택트 주식과 콘택트 주식 (LSTM-based Prediction Performance of COVID-19 Fear Index on Stock Prices: Untact Stocks versus Contact Stocks)

  • 김선웅
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.329-338
    • /
    • 2022
  • COVID-19 팬데믹으로 비대면 경제 상황이 전개되면서 주식시장에서는 언택트 주식 집단이 등장하였다. 본 연구는 COVID-19 팬데믹 상황에서 감염병 확산에 따른 한국 COVID-19 공포지수를 제안하고, 언택트 주식 수익률과 콘택트 주식 수익률에 대한 영향력을 분석하였다. 실증 분석 결과는 다음과 같다. 첫째, 한국 COVID-19 공포지수를 이용한 그랜저 인과관계 분석 결과 대한항공, 하나투어, CJ CGV, 파라다이스와 같은 콘택트 주식의 수익률에서 유의적인 인과성이 나타났다. 둘째, LSTM 모형 기반의 주가 예측 결과 카카오, 대한항공과 네이버의 예측 성과가 높게 나타났다. 셋째, 예측 주가를 이용한 Alexander 필터 진입 전략의 투자 성과는 네이버 선물과 카카오 선물에서 높게 나타났다. 본 연구는 비대면 경제가 본격화된 COVID-19 상황에서 언택트 주식과 콘택트 주식에 대한 COVID-19 팬데믹 확산의 영향력을 분석하였다는 점에서 기존 연구와 차별점을 찾을 수 있다.

해외지수와 투자자별 매매 동향에 따른 딥러닝 기반 주가 등락 예측 (Deep Learning-Based Stock Fluctuation Prediction According to Overseas Indices and Trading Trend by Investors)

  • 김태승;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권9호
    • /
    • pp.367-374
    • /
    • 2021
  • 주가 예측은 경제, 통계, 컴퓨터 공학 등 여러 분야에서 연구되는 주제이며, 특히 최근에는 기본적 지표나 기술적 지표 등 다양한 지표로부터 인공지능 모델을 학습하여 주가의 변동을 예측하는 연구들이 활발해 지고 있다. 본 연구에서는 S&P500 등의 해외지수, 과거 KOSPI 지수, 그리고 KOSPI 투자자별 매매 동향으로부터 KOSPI의 등락을 예측하는 딥러닝 모델을 제안한다. 제안 모델은 주가 등락 예측을 위하여 비지도 학습 방법인 적층 오토인코더를 이용하여 잠재변수를 추출하고, 추출된 잠재변수로부터 시계열 데이터 학습에 적합한 LSTM 모델로 학습하여 당일 시가 대비 종가의 등락을 예측하며, 예측된 값을 기반으로 매수 또는 매도를 결정한다. 본 연구에서 제안하는 모델과 비교 모델들의 수익률 및 예측 정확도를 비교한 결과 제안 모델이 비교 모델들 보다 우수한 성능을 보였다.

Financial Data Mining Using Time delay Neural Networks

  • Kim, Hyun-Jung;Shin, Kyung-Shik
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.122-127
    • /
    • 2001
  • This study investigates the effectiveness of time delay neural networks(TDNN) for the time dependent prediction domain. Although it is well-known fact that the back-propagation neural network(BPN) performs well in pattern recognition tasks, the method has some limitations in that it can only learn an input mapping of static (or spatial) patterns that are independent of time of sequences. The preliminary results show that the accuracy of TDNN is higher than the standard BPN with time lag. Our proposed approaches are demonstrated by the stork market prediction domain.

  • PDF

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

빅데이터를 활용한 인공지능을 통한 주식 예측 분석 사례 (Cases of Stock Analysis through Artificial Intelligence Using Big Data)

  • 최민기;조광익;전민기;최훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.303-304
    • /
    • 2021
  • 21세기는 4차 산업혁명을 맞아 빅데이터를 활용한 여러 분야의 연구가 진행되며 세상에 혁신적이고 유용한 기술이 끊임없이 나오고 있다. 빅데이터 시대에 최근 여러 기술 중 인공지능의 여러 알고리즘을 활용한 다양한 분야 중 금융 분야에서 빛을 발하여 핀테크, 금융사기 탐지 및 위험 요인 관리 등에 쓰이며, 최근 붐이 일어나고 있는 주식시장에도 인공지능 알고리즘 모델을 활용한 투자 예측 및 투자 요인 분석 등에 활용되고 있다. 본 논문에서는 빅데이터를 활용한 인공지능을 통해 주식시장에서는 어떻게 쓰이고 있는지 다양한 연구 사례를 살펴보며 동향을 살펴볼 예정이다.

  • PDF

Two-Stage forecasting Using Change-Point Detection and Artificial Neural Networks for Stock Price Index

  • Oh, Kyong-Joo;Kim, Kyoung-Jae;Ingoo Han
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.427-436
    • /
    • 2000
  • The prediction of stock price index is a very difficult problem because of the complexity of the stock market data it data. It has been studied by a number of researchers since they strong1y affect other economic and financial parameters. The movement of stock price index has a series of change points due to the strategies of institutional investors. This study presents a two-stage forecasting model of stock price index using change-point detection and artificial neural networks. The basic concept of this proposed model is to obtain Intervals divided by change points, to identify them as change-point groups, and to use them in stock price index forecasting. First, the proposed model tries to detect successive change points in stock price index. Then, the model forecasts the change-point group with the backpropagation neural network (BPN). Fina1ly, the model forecasts the output with BPN. This study then examines the predictability of the integrated neural network model for stock price index forecasting using change-point detection.

  • PDF