• 제목/요약/키워드: prediction of Stock Price

검색결과 152건 처리시간 0.025초

역전파 신경망을 이용한 주가 예측 (Stock Price Prediction Using Backpropagation Neural Network)

  • 박사준;이상훈;고삼일;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.328-330
    • /
    • 2002
  • 본 논문에서는 역전파 신경망(Backpropagation Neural Network)을 시계열 데이터인 주가 데이터를 이용한 주가 예측의 정확도를 향상시키기 위한 학습 방법으로 적용하였다. 실제 증권거래소의 종목 데이터에서 비교적 등락폭이 안정적인 각 산업분야별 5개 기업의 5일 이동평균선 데이터 240개를 훈련 데이터로, 20개는 테스트 데이터로 이용하였다. 선정된 입력 데이터를 은닉층의 개수와 은닉 노드의 개수 등을 달리 하면서 10,000번의 훈련을 통해서 실험 하였으며, 그 결과 1개의 은닉층을 사용한 네트워크1은 20개의 테스트 데이터 사이의 19개의 신호 중 14개를 예측하였고, 2개의 은닉층을 사용한 네트워크 2는 16개를 예측하였다. 시험 결과를 통해서 보듯이 은닉층을 2개 사용하였을 때 보다 좋은 실험 결과를 얻을 수 있었으며, 역전파 신경망 모델이 주가 예측에 적합하다는 것이 증명되었다.

  • PDF

신경망 학습앙상블에 관한 연구 - 주가예측을 중심으로 - (A Study on Training Ensembles of Neural Networks - A Case of Stock Price Prediction)

  • 이영찬;곽수환
    • 지능정보연구
    • /
    • 제5권1호
    • /
    • pp.95-101
    • /
    • 1999
  • In this paper, a comparison between different methods to combine predictions from neural networks will be given. These methods are bagging, bumping, and balancing. Those are based on the analysis of the ensemble generalization error into an ambiguity term and a term incorporating generalization performances of individual networks. Neural Networks and AI machine learning models are prone to overfitting. A strategy to prevent a neural network from overfitting, is to stop training in early stage of the learning process. The complete data set is spilt up into a training set and a validation set. Training is stopped when the error on the validation set starts increasing. The stability of the networks is highly dependent on the division in training and validation set, and also on the random initial weights and the chosen minimization procedure. This causes early stopped networks to be rather unstable: a small change in the data or different initial conditions can produce large changes in the prediction. Therefore, it is advisable to apply the same procedure several times starting from different initial weights. This technique is often referred to as training ensembles of neural networks. In this paper, we presented a comparison of three statistical methods to prevent overfitting of neural network.

  • PDF

투자자별 거래정보와 머신러닝을 활용한 투자전략의 성과 (Performance of Investment Strategy using Investor-specific Transaction Information and Machine Learning)

  • 김경목;김선웅;최흥식
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.65-82
    • /
    • 2021
  • 주식시장에 참여하는 투자자들은 크게 외국인투자자, 기관투자자, 그리고 개인투자자로 구분된다. 외국인투자자 같은 전문투자자 집단은 개인투자자 집단과 비교하여 정보력과 자금력에서 우위를 보이고 있으며, 그 결과 시장 참여자들 사이에는 외국인투자자들이 좋은 투자 성과를 보이는 것으로 알려져 있다. 외국인 투자자들은 근래에는 인공지능을 이용한 투자를 많이 하고 있다. 본 연구의 목적은 투자자별 거래량 정보와 머신러닝을 결합하는 투자전략을 제안하고, 실제 주가와 투자자별 거래량 데이터를 이용하여 제안 모형의 포트폴리오 투자 성과를 분석하는 것이다. 일별 투자자별 매수 수량과 매도 수량 정보는 한국거래소에서 공개하고 있는 자료를 활용하였으며, 여기에 인공신경망을 결합하여 최적의 포트폴리오 전략을 도출하고자 하였다. 본 연구에서는 자기 조직화 지도 모형 인공신경망을 이용하여 투자자별 거래량 데이터를 그룹화하고 그룹화한 데이터를 변환하여 오류역전파 모형을 학습하였다. 학습 후 검증 데이터 예측결과로 매월 포트폴리오 구성을 하도록 개발하였다. 성과 분석을 위해 포트폴리오의 벤치마크를 지정하였고 시장 수익률 비교를 위해 KOSPI200, KOSPI 지수 수익률도 구하였다. 포트폴리오의 동일배분 수익률, 복리 수익률, 연평균 수익률, MDD, 표준편차, 샤프지수, 벤치마크로 지정한 시가총액 상위 10종목의 Buy and Hold 수익률 등을 사용하여 성과 분석을 진행하였다. 분석 결과 포트폴리오가 벤치마크 대비 2배 수익률을 올렸으며 시장 수익률보다 좋은 성과를 보였다. MDD와 표준편차는 포트폴리오와 벤치마크가 비슷한 결과로 성과 대비 비교한다면 포트폴리오가 좋은 성과라고 할 수 있다. 샤프지수도 포트폴리오가 벤치마크와 시장 결과보다 좋은 성과를 내었다. 이를 통해 머신러닝과 투자자별 거래정보 분석을 활용한 포트폴리오 구성 프로그램 개발의 방향을 제시하였고 실제 주식 투자를 위한 프로그램 개발에 활용할 수 있음을 보였다.

인공신경망을 이용한 경제 위기 예측 (The Prediction of Currency Crises through Artificial Neural Network)

  • 이형용;박정민
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.19-43
    • /
    • 2016
  • 이 연구에서 Asia 금융 위기의 원인을 고찰하여 보고, European Monetary Systems의 금융 위기와 비교하여 본다. Asian 신흥 국가들은 1997년도에 금융 위기를 경험하였고, European Monetary Systems의 국가들도 1992년도에 동일한 경험을 하였다. 또한, 중남미의 신흥 경제국가인 Mexico 역시 1994년에 금융위기를 겪었다. 이 연구의 목적은 이들 금융위기의 내면을 고찰하고 그 결과로부터 일반화된 법칙을 추출하는 것이다. 이 연구에서는 금융위기를 경험한 한국과 영국과 멕시코를 각각 세가지 다른 모형으로 연구하고 비교하였다. 이 접근 방법은 체계적인 조사를 통하여 세 국가의 차이점을 보여주고 또한 공통적인 내재 요인을 관찰한다. 이전의 많은 연구 방법들은 대부분 선형 회귀식을 통한 causal model에 초점을 맞추고 있지만, 이러한 선형 회귀 모형의 약점을 보완하여서 현실에 산재하며 존재하는 비 선형의 문제를 해결하기 위하여 또 다른 방법을 제안하여 본다. 이 연구에서 사용한 구조 방정식(Structural Equation Model) 모형은 현실로부터 원인을 추출하고 분석하는 연구에 적합하며, 신경망(Artificial Neural Network) 모형은 선형모형의 단점을 보완하여서 비 선형 요인을 설명해 준다. 구조방정식 모형에 적용하기 위하여서 LISREL(LInear Structural RELationship)을 사용하였다. LISREL은 확인적 요인분석과 계량경제학에서 개발된 연립방정식모델에 토대를 둔 다중회귀분석 및 경로분석 등이 결합된 성격을 갖는 방법론으로 다양한 연구에 적용된다. 또한 인공지능(Artificial Intelligence) 기법 중의 하나인 신경망 모형은 선형회귀 분석과 다른 형태의 결과를 도출한다. 세가지 방법론의 우수성을 비교하기 위하여 Hit ratio를 각 국가/ 각 방법론 별로 구분하여서 비교한 결과 다른 방법론 보다 신경망이 더 좋은 성과를 나타내고 있는 것을 확인할 수 있었다. 세가지 방법론에 각각 일반적인 환율 예측에 사용되는 변수를 사용하였다. 소비자 물가지수(Consumer Price Index), 국내총생산(Gross Domestic Product), 이자율(Interest rate), 주가지수(Stock Index), 경상수지(Current Account), 외환보유고(Foreign Reserves)의 6가지 변수를 이용하여서 환율을 예측하여서 급격한 환율 변화로 초래되는 경제위기를 예측하려고 하였다. 각각의 국가의 데이터는 대한민국은 1991년부터 1999년까지, 영국은 1986년부터 1995년까지, 멕시코는 1988년부터 1998년까지의 기간을 정하여서 시계열자료를 분기별로 사용하였다. 각각의 데이터는 Data Stream과 한국은행(Bank of Korea)의 데이터를 이용하여서 분석하였다. 선형회귀방정식을 이용한 분석과 구조방정식인 LISREL을 이용한 분석은 각각 Hit ratio가 국가별로 순위가 변동되기도 하였으나, 인공지능 방법론인 인공신경망의 경우는 모든 국가에서 가장 좋은 예측 결과를 나타내고 있었다. 이 논문은 환율의 변동에 대한 다양한 예측 모형을 비교하고 평가하여서 연구에서 제시하는 개념을 검토하였다는 점에서 의의를 갖는다.

코스닥 상장 시 실패위험 결정요인과 주가반응에 관한 연구 (Determinants of IPO Failure Risk and Price Response in Kosdaq)

  • 오성배;남삼현;이화득
    • 벤처창업연구
    • /
    • 제5권4호
    • /
    • pp.1-34
    • /
    • 2010
  • 우리나라 코스닥 시장은 1996년 처음 생긴 이래 상당한 양적 성장은 해왔으나 투자자의 두터운 신뢰를 받지 못하는 실정이다. 건전한 기업을 발굴하여 육성하고 코스닥 시장이 투자자들에게 신뢰를 주기 위해서는 코스닥 상장기업의 정확한 가치평가와 기업 생존 가능성 평가는 매우 중요하지만 코스닥 기업을 대상으로 실패위험을 분석한 논문은 많지 않은 실정이다. 본 연구에서는 코스닥 상장 시 기업의 실패위험 결정요인을 조사하고 이 실패위험이 주가에 반영되는지 분석하였다. 신규상장 시 실패위험 결정요인은 신규상장기업의 특성인 주관등록사와 회계감사인의 명성, 공모가와 공모규모, 기업의 나이 등을 고려하여 분석하였다. 또한 신규상장 시 실패위험이 상장 후 주가성과와 관련되는지 분석하였다. 표본은 코스닥 상장 폐지된 기업 중 인터넷 기업을 제외하고 부실과 관련된 86개 실패 기업과 실패기업과 같은 산업에 속하는 569개 건전기업을 선정하여 연구에 사용하였다. 실패위험 결정요인 분석에는 로짓모형을 이용하였다. 연구결과는 신규상장 시 실패위험 결정요인은 신규상장기업의 특성인 공모규모, 회계감사인의 명성, 기업의 나이 등이 유의한 영향을 주는 것으로 나타났다. 또한 재무레버리지는 실패위험에 유의한 영향을 주는 변수이지만 선행연구에서 유의한 변수로 지적된 기업규모나 수익성 변수는 실패위험에 유의한 영향을 주지 않는 것으로 나타나 신규상장 시 실패위험 분석에서는 신규상장기업의 특성을 반영하는 모형이 유효하다고 볼 수 있다. 신규상장시 실패위험과 상장 후 주가성과와의 관계 분석에서는 유의한 음(-)의 관련성이 나타나 비 인터넷기업의 실패위험이 주가에 반영된다고 해석할 수 있다. 코스닥 신규상장기업의 생존가능성이 낮은 편이며 정부의 각종 지원을 받는 벤처기업이 실패하는 경우 투자자들에게 극심한 손해를 끼칠 수 있고 나아가 경제에 악영향을 미칠 수 있기 때문에 본 연구의 결과는 정부의 규제당국이나 신용분석을 담당하는 실무자에게 상당한 도움이 될 것으로 생각된다.

  • PDF

Support Vector Machines와 유전자 알고리즘을 이용한 지능형 트레이딩 시스템 개발 (Development of an Intelligent Trading System Using Support Vector Machines and Genetic Algorithms)

  • 김선웅;안현철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.71-92
    • /
    • 2010
  • 최근 트레이딩 시스템에 대한 관심이 높아지면서, 인공지능을 이용한 지능형 트레이딩 시스템의 개발과 관련한 연구들이 활발하게 이루어지고 있다. 그러나 현재까지 소개된 트레이딩 시스템 관련 연구들은 트레이딩에 적용될 수 있는 다양한 변수들이 실무에서 활용되고 있음에도 불구하고, 주가지수에서 파생된 기술적 지표에만 과도하게 의존하는 경향이 있었다. 또한, 실제 수익창출에 초점이 맞추어진 트레이딩 시스템의 모형보다는 주가 혹은 주가지수의 등락에 대한 정확한 예측에 초점을 맞춰 모형을 개발하려고 하는 한계도 존재했다. 이에 본 연구에서는 기존 연구에서 주로 활용되어 온 기술적 지표 외에 현업에서 유용하게 활용되는 다양한 비가격 변수들을 시스템에 반영함으로서 예측 성과의 개선을 도모하는 동시에, Support Vector Machines 기반의 등락예측모형의 결과를 트레이딩 시스템의 매수, 매도, 혹은 유지의 신호로 해석할 수 있도록 설계된 새로운 형태의 지능형 트레이딩 시스템을 제안한다. 제안시스템의 유용성을 검증하기 위해, 본 연구에서는 2004년 5월부터 2009년 12월까지의 KOSPI200 주가지수에 제안모형을 적용하여 그 성과를 살펴보았다. 그 결과, 제안시스템이 수익률 관점에서 다른 비교모형들에 비해 더 우수한 성과를 도출함을 확인할 수 있었다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

지능형 변동성트레이딩시스템개발을 위한 GARCH 모형을 통한 VKOSPI 예측모형 개발에 관한 연구 (A Study on Developing a VKOSPI Forecasting Model via GARCH Class Models for Intelligent Volatility Trading Systems)

  • 김선웅
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.19-32
    • /
    • 2010
  • 학계와 금융파생상품 가격결정이나 변동성매매와 같은 실무영역 모두에서 주식시장의 변동성은 중요한 역할을 한다. 본 연구는 GARCH 모형에 기초하여 한국주식시장의 변동성을 정확히 예측함으로써 변동성매매시스템의 성과를 높일 수 있는 새로운 방법을 제시하였다. 특히, 여러 연구 자료에서 밝혀지고 있는 변동성 비대칭성개념을 도입하였다. 최근 새로 개발된 한국주식시장 변동성 지수인 VKOSPI를 변동성 대용값으로 사용한다. VKOSPI는 KOSPI 200 지수옵션의 가격을 이용하여 계산된 값으로서 옵션딜러들의 변동성 예측치를 반영하고 있다. KOSPI 200 옵션시장은 1997년 시작되었으며, 발전을 거듭하여 현재 하루 거래량이 1,000만 계약을 넘어서면서 세계 최고의 지수옵션시장으로 발전하였다. 이러한 옵션시장에 반영된 변동성을 분석하는 것은 투자자들에게 좋은 투자정보를 제공하게 될 것이다. 특히, 변동성 대용값으로 VKOSPI를 사용하면 다른 변동성 대용치를 사용할 때 발생하는 통계적 추정의 문제를 피해 갈 수 있다. 본 연구는 2003년부터 2006년의 KOSPI 200 지수 일별자료를 대상으로 최우도추정방법(MLE)을 이용하여 GARCH 모형을 추정한다. 비대칭 GARCH 모형으로는 Glosten, Jagannathan, Runke의 GJR-GARCH 모형, Nelson의 EGARCH 모형, 그리고 Ding, Granger, Engle의 PARCH모형을 포함하며 대칭 GARCH 모형은 (1, 1) GARCH 모형을 이용한다. 2007년부터 2009년까지의 KOSPI 200 지수 일별자료를 대상으로 반복적 계산과정을 통해 내일의 변동성 예측값과 오르고 내리는 변화방향을 예측하였다. 분석 결과 시장변동성과 예기치 않은 주가변동 사이에는 음의 상관관계가 존재하며, 음의 주가변동은 동일한 크기의 양의 주가변동보다 훨씬 더 큰 변동성의 증가를 가져옴을 알 수 있다. 즉, 한국 주식시장에도 변동성 비대칭성이 존재함을 보여주었다. GARCH 모형을 이용하여 내일의 VKOSPI의 등락방향을 예측하고 이를 이용하여 변동성 매매시스템을 개발하였다. 내일의 변동성이 상승할 것으로 예측되면 스트래들매수전략을 이용하고 반대로 변동성이 하락할 것으로 예측되면 스트래들 매도전략을 이용한다. 변동성의 변화방향성을 맞춘 경우에는 VKOSPI 변동분을 더하고 틀린 경우에는 변동분을 뺀 누적합을 이용하여 변동성매매전략의 총수익을 계산한다. 모형추정용 자료구간의 경우 통계적 기준인 MSPE 기준으로는 PARCH 모형의 적합도가 가장 높고, 예측방향의 적중도를 재는 MCP 기준으로는 EGARCH 모형이 가장 높은 값을 보여주었다. 테스트용 자료구간의 경우에는 PARCH 모형이 모형적합도와 내일의 변동성 등락방향 예측에서 가장 좋은 결과를 보여주었다. 모형추정용 자료구간의 경우 GARCH 모형 전체에서 매매이익을 기록하고 있고 테스트용 자료구간의 경우에는 EGARCH 모형을 제외한 GARCH 모형들이 매매이익을 보여주었다. 본 연구에서 나타난 변동성의 군집과 비대칭성 현상으로부터 변동성에 비선형성이 존재함을 알 수 있었으며, 비선형성에서 좋은 결과를 보이고 있는 인공지능시스템과 비대칭 GARCH 모형을 결합한다면 제안된 변동성매매시스템의 성과를 많이 개선할 수 있을 것으로 판단된다.

시계열 데이터 활용에 관한 동향 연구 (A Study on Trend Using Time Series Data)

  • 최신형
    • 산업과 과학
    • /
    • 제3권1호
    • /
    • pp.17-22
    • /
    • 2024
  • 인류의 출현과 함께 시작된 역사에는 기록이라는 수단이 있기에 현재에 사는 우리는 데이터를 통해 과거를 확인할 수 있다. 생성되는 데이터는 일정 순간에만 발생하여 저장될 수도 있지만, 과거로부터 현재까지 일정 시간 간격 동안 계속해서 생성될 뿐만 아니라 다가올 미래에도 발생함으로써 이를 활용하여 예측하는 것 또한 중요한 작업이다. 본 논문은 수많은 데이터 중에서 시계열 데이터의 활용 동향을 알아보기 위해서 시계열 데이터의 개념에서부터 머신러닝 분야에서 시계열 데이터 분석에 주로 사용되는 Recurrent Neural Network와 Long-Short Term Memory에 대해 분석하고, 이런 모델들을 활용한 사례의 조사를 통해 의료 진단, 주식 시세 분석, 기후 예측 등 다양한 분야에 활용되어 높은 예측 결과를 보이고 있음을 확인하였고, 이를 바탕으로 향후 활용방안에 대하여 모색해본다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.