• 제목/요약/키워드: stock prices data

검색결과 201건 처리시간 0.025초

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

심층 신경망을 이용한 변동성 돌파 전략 기반 주식 매매 방법에 관한 연구 (A Study on Stock Trading Method based on Volatility Breakout Strategy using a Deep Neural Network)

  • 이은우;이원부
    • 한국콘텐츠학회논문지
    • /
    • 제22권3호
    • /
    • pp.81-93
    • /
    • 2022
  • 주식 투자는 가장 널리 알려진 재테크 방법들 중 하나지만 실제 투자를 통해 수익을 얻기는 쉽지 않기 때문에 과거부터 효과적이고 안정적인 투자 수익을 얻기 위한 다양한 투자 전략들이 고안되고 시도되어 왔다. 그중 변동성 돌파 전략(Volatility Breakout)은 일일 단위로 일정 수준 이상의 범위를 뛰어넘는 강한 상승세를 돌파 신호로 파악하여 상승하는 추세를 따라가며 일 단위로 빠르게 수익을 실현하는 전략으로 널리 쓰이고 있는 단기 투자 전략들 중 하나이다. 그러나 주식 종목마다 가격의 추이나 변동성의 정도가 다르며 동일한 종목이라도 시기에 따라 주가의 흐름이 일정하지 않아 주가를 예측하고 정확한 매매 시점을 찾아내는 것은 매우 어려운 문제이다. 본 논문에서는 단순히 종가 또는 장기간에 걸친 수익률을 예측하는 기존 연구 방법들과는 달리 단기간에 수익을 실현할 수 있는 주식과 같은 시계열 데이터 분석에 적합한 양방향 장단기 메모리 심층 신경망을 이용하여 변동성 돌파 전략 기반 매매 시의 수익률을 예측하여 주식을 매매하여 방법을 제안한다. 이렇게 학습된 모델로 테스트 데이터에 대하여 실제 매매를 가정하여 실험한 결과 기존의 장단기 메모리 심층 신경망을 이용한 종가 예측 모델보다 수익률과 안정성을 모두 상회하는 결과를 확인할 수 있다.

방향성매매를 위한 지능형 매매시스템의 투자성과분석 (Analysis of Trading Performance on Intelligent Trading System for Directional Trading)

  • 최흥식;김선웅;박성철
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.187-201
    • /
    • 2011
  • 방향성(Direction)과 변동성(Volatility)에 대한 분석은 증권투자를 위한 시장분석의 기초가 된다. 변동성분석이 옵션 투자에서 중요하다면 주식이나 주가지수선물투자는 방향성분석에 의하여 투자성과가 결정된다. 기존의 금융분석에서 기계학습을 이용한 방향성에 대한 연구는 주가나 투자위험의 예측을 중심으로 이루어졌으며, 최근에 와서야 실전투자를 위한 매매시스템(trading system) 개발에 대한 연구가 이루어지고 있다. 인공지능형 주가예측모형에서는 ANN(artificial neural networks), fuzzy system, SVM(Support Vector Machine) 등의 기법이 주로 활용되고 있다. 본 연구에서는 방향성매매를 위한 지능형 기계학습방법 중에서도 패턴인식에서 좋은 성과를 보이고 있는 은닉마코프 모형(Hidden Markov Model)을 이용한다. 실무적으로는 방향성 예측을 위해 주로 주가의 추세분석(Trend Analysis)을 활용한다. 다양한 기술적 지표를 이용한 추세분석에 기반한 시스템트레이딩(System Trading) 기법은 실전투자에서 점차 확대추세에 있다. 본 연구에서는 시스템트레이딩 기법 중 실무에서 많이 이용되는 이동평균교차전략(moving average cross)에 연속 은닉마코프모형을 적용한 지능형 매매시스템을 제안하고, 실제 주가자료를 이용한 시뮬레이션 결과를 제시한다. 세계적 선물시장으로 성장한 KOSPI200 선물시장에서 제안된 매매시스템의 장기간의 투자성과를 분석하기 위하여 지난 21년 동안의 KOSPI200 주가지수자료를 실증 분석하였다. 분석결과는 KOSPI200 주가지수선물의 방향성매매에서 제안된 CHMM기반 지능형 매매시스템이 실전에서 일반적으로 활용되는 시스템트레이딩 기법의 투자성과를 개선할 수 있음을 보여주었다.

시계열 스트림 데이터 상에서 핸드헬드 디바이스를 위한 효율적인 스트림 시퀀스 매칭 알고리즘 (Efficient Stream Sequence Matching Algorithms for Handheld Devices over Time-Series Stream Data)

  • 문양세;노웅기
    • 한국통신학회논문지
    • /
    • 제31권8B호
    • /
    • pp.736-744
    • /
    • 2006
  • 핸드헬드 디바이스의 경우, 반복 작업에 대한 CPU 연산 최소화가 성능에 중요한 요소이다. 본 논문에서는 주식 데이터, 네트워크 트래픽, 센서 데이터 등의 시계열 스트림 데이터 상에서 유사 시퀀스를 효율적으로 찾아내는 핸드헬드 디바이스용 알고리즘을 제시한다. 이를 위하여, 우선 시계열 스트림 데이터 상에서 유사 시퀀스를 찾아내는 문제를 스트림 시퀀스 매칭(stream sequence matching)으로 정형적으로 정의한다. 다음으로, 기존의 서브시퀀스 매칭에서 사용했던 윈도우 구성법을 적용하여, 스트림 시퀀스 매칭을 효율적으로 처리하는 윈도우 기반 접근법을 제안한다. 그리고 이러한 윈도우 기반 접근법을 가능하게 하는 윈도우 MBR(window MBR) 개념을 제시하고, 이 개념을 사용하면 스트림 시퀀스 매칭을 정확하게 수행할 수 있음을 증명한다. 또한, 윈도우 기반 접근법에 기반한 두 가지 스트림 시퀀스 매칭 알고리즘을 제안한다. 마지막으로, 분석과 실험을 통해 제안한 알고리즘이 단순 접근법에 비해 CPU 연산을 크게 줄이고 성능을 향상시킴을 보인다. 이 같은 결과를 볼 때, 제안한 방법은 CPU 연산 능력이 부족한 핸드헬드 디바이스의 내장형 알고리즘으로 매우 적합하다고 사료된다.

금융시계열자료를 이용한 원주율값 π의 추정 (Approximation of π by financial historical data)

  • 장대흥;엄태웅;이성백
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.831-841
    • /
    • 2017
  • 원주율 ${\pi}$는 임의의 원의 지름에 대한 둘레의 비로 정의되며 상수값을 갖는다. 이 값은 무리수이며 초월수로서 고대로부터 좀 더 정확한 값을 구하기 위한 수많은 노력이 있어왔다. 특히 확률분야에서는 18세기 Buffon의 바늘문제를 기점으로 확률실험을 통하여 ${\pi}$값을 계산하려는 많은 노력이 있어왔다. 통계분야에서 Chong (2008)은 서로 독립인 이변량표준정규확률분포와 단변량 확률보행과정의 차분이 독립인 정규분포를 따른다는 전제조건하에서 ${\pi}$값을 유도하였다. 본 연구에서는 Buffon의 바늘문제와 정사각형에 내접하는 원의 문제에서 유도된 ${\pi}$값을 확률실험을 통하여 근사값을 구해보며 이 값이 실험횟수와 어떤 관계가 있는지 알아본다. 더불어 Chong이 유도한 단변량확률보행과정의 차분에 근거한 ${\pi}$의 일치추정량을 모의실험을 통하여 검증해본다. 나아가 국내외 금융자료를 사용하여 제시된 방법에 의해 계산된 추정값의 수렴여부와 수렴할 경우 극한값과 ${\pi}$의 오차정도를 살펴보고 이를 통하여 효율적시장가설에 대한 설명을 시도한다.

문화콘텐츠 빅데이터를 이용한 주가 변수 선행성 분석 (Analysis of the Precedence of Stock Price Variables Using Cultural Content Big Data)

  • 유재필;이지영;정정영
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.222-230
    • /
    • 2022
  • 최근 한국의 문화콘텐츠 산업이 발전하고 있는 가운데 전 세계적으로 인지도가 높아질 수 있는 배경에는 과학 기술의 발전으로 글로벌 네트워크 사용자들의 실시간 공유 서비스가 있다. 특히 유튜브의 경우에는 한정적인 사용자가 아닌 모든 사람이 잠재적인 영상 제공자가 될 수 있다는 점에서 그 전파력은 빠르고 강력하다. 국내에도 휴대폰 사용자의 약 80% 이상이 유튜브를 이용하고 있는 것으로 나타난 만큼 유튜브의 정보는 사용자의 심리적 요인이 반영되고 있다는 것을 의미한다. 예컨대 특정 성격을 갖고 있는 채널의 영상 조회 수, 좋아요 수 그리고 댓글 수와 같은 정보는 그 채널이 갖는 성격의 관심도에 대한 척도를 보여준다. 이는 포털 사이트의 키워드 검색 빈도와 같은 정보가 경제 심리학적으로 주가 시장과 밀접한 연관이 있다는 것과 관련성이 높다. 따라서 본 연구에서는 대표 엔터테이먼트 사의 유튜브 정보를 크롤링 알고리즘을 통해 수집하고 이를 주가와 관련된 주요 변수와 인과 관계에 대해서 분석한다. 그 결과 유튜브의 관심도는 주가, 주가 변동성 그리고 거래량에 선행적 인과 관계를 보인다는 것을 입증했다. 본 연구는 4차 산업 시대에 맞게 문화콘텐츠, IT 그리고 금융 분야를 접목해서 연구를 진행했다는 점에서 의의가 있다고 사료된다.

A Fuzzy Based Early Warning System to Predict Banking Distress on Selected Asia-Pacific Countries

  • Farajnejad, Elham;Lau, Wee-Yeap
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제4권1호
    • /
    • pp.39-49
    • /
    • 2017
  • This study develops an early warning system (EWS) to prevent the banking crisis. The proposed system incorporates both the perspective of crises and fundamental characteristics of the banking system in each economy. A fuzzy logic method with data from 1990-2009 is employed to construct the EWS of banking crisis based on 21 pre-determined variables from the aspect of total economy, financial and banking sectors. Our results show: Firstly, South Korea recorded higher probability to have a banking crisis in 1997 as there was large foreign debt in dollars. Secondly, China, Australia and New Zealand banking systems appear to be vulnerable to the crisis in 2007. The surge of China export, FDIs and booming stock market were signs of a heated economy. Australia with high commodity prices was also vulnerable to crisis. Thirdly, Australia, China, Japan and New Zealand banking systems appear to be exposed to the higher chance of a crisis in 2010. Japan with deflation coupled with expensive yen did not augur well for its export. Overall, the findings show that in Asian Financial Crisis 1997/98 and Global Financial Crisis 2008/09, many economies are exposed to a higher probability of having the crisis and this shows an urgent need of having surveillance in these economies.

주성분을 이용한 다변량 고빈도 실현 변동성의 주기 선택 (Choice of frequency via principal component in high-frequency multivariate volatility models)

  • 진민경;윤재은;황선영
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.747-757
    • /
    • 2017
  • 본 논문은 다변량 실현 변동성 계산에서 주기 선택 방안에 대해 연구하고 있다. 고빈도(high frequency) 시계열 자료에 기초한 일간 변동성인 실현변동성을 계산하고 차원 축소 방법인 주성분을 도입하였다. Cholesky 모형을 포함한 다양한 다변량 변동성모형을 주성분을 통해 비교하였으며 KOSPI/삼성전자/현대차 고빈도 수익률 자료를 이용하여 예시하였다.

A Study on the Improving Measures of Private Brand Clothing Products in Domestic Department Stores

  • Kim, Wan-Joo;Kim, Moon-Sook
    • The International Journal of Costume Culture
    • /
    • 제4권1호
    • /
    • pp.44-60
    • /
    • 2001
  • The purpose of this study is to present suggestions to improve the problems the domestic department stores face by analyzing and comparing the status of the development of PB which is absolutely critical for the specialized domestic department stores to survive, and to search for the future course which may lead to boosting sales and profit by developing the strategic PB products. Selected for this study were atotal of 20 PB's out of domestic as well s foreign PB's in the 4 big department stores. The data were analyzed with SAS package employed as per the by items frequency, percent, mean and standard deviation. From the above study, following viewpoints can be taken into account for the future development of PB ; First, the active will of the excutive is basically necessary for successful development of PB, by relying on long-term investment. Second, the existing mid or low-price goods should be in line with the mid or high price one's development for domestic merchandising with focus on middle or high class society. Third, the stock burden, biggest problem of PB, can be solved by discount policy at optimum prices and success rate of merchandising prediction.

  • PDF