• 제목/요약/키워드: Business Performance Prediction

검색결과 266건 처리시간 0.022초

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

R&D 기술 선정을 위한 시계열 특허 분석 기반 지능형 의사결정지원시스템 (An Intelligent Decision Support System for Selecting Promising Technologies for R&D based on Time-series Patent Analysis)

  • 이충석;이석주;최병구
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.79-96
    • /
    • 2012
  • 기술의 발전과 융합이 빠르게 이루어지고 있는 오늘날 유망기술을 어떻게 파악하여, 다양한 후보군들 중에서 최적의 R&D 대상을 어떻게 선정할 것인가에 대한 문제는 주요한 경영의사결정문제 중 하나로 부상하고 있다. 본 연구에서는 이러한 R&D 기술 선정 의사결정을 지원할 수 있는 새로운 지능형 의사결정지원시스템을 제안한다. 본 연구의 의사결정지원시스템은 크게 3가지 모듈로 구성되는데, 우선 첫 번째 모듈인 '기술가치 평가' 모듈에서는 기업이 관심을 갖고 있는 분야의 특허들을 분석하여 유망기술 파악에 요구되는 다양한 차원의 기술가치 평가지수 값들을 산출하는 작업이 이루어진다. 이를 통해, 현재 시점에서의 각 기술의 가치가 다양한 차원에서 평가가 이루어지고 나면, 두 번째 모듈인 '미래기술가치 예측' 모듈에서 이들의 시간 흐름에 따른 변화를 학습한 인공지능 모형을 토대로 각 후보기술들이 미래 시점에 어떤 가치지수값을 갖게 될 것인지 예측값을 산출하게 된다. 마지막 세 번째 모듈인 '최적 R&D 대상기술 선정 지원' 모듈에서는 앞서 두 번째 모듈에서 산출된 각 차원별 예상 가치지수값들을 적절히 가중합하여 기술의 종합적인 미래가치 예측값을 산출하여 의사결정자에게 제공하는 기능을 수행한다. 이를 통해 의사결정자가 자사에 적합한 최적의 R&D 대상기술을 선정할 수 있도록 하였다. 본 연구에서는 제안된 시스템의 적용 가능성을 검증하기 위해, 10년치 특허데이터에 인공신경망 기법을 적용하여 실제 기술가치 예측모형을 구축해 보고, 그 효과를 살펴본다.

은퇴 시점과 예측 변동성을 고려한 동적 Glide Path (Dynamic Glide Path using Retirement Target Date and Forecast Volatility)

  • 김선웅
    • 융합정보논문지
    • /
    • 제11권2호
    • /
    • pp.82-89
    • /
    • 2021
  • 본 연구의 목적은 투자자의 은퇴 시점뿐만 아니라 시장의 예측 변동성을 동시에 고려하여 Target Date Fund의 위험자산 편입 비율을 동적으로 조정하는 새로운 Glide Path를 제안하고, 은퇴 시점만 고려하여 위험자산 편입 비율이 정해지는 전통적 Glide Path와 투자 성과를 비교 분석하는 것이다. 시장 변동성의 예측치로는 역사적 변동성, 시계열모형인 GARCH 변동성, 그리고 변동성지수인 VKOSPI를 활용하였으며, 2003년부터 2020년까지의 분석 기간에서 변동성을 고려하는 새로운 동적 Glide Path의 투자 성과가 우수함을 보여주었다. 3가지 변동성 예측모형 모두에서 은퇴 시점만을 고려하는 Glide Path보다 수익률은 더 높고 위험은 더 낮아지면서 투자 성과 지표인 Sharpe Ratio가 개선되었다. 실증 분석 결과는 은퇴예정자뿐만 아니라 Target Date Fund 운용업계에 새로운 Glide Path의 활용 가능성을 제시하고 있다.

데이터마이닝을 이용한 세분화된 고객집단의 프로모션 고객반응 예측 (Predicting the Response of Segmented Customers for the Promotion Using Data Mining)

  • 홍태호;김은미
    • 경영정보학연구
    • /
    • 제12권2호
    • /
    • pp.75-88
    • /
    • 2010
  • 정보기술의 발전과 더불어 기업과 고객간의 대부분의 정보가 축적되면서 기업은 거래고객의 자세한 정보를 활용하여 차별화된 마케팅을 제공할 수 있다. 본 연구는 기업이 제공하는 마케팅 전략을 보다 효과적으로 실행하기 위해 고객을 세분화하고, 세분화된 고객집단별 마케팅 프로모션에 대한 반응을 예측하는 모형을 제시하였다. 고객세분화에는 데이터마이닝 기법 중 SOM(Self-organizing Map)을 적용하였으며, 세분화된 집단별 프로모션 반응예측에는 로짓모형, 신경망 등의 단일모형과 k-최근접이웃법을 이용한 단일모형들의 통합모형을 적용하였다. 제시된 방법론으로 기업은 프로모션에 대한 고객반응을 예측할 뿐만 아니라 프로모션에 대한 반응을 쉽게 예측할 수 있는 고객집단과 반응예측이 어려운 고객집단으로 구분하여 프로모션의 효과를 극대화하고 각 집단에 맞는 프로모션 전략을 수립할 수 있다.

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석 (Sentiment analysis on movie review through building modified sentiment dictionary by movie genre)

  • 이상훈;최정;김종우
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.97-113
    • /
    • 2016
  • 인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.

Wind Power Pattern Forecasting Based on Projected Clustering and Classification Methods

  • Lee, Heon Gyu;Piao, Minghao;Shin, Yong Ho
    • ETRI Journal
    • /
    • 제37권2호
    • /
    • pp.283-294
    • /
    • 2015
  • A model that precisely forecasts how much wind power is generated is critical for making decisions on power generation and infrastructure updates. Existing studies have estimated wind power from wind speed using forecasting models such as ANFIS, SMO, k-NN, and ANN. This study applies a projected clustering technique to identify wind power patterns of wind turbines; profiles the resulting characteristics; and defines hourly and daily power patterns using wind power data collected over a year-long period. A wind power pattern prediction stage uses a time interval feature that is essential for producing representative patterns through a projected clustering technique along with the existing temperature and wind direction from the classifier input. During this stage, this feature is applied to the wind speed, which is the most significant input of a forecasting model. As the test results show, nine hourly power patterns and seven daily power patterns are produced with respect to the Korean wind turbines used in this study. As a result of forecasting the hourly and daily power patterns using the temperature, wind direction, and time interval features for the wind speed, the ANFIS and SMO models show an excellent performance.

고객의 소리(VOC) 데이터를 활용한 서비스 처리 시간 예측방법 (A Method of Predicting Service Time Based on Voice of Customer Data)

  • 김정훈;권오병
    • 한국IT서비스학회지
    • /
    • 제15권1호
    • /
    • pp.197-210
    • /
    • 2016
  • With the advent of text analytics, VOC (Voice of Customer) data become an important resource which provides the managers and marketing practitioners with consumer's veiled opinion and requirements. In other words, making relevant use of VOC data potentially improves the customer responsiveness and satisfaction, each of which eventually improves business performance. However, unstructured data set such as customers' complaints in VOC data have seldom used in marketing practices such as predicting service time as an index of service quality. Because the VOC data which contains unstructured data is too complicated form. Also that needs convert unstructured data from structure data which difficult process. Hence, this study aims to propose a prediction model to improve the estimation accuracy of the level of customer satisfaction by combining unstructured from textmining with structured data features in VOC. Also the relationship between the unstructured, structured data and service processing time through the regression analysis. Text mining techniques, sentiment analysis, keyword extraction, classification algorithms, decision tree and multiple regression are considered and compared. For the experiment, we used actual VOC data in a company.

B2B 전자제품 수요예측 모형 : PC시장 사례 (Demand Forecasting for B2B Electronic Products : The Case of Personal Computer Market)

  • 문정웅;장남식;조우제
    • 한국IT서비스학회지
    • /
    • 제14권4호
    • /
    • pp.185-197
    • /
    • 2015
  • As the uncertainty of demand in B2B electronics market has increased, firms need a strong method to estimate the market demand. An accurate prediction on the market demand is crucial for a firm not to overproduce or underproduce its goods, which would influence the performance of the firm. However, it is complicated to estimate the demand in a B2B market, particularly for the private sector, because firms are very diverse in terms of size, industry, and types of business. This study proposes both qualitative and quantitative demand forecasting approaches for B2B PC products. Four different measures for predicting PC products in B2B market with consideration of the different PC uses-personal work, common work, promotion, and welfare-are developed as the qualitative model's input variables. These measures are verified by survey data collected from experts in 139 firms, and can be applied when individual firms estimate the demand of PC goods in a B2B market. As the quantitative approach, the multiple regression model is proposed and it includes variables of region, type of industry, and size of the firm. The regression model can be applied when the aggregated demand for overall domestic PC market needs to be estimated.

Novel Maritime Wireless Communication based on Mobile Technology for the Safety of Navigation: LTE-Maritime focusing on the Cell Planning and its Verification

  • Shim, Woo-Seong;Kim, Bu-Young;Park, Chan-Yong;Lee, Byeong-Hyeok
    • 한국항해항만학회지
    • /
    • 제45권5호
    • /
    • pp.231-237
    • /
    • 2021
  • Enhancing the performance of maritime wireless communication has been highlighted by the issue of cell planning in the sea area because of lack of an appropriate Propagation Loss Model (PLM). To resolve the cell planning issue in vast sea areas, it was essential to develop the (PLM) matching the intended sea area. However, there were considerable gaps between the prediction of legacy PLMs and field measurement in propagation loss and there was a need to develop the adjusted PLM (A-PLM). Therefore, cell planning was performed on this adjusted model, including modification of the base station's location, altitude, and antenna azimuth to meet the quality objectives. Furthermore, in order to verify the availability of the cell planning, Communication Service Quality Monitoring System (CS-QMS) was developed in the LTE-Maritime project to collect LTE signal quality information from the onboard equipment at regular intervals and to ensure that the service quality was high enough to satisfy the goals in each designated grid. As a result of verification, the success rate of RSRP was 95.7% for the intensive management zone (IMZ) and 96.4% for the interested zone (IZ), respectively.

An Extended Work Architecture for Online Threat Prediction in Tweeter Dataset

  • Sheoran, Savita Kumari;Yadav, Partibha
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.97-106
    • /
    • 2021
  • Social networking platforms have become a smart way for people to interact and meet on internet. It provides a way to keep in touch with friends, families, colleagues, business partners, and many more. Among the various social networking sites, Twitter is one of the fastest-growing sites where users can read the news, share ideas, discuss issues etc. Due to its vast popularity, the accounts of legitimate users are vulnerable to the large number of threats. Spam and Malware are some of the most affecting threats found on Twitter. Therefore, in order to enjoy seamless services it is required to secure Twitter against malicious users by fixing them in advance. Various researches have used many Machine Learning (ML) based approaches to detect spammers on Twitter. This research aims to devise a secure system based on Hybrid Similarity Cosine and Soft Cosine measured in combination with Genetic Algorithm (GA) and Artificial Neural Network (ANN) to secure Twitter network against spammers. The similarity among tweets is determined using Cosine with Soft Cosine which has been applied on the Twitter dataset. GA has been utilized to enhance training with minimum training error by selecting the best suitable features according to the designed fitness function. The tweets have been classified as spammer and non-spammer based on ANN structure along with the voting rule. The True Positive Rate (TPR), False Positive Rate (FPR) and Classification Accuracy are considered as the evaluation parameter to evaluate the performance of system designed in this research. The simulation results reveals that our proposed model outperform the existing state-of-arts.