• 제목/요약/키워드: Stock Database

검색결과 89건 처리시간 0.027초

타임 워핑을 지원하는 효율적인 서브시퀀스 매칭 기법 (A Subsequence Matching Technique that Supports Time Warping Efficiently)

  • 박상현;김상욱;조준서;이헌길
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.167-179
    • /
    • 2001
  • This paper discusses an index-based subsequence matching that supports time warping in large sequence databases. Time warping enables finding sequences with similar patterns even when they are of different lengths. In earlier work, we suggested an efficient method for whole matching under time warping. This method constructs a multidimensional index on a set of feature vectors, which are invariant to time warping, from data sequences. For filtering at feature space, it also applies a lower-bound function, which consistently underestimates the time warping distance as well as satisfies the triangular inequality. In this paper, we incorporate the prefix-querying approach based on sliding windows into the earlier approach. For indexing, we extract a feature vector from every subsequence inside a sliding window and construct a multi-dimensional index using a feature vector as indexing attributes. For query precessing, we perform a series of index searches using the feature vectors of qualifying query prefixes. Our approach provides effective and scalable subsequence matching even with a large volume of a database. We also prove that our approach does not incur false dismissal. To verily the superiority of our method, we perform extensive experiments. The results reseal that our method achieves significant speedup with real-world S&P 500 stock data and with very large synthetic data.

  • PDF

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

패턴 매칭과 자동 규칙 생성에 기반한 2단계 주식 트레이딩 시스템 (A Two-Phase Stock Trading System based on Pattern Matching and Automatic Rule Induction)

  • 이종우;김유섭;김성동;이재원;채진석
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.257-264
    • /
    • 2003
  • 일반적인 동적 매매 환경에서의 금융 예측 시스템은 주어진 목적을 최적으로 만족시키는 매매 형태를 찾고자 한다. 본 논문은 수익률을 극대화시키기 위하여 추출과 여과라는 두개의 단계로 구성된 새로운 형태의 주식 매매 시스템을 제안한다. 주식 추출 단계에서는 특정 시계열 패턴에 부합하는 주식을 추출하는데, 이러한 시계열 패턴은 기술 지표 값들의 조합으로 표현된다. 그리고 여과 단계에서는 추출된 주식 집합에 여과 규칙들을 적용하여 실제 매매 대상이 되는 주식들을 골라내는데, 여과 규칙은 과거 주가 데이터로부터 자동으로 유도되었다. 이를 위하여, 우리는 먼저 방대한 과거 일별 주가 데이터로부터 기술 지표 값들을 계산하였다. 계산된 기술 지표 값들은 시계열 패턴을 추출하는데 사용되고 이 값들의 이산화 구간들의 분포가 양성 및 음성 데이터들에 대하여 계산된다. 본 논문에서는 독특한 분포를 보이는 구간에 존재하는 기술 지표 값들이 주가의 향후 움직임을 예측하는 데 도움을 준다는 가정을 하였다. 그리고 여과 규칙은 바로 이런 독특한 분포를 보이는 구간 내의 데이터 값들로부터 자동으로 유도되었다. 우리는 시뮬레이션을 통해, 본 논문에서 제시한 트레이딩 시스템이 시장 평균 수익률을 상회한다는 사실을 확인함으로써 위의 가정에 대한 검증을 할 수 있었다.

주식 데이타베이스에서 질의간 따름 관계를 이용한 연속 질의의 처리 (Continuous Query Processing Utilizing Follows Relationship between Queries in Stock Databases)

  • 하유민;김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.644-653
    • /
    • 2006
  • 본 논문에서는 주식 데이타베이스로부터 탐사된 다수의 규칙들을 이용하여 주식 투자 추천을 요구하는 대량의 연속 질의들을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 본 논문에서는 주식투자 추천을 위한 사용자 질의의 특성을 분석함으로써 질의간에 존재하는 새로운 관계인 '따름 관계'를 정의한다. 두 질의 $Q_1,\;Q_2$간의 추천값 X에 대한 따름 관계는 '만일 선행 질의 $Q_1$의 추천값이 X이면, 추종 질의 $Q_2$의 추천값은 항상 X인 관계'를 의미한다. 이러한 따름 관계가 존재하는 경우, 추종 질의 $Q_2$의 추천값은 선행 질의 $Q_1$의 추천값을 이용하여 ,바로 결정할 수 있으므로 $Q_2$를 위한 질의 처리 과정을 제거할 수 있다. 본 논문에서는 전체 사용자 질의들간의 따름 관계들을 파악하여 그래프 형태로 표현하는 방법을 제안한다. 또한, 처리 과정이 제거되는 질의들의 수가 최대가 되도록 이러한 그래프를 탐색하여 질의 처리 순서를 결정하는 방법을 제안한다. 따름 관계를 기반으로 하는 제안된 방식을 이용하는 경우, 많은 사용자 질의들은 실제 질의 처리 과정이 불필요하게 되므로 전체 시스템의 처리 성능을 크게 개선할 수 있다. 실제 주가 데이타를 이용한 실험을 통하여 제안한 질의 처리 방식의 우수성을 규명한다. 실험 결과에 의하면, 제안된 방식에 의한 전체 질의 처리 시간은 기존 방식에 의한 시간의 10%이하로 줄어드는 것으로 나타났다.

Observational failure analysis of precast buildings after the 2012 Emilia earthquakes

  • Minghini, Fabio;Ongaretto, Elena;Ligabue, Veronica;Savoia, Marco;Tullini, Nerio
    • Earthquakes and Structures
    • /
    • 제11권2호
    • /
    • pp.327-346
    • /
    • 2016
  • The 2012 Emilia (Italy) earthquakes struck a highly industrialized area including several thousands of industrial prefabricated buildings. Due to the lack of specific design and detailing for earthquake resistance, precast reinforced concrete (RC) buildings suffered from severe damages and even partial or total collapses in many cases. The present study reports a data inventory of damages from field survey on prefabricated buildings. The damage database concerns more than 1400 buildings (about 30% of the total precast building stock in the struck region). Making use of the available shakemaps of the two mainshocks, damage distributions were related with distance from the nearest epicentre and corresponding Pseudo-Spectral Acceleration for a period of 1 second (PSA at 1 s) or Peak Ground Acceleration (PGA). It was found that about 90% of the severely damaged to collapsed buildings included into the database stay within 16 km from the epicentre and experienced a PSA larger than 0.12 g. Moreover, 90% of slightly to moderately damaged buildings are located at less than 25 km from the epicentre and were affected by a PSA larger than 0.06 g. Nevertheless, the undamaged buildings examined are almost uniformly distributed over the struck region and 10% of them suffered a PSA not lower than 0.19g. The damage distributions in terms of the maximum experienced PGA show a sudden increase for $PGA{\geq}0.28g$. In this PGA interval, 442 buildings were collected in the database; 55% of them suffered severe damages up to collapse, 32% reported slight to moderate damages, whereas the remaining 13% resulted undamaged.

Integration of Products and Services of Korean Firms and Innovation Policy Directions

  • Jang, Pyoung Yol
    • STI Policy Review
    • /
    • 제3권2호
    • /
    • pp.111-129
    • /
    • 2012
  • The integration of products and services is being expanded in both manufacturing and service companies such as in Apple's iPod & iTunes, Amazon's Kindle, and Hyundai Motor Company's Mozen. This phenomenon has recently accelerated due to multiple factors including market change, lessening of differences in quality of products or services, the paradigm of participation and sharing, and deindustrialization and evolution toward becoming a service economy. The objective of this paper is to investigate and analyze the status and characteristics of integration of products and services in Korean firms and to suggest policy directions promoting this integration. Towards this purpose, income statements from the Korea Listed Companies Association (KLCA) database of companies listed on the Korea Stock Exchange are analyzed regarding the servitization of manufacturing firms as well as the productization of service firms. In addition, this research investigates the Korean Innovation Survey 2011 database for the service sector and 2010 database for the manufacturing sector in order to evaluate R&D activity in each. In the manufacturing sector, the average ratio of service sales (servitization) was low at 0.208, with bias in the level and distribution of ratios associated with the manufacturing sector. 18 out of a total of 23 sectors (78%) have low servitization, showing there's a long way to go for servitization in the Korean manufacturing sector. In the service sector, the average ratio of product sales (productization) was 9.53%, which is relatively high compared to that of the manufacturing sector. However, the distribution of ratios is also biased, as with the manufacturing sector. Based on this analysis, policy directions are proposed in terms of 1) R&D, 2) concept boost, 3) R&D result spread, 4) statistics, 5) infrastructure and 6) green growth.

The Hybrid Knowledge Integration Using the Fuzzy Genetic Algorithm

  • Kim, Myoung-Jong;Ingoo Han;Lee, Kun-Chang
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.145-154
    • /
    • 1999
  • An intelligent system embedded with multiple sources of knowledge may provide more robust intelligence with highly ill structured problems than the system with a single source of knowledge. This paper proposes the hybrid knowledge integration mechanism that yields the cooperated knowledge by integrating expert, user, and machine knowledge within the fuzzy logic-driven framework, and then refines it with a genetic algorithm (GA) to enhance the reasoning performance. The proposed knowledge integration mechanism is applied for the prediction of Korea stock price index (KOSPI). Empirical results show that the proposed mechanism can make an intelligent system with the more adaptable and robust intelligence.

  • PDF

설명기능이 시스템 결자 수용에 미치는 영향의 실증연구 (An Empirical Investigation of Explanation Facilities on User Acceptance of System Recommendations)

  • Kim, Sung-Kun;Kang, Hyun-Koo
    • 정보기술과데이타베이스저널
    • /
    • 제8권1호
    • /
    • pp.81-94
    • /
    • 2001
  • Providing explanations about recommending actions is one of the most important capabilities of expert systems. In fact, there exist many approaches incorporating this explanation facility into the system. Here we present briefly a new approach to generating these explanations and further attempt to investigate the impact of system explanations on user behaviors toward system-generated recommendations. For this experiment we designed a stock investment decision supporting system which, given a set of market situations, suggests an investment recommendation with explanations about the recommending action. Twenty-nine bank employees evaluated the output of the system in a laboratory setting. The results indicate that explanation facilities can make systems-generated advice more confident to users but cannot increase users'acceptance for the system conclusion.

  • PDF

시퀀스 데이터베이스를 위한 타임 워핑 기반 유사 검색 (A Method for Time Warping Based Similarity Search in Sequence Databases)

  • 김상욱;박상현
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.219-226
    • /
    • 2000
  • In this paper, we propose a new novel method for similarity search that supports time warping. Our primary goal is to innovate on search performance in large databases without false dismissal. To attain this goal, we devise a new distance function $D_{tw-lb}$ that consistently underestimates the time warping distance and also satisfies the triangular inequality. $D_{tw-lb}$ uses a 4-tuple feature vector extracted from each sequence and is invariant to time warping. For efficient processing, we employ a multidimensional index that uses the 4-tuple feature vector as indexing attributes and $D_{tw-lb}$ as a distance function. We prove that our method does not incur false dismissal. To verify the superiority of our method, we perform extensive experiments. The results reveal that our method achieves significant speedup up to 43 times with real-world S&P 500 stock data.

  • PDF

서울시 모델 구역에서의 지진피해시나리오 연구 (A Study on the Seismic Damage Scenario in the Model District of Seoul City)

  • 김재관
    • 한국지진공학회:학술대회논문집
    • /
    • 한국지진공학회 1999년도 춘계 학술발표회 논문집 Proceedings of EESK Conference-Spring
    • /
    • pp.223-230
    • /
    • 1999
  • The seismic damage assessment to the postulated earthquake is attempted for the buildings in the model district of Seoul City. The capacity spectrum method is employed in which the vulnerability functions are expressed as functions of the spectral displacement. the database of the building stock is constructed and managed using Geographic Information System software. The model district is selected to represent the typical structural and residential characteristics of Seoul City The structural properties were collected from the design documents. The field inspections were carried out to find out the current status of the building. They are classified into 11 structural types. The fragility curves in HazUS are employed, The ground motions from the postulated earthquakes are simulated using the Boor's methods, The surface soil in the district is classified into 3 profiles using the depth as the parameter. The one-dimensional wave propagation method is used to calculate he filtered ground motion through surface soil layer. The average spectrum of this sample time histories is used as the demand curves. The calculated results are expressed in maps using GIS software ArcView 3.0a

  • PDF