• 제목/요약/키워드: Optimization theory

검색결과 785건 처리시간 0.022초

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

연결정보가 없는 3차원 점으로부터 차이분할메쉬 직접 복원 (Direct Reconstruction of Displaced Subdivision Mesh from Unorganized 3D Points)

  • 정원기;김창헌
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권6호
    • /
    • pp.307-317
    • /
    • 2002
  • 본 논문은 연결정보가 없는 3차원 점으로부터 차이분할메쉬를 직접 생성하는 새로운 메쉬 복원 알고리즘을 제안한다. 차이분할메쉬는 표현해야 하는 각 정점을 1차원 상수 차이 값으로 표현하는 메쉬로써 저장해야하는 데이타양을 획기적으로 줄이면서 분할메쉬의 장점인 분할연결성을 가지므로 다단계 표현이 가능한 새로운 메쉬 표현법이지만 차이분할메쉬를 생성하는 기존의 방법은 레인지 데이타로부터 복원된 비정형 메쉬로부터 차이분할메쉬로의 변환을 거쳐야 하는 문제점이 있다. 제안 알고리즘은 비정형 메쉬로부터의 메쉬 변환과정이 필요 없이 연결정보가 없는 레인지 데이타로부터 차이값에 기반한 분할메쉬를 매쉬 복원과정에서 직접 생성해 낼 수 있다. 기본 아이디어는 연결정보가 없는 점 데이타만을 이용하여 이에 근사한 파라메트릭 도메인을 생성한 후 도메인 상의 각 정점의 법선 벡터 방향으로 세부 표면 정보를 샘플링 하는 것이다. 이를 위하여 우리는 분할곡면 근사기법을 적용한 파라매트릭 도메인 생성기법을 적용하여 입력 점 데이타에 최대한 근사하는 기본메쉬를 생성하며, 연결정보가 없는 점 데이타로부터 세부 표면정보를 올바르게 샘플링 하기 위한 법선벡터와 교차하는 유효한 삼각형 판정기준을 제시한다. 또한 기존 메쉬 복원 기법에서 사용되던 전역 에너지 최적화 방법 대신 입력 데이타를 고려한 지역적 라플라시안 평활화를 이용하여 고품질의 메쉬를 빠르게 복원할 수 있다. 이렇게 복원된 차이분할메쉬는 적은 데이터로 자세한 표현이 가능해져 메쉬 간략화나 압축 등의 후처리 과정이 필요 없으며. 분할연결성을 이용한 다단계 애니메이션등의 다양한 응용분야에 활용 가능하다.6으로 남녀학생 모두 총 열량에 대한 지질의 섭취비율이 높았다. 인, 비타민 B$_1$, B$_{6}$, E를 제외한 칼슘, 철, 아연, 비타민 A, B$_2$, C, 나이아신, 엽산 등 대부분의 미량 영양소 섭취량은 권장량에 미치지 못하였다. 혈청 COT, GPT는 남학생이 여학생보다 각 항목에서 유의하게 높았고, 혈청 총 콜레스테롤, 중성지질, HDL-콜레스테롤, LDL-콜레스테롤은 남녀학생 간에 유의한 차이가 없었다. 적혈구지수의 경우 적혈구수, 헤모글로빈, 헤마토크릿, MCHC가 남학생이 여학생보다 유의하게 높았다. 체중, 체질량지수, 비만지수는 모두 수축기 혈압과 유의한 정의 상관관계를 보였고(p<0.01, p<0.05, p<0.05), 체지방률은 영양지식과 유의한 부의 상관관계를 보였다(p<0.05). 비만도와 영양소 섭취량과의 관계에서 체중, 체질량지수, 비만지수는 콜레스테롤 섭취량과(p<0.01, p<0.05, p<0.05) 각각 유의한 정의 상관관계를 보였다. 비만도와 혈액성상과의 관계에서 체중은HDL-콜레스테롤과 유의한 부의 상관관계를(p<0.05), 적혈구수, 헤모글로빈, 헤마토크릿과는 유의한 정의 상관관계를(각 p<0.05) 보였다. 체질량지수와 비만지수는 각각 HDL-콜레스테롤과는 부의 (각 P<0.05), 적혈구수와는 정의(각 p<0.05) 상관관계를 보였다. 허리엉덩이둘레비는 혈청 GPT, glucose, MCV와 각각 유의한 정의 상관관계를 보였다(각 p<0.05). 이상의 연구결과를 종합할 때 남녀 비만 중학생 모두 총 열량 섭취량 중 지질로

Are you a Machine or Human?: 소셜 로봇의 인간 유사성과 소비자 해석수준이 의인화에 미치는 영향 (Are you a Machine or Human?: The Effects of Human-likeness on Consumer Anthropomorphism Depending on Construal Level)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.129-149
    • /
    • 2021
  • 최근 인간과 사회적으로 상호작용할 수 있는 소셜 로봇(Social Robot)에 대한 관심이 커지고 있다. ICT 기술 발전에 힘입어 소셜 로봇이 개인에게 맞춤형 서비스와 정서적 교감을 제공하기 쉬워졌으며, 현대의 사회문제들과 이로 인한 개인의 삶의 질 저하를 해소하기 위한 수단으로 소셜 로봇의 역할이 주목받고 있다. 소셜 로봇에 대한 관심에 힘입어 소셜 로봇 보급 또한 크게 늘고 있다. 많은 기업이 다양한 목표시장을 겨냥하기 위한 로봇 제품들을 시장에 선보이고 있으나, 현재까지 시장을 선도하는 명확한 흐름은 부재하다. 이에 따라 소셜 로봇의 디자인을 통해 로봇을 차별화하고자 하는 시도가 늘고 있다. 특히 의인화는 소셜 로봇 디자인에서 중요하게 연구되고 있으며, 소셜 로봇을 의인화하여 긍정적인 효과를 발현하려는 접근이 많이 시도되었다. 그러나 소셜 로봇에 대한 의인화가 형성되는 메커니즘을 체계적으로 설명하는 연구는 부족하다. 의인화에 대한 모호한 이해는 소셜 로봇의 의인화를 형성하기 위한 디자인 최적점의 도출을 어렵게 하고 있다. 본 연구는 소셜 로봇의 의인화가 형성되는 메커니즘을 검증하는 것을 목적으로 한다. 본 연구는 3×2 Mixed Design의 실험 연구를 통해 소셜 로봇의 인간 유사성(Human-likeness)과 개인의 해석수준(Construal Level)이 의인화 형성에 미치는 영향을 확인하였다. 의인화가 형성되는 메커니즘에 대한 6개의 연구 가설을 제시하고, 206명 표본의 데이터를 분석하여 가설을 검증하였다. 분석 결과 소셜 로봇의 인간 유사성 수준에 따라 로봇 의인화 수준이 높아지며, 소비자 해석수준에 따라 인간 유사성이 의인화에 미치는 영향이 다르게 나타남을 확인하였다. 본 연구는 소셜 로봇의 디자인 속성인 인간 유사성과 개인의 사고방식인 해석수준을 함께 고려하여 의인화가 형성되는 메커니즘을 설명하였다는 점에서 시사점이 있다. 본 연구의 결과를 소셜 로봇 의인화 형성을 위한 디자인 최적화의 기준으로 활용할 수 있을 것으로 기대한다.

Memory Organization for a Fuzzy Controller.

  • Jee, K.D.S.;Poluzzi, R.;Russo, B.
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1993년도 Fifth International Fuzzy Systems Association World Congress 93
    • /
    • pp.1041-1043
    • /
    • 1993
  • Fuzzy logic based Control Theory has gained much interest in the industrial world, thanks to its ability to formalize and solve in a very natural way many problems that are very difficult to quantify at an analytical level. This paper shows a solution for treating membership function inside hardware circuits. The proposed hardware structure optimizes the memoried size by using particular form of the vectorial representation. The process of memorizing fuzzy sets, i.e. their membership function, has always been one of the more problematic issues for the hardware implementation, due to the quite large memory space that is needed. To simplify such an implementation, it is commonly [1,2,8,9,10,11] used to limit the membership functions either to those having triangular or trapezoidal shape, or pre-definite shape. These kinds of functions are able to cover a large spectrum of applications with a limited usage of memory, since they can be memorized by specifying very few parameters ( ight, base, critical points, etc.). This however results in a loss of computational power due to computation on the medium points. A solution to this problem is obtained by discretizing the universe of discourse U, i.e. by fixing a finite number of points and memorizing the value of the membership functions on such points [3,10,14,15]. Such a solution provides a satisfying computational speed, a very high precision of definitions and gives the users the opportunity to choose membership functions of any shape. However, a significant memory waste can as well be registered. It is indeed possible that for each of the given fuzzy sets many elements of the universe of discourse have a membership value equal to zero. It has also been noticed that almost in all cases common points among fuzzy sets, i.e. points with non null membership values are very few. More specifically, in many applications, for each element u of U, there exists at most three fuzzy sets for which the membership value is ot null [3,5,6,7,12,13]. Our proposal is based on such hypotheses. Moreover, we use a technique that even though it does not restrict the shapes of membership functions, it reduces strongly the computational time for the membership values and optimizes the function memorization. In figure 1 it is represented a term set whose characteristics are common for fuzzy controllers and to which we will refer in the following. The above term set has a universe of discourse with 128 elements (so to have a good resolution), 8 fuzzy sets that describe the term set, 32 levels of discretization for the membership values. Clearly, the number of bits necessary for the given specifications are 5 for 32 truth levels, 3 for 8 membership functions and 7 for 128 levels of resolution. The memory depth is given by the dimension of the universe of the discourse (128 in our case) and it will be represented by the memory rows. The length of a world of memory is defined by: Length = nem (dm(m)+dm(fm) Where: fm is the maximum number of non null values in every element of the universe of the discourse, dm(m) is the dimension of the values of the membership function m, dm(fm) is the dimension of the word to represent the index of the highest membership function. In our case then Length=24. The memory dimension is therefore 128*24 bits. If we had chosen to memorize all values of the membership functions we would have needed to memorize on each memory row the membership value of each element. Fuzzy sets word dimension is 8*5 bits. Therefore, the dimension of the memory would have been 128*40 bits. Coherently with our hypothesis, in fig. 1 each element of universe of the discourse has a non null membership value on at most three fuzzy sets. Focusing on the elements 32,64,96 of the universe of discourse, they will be memorized as follows: The computation of the rule weights is done by comparing those bits that represent the index of the membership function, with the word of the program memor . The output bus of the Program Memory (μCOD), is given as input a comparator (Combinatory Net). If the index is equal to the bus value then one of the non null weight derives from the rule and it is produced as output, otherwise the output is zero (fig. 2). It is clear, that the memory dimension of the antecedent is in this way reduced since only non null values are memorized. Moreover, the time performance of the system is equivalent to the performance of a system using vectorial memorization of all weights. The dimensioning of the word is influenced by some parameters of the input variable. The most important parameter is the maximum number membership functions (nfm) having a non null value in each element of the universe of discourse. From our study in the field of fuzzy system, we see that typically nfm 3 and there are at most 16 membership function. At any rate, such a value can be increased up to the physical dimensional limit of the antecedent memory. A less important role n the optimization process of the word dimension is played by the number of membership functions defined for each linguistic term. The table below shows the request word dimension as a function of such parameters and compares our proposed method with the method of vectorial memorization[10]. Summing up, the characteristics of our method are: Users are not restricted to membership functions with specific shapes. The number of the fuzzy sets and the resolution of the vertical axis have a very small influence in increasing memory space. Weight computations are done by combinatorial network and therefore the time performance of the system is equivalent to the one of the vectorial method. The number of non null membership values on any element of the universe of discourse is limited. Such a constraint is usually non very restrictive since many controllers obtain a good precision with only three non null weights. The method here briefly described has been adopted by our group in the design of an optimized version of the coprocessor described in [10].

  • PDF