• 제목/요약/키워드: Association Measures

검색결과 3,216건 처리시간 0.037초

기준 확인 측도와 연관성 평가기준과의 관계 탐색 (Exploration of relationship between confirmation measures and association thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.835-845
    • /
    • 2013
  • 데이터 마이닝닝 기법들 중에서 연관성 규칙 마이닝 (association rule mining)은 대용량의 사건 발생 기록 데이터로부터 항목 간의 연관성을 측정하는 기법이다. 이 기법은 매우 방대한 양의 상품 또는 서비스 거래 기록 데이터로부터 항목들 간의 연관성을 측정하는 기법으로 제조업, 유통업, 보험업, 의료 및 교육 분야 등 많은 분야에 적용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 흥미도 측도는 크게 객관적 흥미도 측도와 주관적 흥미도 측도, 그리고 의미론적 흥미도 측도로 분류할 수 있다. 이와는 별개로 기준 확인 또는 증거 지원과 관련된 측도들을 개발하기 위해 많은 시도가 있었으나 기준 확인 측도에 대한 연관성 평가 기준 조건 충족 여부나 기본적인 연관성 평가 측도인 지지도, 신뢰도, 그리고 향상도 등과의 관계는 아직 규명되지 않았다. 이에 본 논문에서는 가장 많이 활용되고 있는 비대칭적 기준 확인 측도에 대해 흥미도 측도의 기준에 대한 조건 충족 여부를 검토하는 동시에 기본적인 연관성 평가 측도들과의 관계를 수식을 통해 유도한 후, 예제를 통해 연관성 규칙의 관점에서 기준 확인 측도의 유용성을 살펴보았다. 그 결과, 본 논문에서 고려한 모든 기준 확인 측도들이 흥미도 측도의 기준에 대한 조건들을 모두 만족하였다. 또한 이들을 기본적인 연관성 평가 기준인 지지도, 신뢰도, 그리고 향상도와의 관계를 식을 통해 규명한 동시에 방향성과 행태적 해석 가능성을 예제를 통해 확인할 수 있었다. 특히 이들 측도 중에서 Kemeny와 Oppenheim이 제안한 측도와 Rips가 제안한 측도가 가장 바람직한 연관성 평가 기준으로 활용할 수 있다는 사실을 확인할 수 있었다.

The Development of Relative Interestingness Measure for Comparing with Degrees of Association

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1269-1279
    • /
    • 2008
  • Data mining is the technique to find useful information in huge databases. One of the well-studied problems in data mining is exploration for association rules. An association rule technique finds the relation among each items in massive volume databases by several interestingness measures. An important and useful classification scheme of interestingness measures may be based on user-involvement. This results in two categories - objective and subjective measures. This paper present some relative interestingess measures to compare with degrees of association for two groups. A comparative study with some relative interestingness measures is shown by numerical example. The results show that the relative net confidence is the best relative interestingness measure.

  • PDF

장바구니 크기가 연관규칙 척도의 정확성에 미치는 영향 (Effect of Market Basket Size on the Accuracy of Association Rule Measures)

  • 김남규
    • Asia pacific journal of information systems
    • /
    • 제18권2호
    • /
    • pp.95-114
    • /
    • 2008
  • Recent interests in data mining result from the expansion of the amount of business data and the growing business needs for extracting valuable knowledge from the data and then utilizing it for decision making process. In particular, recent advances in association rule mining techniques enable us to acquire knowledge concerning sales patterns among individual items from the voluminous transactional data. Certainly, one of the major purposes of association rule mining is to utilize acquired knowledge in providing marketing strategies such as cross-selling, sales promotion, and shelf-space allocation. In spite of the potential applicability of association rule mining, unfortunately, it is not often the case that the marketing mix acquired from data mining leads to the realized profit. The main difficulty of mining-based profit realization can be found in the fact that tremendous numbers of patterns are discovered by the association rule mining. Due to the many patterns, data mining experts should perform additional mining of the results of initial mining in order to extract only actionable and profitable knowledge, which exhausts much time and costs. In the literature, a number of interestingness measures have been devised for estimating discovered patterns. Most of the measures can be directly calculated from what is known as a contingency table, which summarizes the sales frequencies of exclusive items or itemsets. A contingency table can provide brief insights into the relationship between two or more itemsets of concern. However, it is important to note that some useful information concerning sales transactions may be lost when a contingency table is constructed. For instance, information regarding the size of each market basket(i.e., the number of items in each transaction) cannot be described in a contingency table. It is natural that a larger basket has a tendency to consist of more sales patterns. Therefore, if two itemsets are sold together in a very large basket, it can be expected that the basket contains two or more patterns and that the two itemsets belong to mutually different patterns. Therefore, we should classify frequent itemset into two categories, inter-pattern co-occurrence and intra-pattern co-occurrence, and investigate the effect of the market basket size on the two categories. This notion implies that any interestingness measures for association rules should consider not only the total frequency of target itemsets but also the size of each basket. There have been many attempts on analyzing various interestingness measures in the literature. Most of them have conducted qualitative comparison among various measures. The studies proposed desirable properties of interestingness measures and then surveyed how many properties are obeyed by each measure. However, relatively few attentions have been made on evaluating how well the patterns discovered by each measure are regarded to be valuable in the real world. In this paper, attempts are made to propose two notions regarding association rule measures. First, a quantitative criterion for estimating accuracy of association rule measures is presented. According to this criterion, a measure can be considered to be accurate if it assigns high scores to meaningful patterns that actually exist and low scores to arbitrary patterns that co-occur by coincidence. Next, complementary measures are presented to improve the accuracy of traditional association rule measures. By adopting the factor of market basket size, the devised measures attempt to discriminate the co-occurrence of itemsets in a small basket from another co-occurrence in a large basket. Intensive computer simulations under various workloads were performed in order to analyze the accuracy of various interestingness measures including traditional measures and the proposed measures.

Association of Mutual Fund Risk Measures and Return Parameters: A Juxtapose of Ranking for Performance in Pakistan

  • KHURRAM, Muhammad Usman;HAMID, Kashif;JAVEED, Sohail Ahmad
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권2호
    • /
    • pp.25-39
    • /
    • 2021
  • This purpose of this study is to investigate the association among mutual funds (MFs) risk measures and return parameters, evaluate mutual fund performance and also explore the best appropriate mutual fund performance measure for investment in Pakistan. Therefore, thirty-five mutual funds have been selected for the period 2007-2015. The Sharpe, Treynor, Jensen Alpha, Information ratio and Fama's Net Selectivity measures has been used to analyze MF performance. Our study findings show significant positive relation exist between Sharpe and Jenson alpha & information ratio (IR); Treynor ratio is negatively correlated to Jenson alpha and Jenson alpha is positively allied with IR. Moreover, association among performance measures, Fama's net selectivity is a major driver in leading to other measures but Sharpe and IR lead to Treynor ratio as well. Furthermore, performance measures are ranked in accordance standard deviation with the arrangement of Fama's net selectivity at top, Jenson Alpha at second, Sharpe ratio at third, IR at fourth and Treynor ratio at fifth position according to risk parameters in Pakistan. Overall, Jensen Alpha measure appears to be the best suitable mutual fund performance measure in Pakistan due to its practical nature. Finally, the Pakistani stock market index KSE100 (as benchmark) performs better than MF industry of Pakistan.

연관성 척도의 빈도수준 선호경향에 대한 연구 (A Study on the Frequency Level Preference Tendency of Association Measures)

  • 이재윤
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.281-294
    • /
    • 2004
  • 연관성 척도는 정보검색 및 데이터마이닝을 비롯한 다양한 분야에서 사용되고 있다. 각 연관성 척도가 높거나 낮은 빈도 중에서 어떤 쪽을 선호하는가를 나타내는 빈도수준 선호경향은 척도의 적용 결과에 중요한 영향을 미치므로 이에 대한 면밀한 조사가 필요하다. 이 연구에서는 주요 연관성 척도들의 빈도수준 선호경향을 가상의 데이터를 통해 분석하고 그 결과를 제시하였다. 또한 코사인 계수를 비롯한 대표적인 연관성 척도에 대해서 빈도수준 선호경향을 조절할 수 있는 방법을 제안하였다. 이 조절 방법을 동시출현 기반 질의확장 정보검색에 적용해본 결과 그 유용성이 확인되었다. 마지막으로 분석 및 실험 결과가 관련 분야에 시사하는 바를 논하였다.

확률적 흥미도를 이용한 유사성 측도의 연관성 평가 기준 (Exploration of PIM based similarity measures as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1127-1135
    • /
    • 2012
  • 연관성 규칙 기법은 대용량데이터베이스에 있는 항목들 간의 관련성을 수치화 하는 것으로 데이터 마이닝 기법 중에서는 가장 많이 활용되고 있다. 연관성 규칙을 탐사하기 위한 연관성 규칙 평가 기준에는 지지도, 신뢰도, 향상도 등이 있다. 이들 중에서 가장 중심이 되는 신뢰도는 비대칭적 측도일 뿐만 아니라 항상 양의 값만을 취하고 있어서 항목 간에 연관성 규칙을 생성하는 데 여러가지 문제가 존재한다. 이러한 문제를 해결하기 위해 본 논문에서는 확률적 흥미도 측도 기반, 특히 주변 비율을 고려하지 않은 유사성 측도를 연관성 평가 기준으로 적용하는 방안에 대해 연구하였다. 예제에 의한 비교를 통하여 Yule과 Michael의 유사성 계수와 Pearson의 파이 계수는 신뢰도와 동일하게 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었으나, 카이 제곱 통계량 기반 측도들은 항상 양의 값만 나타날 뿐만 아니라 신뢰도와는 변화하는 양상이 다르다는 것을 확인할 수 있었다.

활용과 탐색 측정을 위한 방법론으로써 콘텐츠 분석 :세계 광디스크 라이브러리장치 산업 (Content Analysis as a Method for Measuring Exploitation and Exploration: Discussion with Example Application to the Worldwide Optical Library Industry)

  • 유건재
    • 한국콘텐츠학회논문지
    • /
    • 제14권7호
    • /
    • pp.495-510
    • /
    • 2014
  • 활용과 탐색을 측정하는 방법은 특허 기반의 방법, 설문 기반의 방법, 언론 기반의 방법 세 가지로 나뉜다. 다양한 방법론이 나오게 된 이유는 활용과 탐색의 정의에 대한 합의가 아직 이루어지지 않았기 때문이다. 활용과 탐색 활동은 기업이 장기적으로 행하기 때문에 언론 기반의 방법이 가장 적절하며, 이 논문에서는 세계 광디스크 라이브러리 장치 산업의 데이터를 활용하여 유효하고, 신뢰성 있는 언론 기반의 방법에 의해 활용과 탐색을 어떻게 측정하는 것인지를 보여주고자 한다.

법정계량단위와 생활계량단위의 공존방안 (Proposals for the Coexisting of Legal Units and Living Measures)

  • 손진현
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.185-193
    • /
    • 2008
  • 정부는 2007년 7월 1일부터 ‘평’이나 ‘돈’과 같은 비(非)법정계량단위를 상거래 활동에서 기준단위로 사용하는 것뿐만 아니라 보조적으로 표시하는 행위까지 단속하고 있다. 그런데 평이나 돈과 같은 단위는 여전히 그 형태가 다른 방식으로 유지되고 있다. 이러한 이유는 평이나 돈과 같은 생활계량단위가 나름대로의 의미를 지니고 있어 생활 속에서 사용하기 편리하기 때문이다. 본 연구에서는 나름대로의 편리함을 지니고 있는 생활계량단위들을 재정비함으로써 법정단위와 생활단위가 함께 공존할 수 있는 방안을 제안하였다.

아세안의 보호무역조치 연구: 비관세조치 및 특정무역현안을 중심으로 (ASEAN Protection Trade Measures: Focusing on Non-Tariff Measures and Specific Trade Concerns)

  • 나희량
    • 무역학회지
    • /
    • 제44권3호
    • /
    • pp.43-72
    • /
    • 2019
  • This study examines the trends, current situation and implications of non-tariff measures (NTM) and specific trade concerns (STC) on the protection trade measures of ASEAN. ASEAN's non-tariff measures and the share of specific trade concerns are very significant as they are the second and third largest, respectively, of the major countries. This means that protection measures using non-tariff measures are a strong feature of ASEAN's trade policy. Also, in the future, ASEAN should try to prevent unnecessary disputes caused by exporting countries' specific trade concerns in the implementation of non-tariff measures. Activating trade policy cooperation is likely to reduce conflicts and costs caused by these trade disputes.

tnet과 WNET의 가중 네트워크 중심성 지수 비교 연구 (A Comparison Study on the Weighted Network Centrality Measures of tnet and WNET)

  • 이재윤
    • 정보관리학회지
    • /
    • 제30권4호
    • /
    • pp.241-264
    • /
    • 2013
  • 이 연구에서는 공개된 가중 네트워크 분석용 소프트웨어인 Opsahl의 tnet과 이재윤의 WNET에서 지원하는 가중 네트워크 중심성 지수를 비교 분석해보았다. tnet은 가중 연결정도중심성, 가중 근접중심성, 가중 매개중심성을 지원하고, WNET은 최근접이웃중심성, 평균연관성, 평균프로파일연관성, 삼각매개중심성을 지원한다. 가상 데이터를 대상으로 한 분석에서 tnet의 중심성 지수는 링크 가중치의 선형변화에 민감한 반면 WNET의 중심성 지수는 선형 변화에 영향을 받지 않았다. 실제 네트워크 6종을 대상으로 가중 네트워크 중심성을 측정하고 결과를 비교하여 두 소프트웨어의 가중 네트워크 중심성지수들의 특징을 파악하고 중심성 지수 간 관계를 살펴보았다.