• 제목/요약/키워드: Quantitative Association Rules

검색결과 40건 처리시간 0.031초

Generalized Fuzzy Quantitative Association Rules Mining with Fuzzy Generalization Hierarchies

  • Lee, Keon-Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제2권3호
    • /
    • pp.210-214
    • /
    • 2002
  • Association rule mining is an exploratory learning task to discover some hidden dependency relationships among items in transaction data. Quantitative association rules denote association rules with both categorical and quantitative attributes. There have been several works on quantitative association rule mining such as the application of fuzzy techniques to quantitative association rule mining, the generalized association rule mining for quantitative association rules, and importance weight incorporation into association rule mining fer taking into account the users interest. This paper introduces a new method for generalized fuzzy quantitative association rule mining with importance weights. The method uses fuzzy concept hierarchies fer categorical attributes and generalization hierarchies of fuzzy linguistic terms fur quantitative attributes. It enables the users to flexibly perform the association rule mining by controlling the generalization levels for attributes and the importance weights f3r attributes.

상용 데이타 마이닝 도구를 사용한 정량적 연관규칙 마이닝 (Mining Quantitative Association Rules using Commercial Data Mining Tools)

  • 강공미;문양세;최훈영;김진호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.97-111
    • /
    • 2008
  • 상용 데이타 마이닝 도구에서는 기본적으로 이진 속성에 대한 연관규칙 마이닝만을 지원한다. 그러나, 일반적인 트랜잭션 데이타베이스는 이진 속성 뿐 아니라 정량적 속성을 포함한다. 이에 따라, 본 논문에서는 상용 데이타 마이닝 도구를 사용하여 정량적 연관규칙을 마이닝하는 체계적인 접근법을 제안한다. 이를 위해, 우선 상용 데이타 마이닝 도구를 사용하여 정량적 연관규칙을 찾아내기 위한 전체적인 프레임워크를 제안한다. 제안한 프레임워크는 정량적 속성을 이진 속성으로 변환하는 전처리 과정과 마이닝된 이진 연관규칙을 다시 정량적 연관규칙으로 변환하는 후처리 과정으로 구성된다. 다음으로, 전처리 과정을 위한 구간 분할의 개념을 제시하고, 기존의 평균 및 중앙치 기반 양분할 기법과 동일 너비 및 동일 깊이 기반 다분할 기법을 구간 분할의 개념으로 정형적으로 재정의한다. 그런데, 이들 기존 분할 기법은 속성 값의 분포를 고려하지 않은 문제점이 있다. 본 논문에서는 이를 해결하기 위하여 표준편차 최소화 기법을 제안한다. 표준편차 최소화 기법은 이웃한 속성 값의 표준편차 변화가 작다면 동일한 구간에 포함시키고, 표준편차 변화가 크다면 다른 구간으로 분할하는 매우 직관적인 분할 기법이다. 또한, 후처리 과정으로는 이진 연관규칙들을 통합하고 이를 다시 정량적 연관규칙으로 변환하는 방법을 제안한다. 마지막으로, 다양한 실험을 통하여 제안한 프레임워크가 바르게 동작함을 보이고, 표준편차 최소화 기법이 다른 기법에 비하여 우수함을 입증한다. 이 같은 결과를 볼 때, 제안한 프레임워크는 일반 사용자가 상용 데이타 마아닝 도구를 사용하여 정량적 연간규칙을 쉽게 마이닝 할 수 있는 매우 실용적인 접근법이라 생각한다.

수량적 속성을 포함하는 항목 제약을 고려한 연관규칙 마이닝 앨고리듬 (An Association Discovery Algorithm Containing Quantitative Attributes with Item Constraints)

  • 한경록;김재련
    • 산업경영시스템학회지
    • /
    • 제22권50호
    • /
    • pp.183-193
    • /
    • 1999
  • The problem of discovering association rules has received considerable research attention and several fast algorithms for mining association rules have been developed. In this paper, we propose an efficient algorithm for mining quantitative association rules with item constraints. For categorical attributes, we map the values of the attribute to a set of consecutive integers. For quantitative attributes, we can partition the attribute into values or ranges. While such constraints can be applied as a post-processing step, integrating them into the mining algorithm can reduce the execution time. We consider the problem of integrating constraints that are boolean expressions over the presence or absence of items containing quantitative attributes into the association discovery algorithm using Apriori concept.

  • PDF

시간적 관계와 수량적 가중치 따른 연관규칙 발견 (Discovery of Association Rules Base on Data of Time Series and Quantitative Attribute)

  • 양신모;정광호;김진수;이정현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.207-210
    • /
    • 2003
  • In this paper, we explore a new data mining capability that is based on Quantitative Attribute and Time Series. Our solution procedure consists of two steps. First, We derive an algorithm to contain the Quantitative Attribute into a set of candidate item. Second, We redefine the concepts of confidence and support for composite association rules. It is shown that proposed methode is very advantageous and can lead to prominent performance improvement.

  • PDF

병렬처리를 이용한 효율적인 수량 연관규칙 (Efficient Quantitative Association Rules with Parallel Processing)

  • 이혜정;홍민;박두순
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.945-957
    • /
    • 2007
  • 수량 연관규칙은 대량의 데이터베이스에 존재하는 데이터 중 수량적 속성이 강한 데이터를 항목으로 만들어 이진 연관규칙에 적용한다. 만약 중요한 의미를 내포하는 수량 데이터의 정의역 범위가 넓을 경우 정의역을 최소지지도에 만족하는 적정 구간으로 분할하여 빈발구간 항목을 생성하는 작업이 필요하다. 이러한 빈발구간 항목은 어떻게 생성되었느냐에 따라 생성된 규칙의 신뢰도에 큰 영향을 미치게 된다. 따라서 본 논문에서는 빈발구간 항목을 효율적으로 생성하는 방법을 제시한다. 본 논문에서 제안하는 방법은 기존 방법들에 비해 의미가 있는 구간을 분실하지 않고 최소지지도에 근접하는 세밀한 빈발구간을 생성하기 때문에 데이터가 가진 특성의 손실을 최소화할 수 있는 효율적인 방법이다. 또한 병합이 불필요한 곳에서는 병합을 시도하지 않고 빈도가 높은 구간만을 취해 병합하므로 수량의 정의역이 넓을 경우 기존 방법에 비해 실행속도가 월등히 빠른 효율적인 방법이다. 그리고 인구센서스와 같은 실제로 사용되는 데이터를 이용하여 클루닉스 HPC 시스템에서 병렬처리 수행을 통하여 제안 방법이 우수함을 보였다.

  • PDF

퍼지 연관규칙과 연관규칙의 성능 평가 (Performance Estimation of Fuzzr Quantitative Association Rules and Crisp Quantitative Association Rules)

  • 손영경;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.235-237
    • /
    • 2002
  • 연관규칙(association rule)이란 데이터 베이스에 존재하는 속성들 사이에 유사성 또는 패턴을 기술하는 것으로, 사용자에게 데이터에 관한 유용한 조보를 줄 수 있다. 그러나, 지금가지의 연관규칙은 이진 (boolean) 데이터 베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 정량적(수치적, quantitative) 속성을 갖는 데이터에 대한 연관규칙의 연구는 미비하였다. 그 이유는 정량적 속성을 갖는 데이터를 기호적(nominal) 속성값으로 바꾼 후 연관규칙 보다 성능이 우수함을 보이고 있다. 또한 본 논문에서는 퍼지 연관규칙에서 소속함수(항목, 아이템, 속성값)의 모양과 개수를 데이터 분포에 대한 통계적 특성을 나타내는 히스토그램을 이용하여 소속함수를 자동 생성하는 효율적인 연관규칙 추출방법을 제안한다

  • PDF

텍스트마이닝 기반의 인적재난사고사례 신뢰도 측정연구 (Measuring the Confidence of Human Disaster Risk Case based on Text Mining)

  • 이영재;이성수
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제20권3호
    • /
    • pp.63-79
    • /
    • 2011
  • Deducting the risk level of infrastructure and buildings based on past human disaster risk cases and implementing prevention measures are important activities for disaster prevention. The object of this study is to measure the confidence to proceed quantitative analysis of various disaster risk cases through text mining methodology. Indeed, by examining confidence calculation process and method, this study suggests also a basic quantitative framework. The framework to measure the confidence is composed into four stages. First step describes correlation by categorizing basic elements based on human disaster ontology. Secondly, terms and cases of Term-Document Matrix will be created and the frequency of certain cases and terms will be quantified, the correlation value will be added to the missing values. In the third stage, association rules will be created according to the basic elements of human disaster risk cases. Lastly, the confidence value of disaster risk cases will be measured through association rules. This kind of confidence value will become a key element when deciding a risk level of a new disaster risk, followed up by preventive measures. Through collection of human disaster risk cases related to road infrastructure, this study will demonstrate a case where the four steps of the quantitative framework and process had been actually used for verification.

Comparative Study of Quantitative Data Binning Methods in Association Rule

  • Choi, Jae-Ho;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권3호
    • /
    • pp.903-911
    • /
    • 2008
  • Association rule mining searches for interesting relationships among items in a given large database. Association rules are frequently used by retail stores to assist in marketing, advertising, floor placement, and inventory control. Many data is most quantitative data. There is a need for partitioning techniques to quantitative data. The partitioning process is referred to as binning. We introduce several binning methods ; parameter mean binning, equi-width binning, equi-depth binning, clustering-based binning. So we apply these binning methods to several distribution types of quantitative data and present the best binning method for association rule discovery.

  • PDF

퍼지 일반화 계층을 이용한 일반화된 퍼지 정량 연관규칙 마이닝 (Mining Generalized Fuzzy Quantitative Association Rules with Fuzzy Generalization Hierarchies)

  • 한상훈;손봉기;이건명
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.8-11
    • /
    • 2001
  • 연관규칙 마이닝은 트랜잭션 데이터를 이루고 있는 항목간의 잠재적인 의존관계를 발견하는 데이터 마이닝의 한 분야이다. 정량 연관규칙이란 부류적 속성과 정량적 속성을 모두 포함한 연관규칙이다. 정량 연관규칙 마아닝을 위한 퍼지 기술의 응용, 정량 연관규칙 마이닝을 위한 일반화된 연관규칙 마이닝, 사용자의 관심도를 반영한 중요도 가중치가 있는 연관규칙 마이닝 등에 대한 연구가 이루어져 왔다. 이 논문에서는 중요도 가중치가 있는 일반화된 퍼지 정량 연관규칙 마이닝의 새로운 방법을 제안한다. 이 방법은 부류적 속성의 퍼지 개념 계층과 정량적 속성의 퍼지 언어항 일반화 계층을 일반화된 추출하기 위해 이용한다. 이것은 속성들의 수준별 일반화 계층과 속성의 중요도 가중치를 이용함으로써 사용자가 보다 융통성 있는 연관규칙을 마이닝할 수 있게 해준다.

  • PDF

가중연관규칙 탐사를 이용한 재활훈련운동과 근육 활성의 연관성 분석 (Analysis on Relation between Rehabilitation Training Movement and Muscle Activation using Weighted Association Rule Discovery)

  • 이아름;박용군;권대규;김정자
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.7-17
    • /
    • 2009
  • 효과적인 재활 시스템을 구상하는데 있어서 훈련 데이터의 정교한 분석은 다음 단계 훈련을 위한 피드백 자료로서 매우 중요하다. 현재 다양한 생체 역학적 실험을 통해 인간의 운동 능력을 평가하고 이로부터 생성된 데이터의 분석을 위한 객관적이고 신뢰성 있는 연구결과들이 발표되고 있다. 그러나 대부분의 기존 연구들은 기초 통계적인 방법에 근거한 정량분석만을 수행함으로써, 획득된 정보를 임상에 적용 하는데 있어서는 충분한 신뢰성을 보장할 수 없다. 데이터마이닝은 대용량 데이터에 들어있는 숨겨진 규칙과 패턴을 탐사함으로써 임상 데이터에 숨어있는 의미 있는 정보추출에 성공적으로 사용되고 있으며, 특히 임상 연구 분야에서는 훌륭한 의사 결정 지원 시스템으로서 점점 그 사용이 증가되고 있다. 본 연구에서는 신뢰성 있는 자세 제어 능력(Postural control ability) 평가를 위해서 측정된 훈련 데이터에 가중연관규칙 탐사를 적용하여 자세 훈련 유형에 따른 근육 활성 패턴과의 연관성을 분석, 효율적인 재활 훈련 규칙을 탐사하였다. 탐사된 규칙은 재활 및 임상 전문가의 의사결정에 더욱 정성적이고 유용한 선험적 지식으로 사용 될 수 있으며, 이를 근거로 환자 맞춤형 최적의 재활 훈련 모델을 구상하기 위한 지표로서 사용될 수 있다.