• Title/Summary/Keyword: 규칙 생성과 평가

Search Result 195, Processing Time 0.05 seconds

Association rule thresholds considering the number of possible rules of interest items (관심 항목의 발생 가능한 규칙의 수를 고려한 연관성 평가기준)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.4
    • /
    • pp.717-725
    • /
    • 2012
  • Data mining is a method to find useful information for large amounts of data in database. One of the well-studied problems in data mining is exploration for association rules. Association rule mining searches for interesting relationships among items in a given database by support, confidence, and lift. If we use the existing association rules, we can commit some errors by information loss not to consider the size of occurrence frequency. In this paper, we proposed a new association rule thresholds considering the number of possible rules of interest items and compare with existing association rule thresholds by example and real data. As the results, the new association rule thresholds were more useful than existing thresholds.

Fuzzy Rules Generation and Inference System of Scatter Partition Method (분산 분할 방식의 퍼지 규칙 생성 및 추론 시스템)

  • Park, Keon-jun;Jang, Tae-Su;Kim, Sung-Hun;Kim, Yong-kab
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.10a
    • /
    • pp.35-36
    • /
    • 2012
  • The generation of fuzzy rules is inevitable in order to construct fuzzy modeling and in general, has the problem that the number of rules increases exponentially with increasing dimension. To solve this problem, we introduce the system that generate the fuzzy rules and make a inference based on FCM clustering algorithm that partition the input space in the scatter form. The parameters in the premise part of the fuzzy rules is determined as membership matrix by the FCM clustering algorithm and the consequence part of the fuzzy rules is are expressed as a polynomial function. Proposed model evaluated using the numerical data.

  • PDF

A GA-based Inductive Learning System for Extracting the PROSPECTOR`s Classification Rules (프러스펙터의 분류 규칙 습득을 위한 유전자 알고리즘 기반 귀납적 학습 시스템)

  • Kim, Yeong-Jun
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.11
    • /
    • pp.822-832
    • /
    • 2001
  • We have implemented an inductive learning system that learns PROSPECTOR-rule-style classification rules from sets of examples. In our a approach, a genetic algorithm is used in which a population consists of rule-sets and rule-sets generate offspring through the exchange of rules relying on genetic operators such as crossover, mutation, and inversion operators. In this paper, we describe our learning environment centering on the syntactic structure and meaning of classification rules, the structure of a population, and the implementation of genetic operators. We also present a method to evaluate the performance of rules and a heuristic approach to generate rules, which are developed to implement mutation operators more efficiently. Moreover, a method to construct a classification system using multiple learned rule-sets to enhance the performance of a classification system is also explained. The performance of our learning system is compared with other learning algorithms, such as neural networks and decision tree algorithms, using various data sets.

  • PDF

Document Classification using Weighted Associative Classifier (가중치가 부여된 연관 규칙을 이용한 문서 분류)

  • 김흥남;이기성;조근식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.154-156
    • /
    • 2003
  • 인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.

  • PDF

Discovery of Association Rules Based on Data of Quantitative Attribute and Time Series (수량적 속성과 시계열 분석에 의한 연관규칙 탐사)

  • 양신모;정광호;김진수;최성용;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.175-177
    • /
    • 2003
  • 연관규칙은 데이터 안에 존재하는 항목들간의 종속 관계를 찾아내는 것이다. 기존의 연구에서는 연관규칙 탐사 과정에서 발견항목 자체에만 관심을 두고 연구되어 왔다. 즉, 연관규칙 생성을 위한 후보 항목은 수량을 배제한 항목 대 수량비가 1:1인 상태에서 규칙을 발견하는 연구였다. 이것은 항목의 구매 수량에 관계없이 같은 가중치로 규칙을 발견하는 문제점을 갖고 있다. 두 번째 문제점은 연관규칙은 시간적 연장선상에서 발견되는 규칙이라 할 수 있다. 즉, 규칙을 발견하는 과정에서 모든 자료를 동일한 시간적 가중치를 두어 취급하는 것이다. 본 논문에서는 각각의 아이템을 (아이템, 수량)의 묶음 단위로 후보항목을 만들어 수량적 속성이 포함된 아이템 대 수량 비 1:n의 관계에서 규칙을 발견하는 방법을 제안한다. 또한 과거의 자료들을 이용하여 예측할 때 모든 자료를 동일하게 취급하기보다는 최근의 자료에 더 큰 비중을 주는 예측법을 사용하여 연관규칙 발견의 신뢰성을 높인다. 성능평가는 기존의 알고리즘과 비교하여 제안한 알고리즘의 성능향상 및 타당성을 보인다.

  • PDF

An Effective Large itemset Generation Algorithm (효과적인 빈발 항목 생성 알고리즘T)

  • 채덕진;황부현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.198-200
    • /
    • 2000
  • 대용량의 데이터베이스에서 여러 트랜잭션에 동시에 나타나는 항목들의 모임인 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈방 항목집합을 찾아내는 문제는 항목 집합들의 후보 집합을 생성하고 빈발 항목집합의 조건을 충족시키는 후보 집합을 추출함으로써 해결된다. 그리고 이러한 작업은 각각의 빈발 k-항목집합에 대해 k가 증가함에 따라 반복적으로 수행된다. 그러나 연관 규칙 탐사에 관한 기존의 연구는 주로 데이터베이스를 이루는 항목들의 수가 많거나 트랜잭션의 길이가 긴 경우의 대용량 데이터베이스에서 빈발 항목집합의 발견에 초점을 맞추고 있다. 본 논문에서는 데이터베이스를 이루는 전체 항목의 수가 적거나 트랜잭션의 크기가 작은 경우 효과적으로 빈발 항목집합을 찾을 수 있는 연관 규칙 탐사 방법을 제안한다. 그리고 성능 평가를 통하여 제안하는 방법의 성능 및 타당성을 보인다.

  • PDF

Design of Type-2 Fuzzy Logic Systems Using Genetic Algorithms (유전자 알고리즘을 이용한 타입-2 퍼지논리시스템의 설계)

  • 박세환;이광형
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.220-223
    • /
    • 2000
  • 타입-2 퍼지집합을 이용하여 퍼지논리시스템(Fuzzy Logic System : FLS)을 구현하기 위한 연구들이 R. I John, N. Karnik, J. Mendel 등에 의해 현재 진행되고 있다. 타입-2 집합을 이용한 타입-2 FLS은 기존의 타입-1 FLS보다 제어규칙이나 소속함순가 가지고 있는 불확실성을 표현하는데 있어서 더 효과적이다. 그러나, 타입-2 FLS 역시 타입-1 FLS이 가지고 있는 문제점인 설계시 전문가에게 의존하여 시간과 비용이 많이 소요되고, 제어기의 구성요소들을 효율적으로 생성하기가 어렵다는 문제점을 더욱 심각하게 가지고 있다. 또한, 그 문제점을 해결하기 위한 연구들도 아직 미진한 상태이다. 본 논문에서는 타입-2 FLS의 설계를 위해 유전자 알고리즘을 사용하는 방법을 제안한다. 타입-2 FLS를 설계하기 위해서는 소속함수와 제어규칙을 생성하여야 한다. 본 논문에서는 유전자 알고리즘을 사용하여 타입-2 퍼지제어규칙과 소속함수를 설계하는 방법을 제안한다. 먼저, 유전자 알고리즘에서 사용할 수 있는 유전자의 형태로 타입-2 퍼지제어규칙과 소속함수를 표현하기 위한 인코딩방법을 제안하고, 각각의 염색체를 진화시키기 위한 교차 연산자와 돌연변이 연산자를 정의한다. 그리고, 제안된 방법을 함수근사문제에 적용하여 유효성과 성능을 평가, 검증한다.

  • PDF

Development of association rule threshold by balancing of relative rule accuracy (상대적 규칙 정확도의 균형화에 의한 연관성 측도의 개발)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.25 no.6
    • /
    • pp.1345-1352
    • /
    • 2014
  • Data mining is the representative methodology to obtain meaningful information in the era of big data.By Wikipedia, association rule learning is a popular and well researched method for discovering interesting relationship between itemsets in large databases using association thresholds. It is intended to identify strong rules discovered in databases using different interestingness measures. Unlike general association rule, inverse association rule mining finds the rules that a special item does not occur if an item does not occur. If two types of association rule can be simultaneously considered, we can obtain the marketing information for some related products as well as the information of specific product marketing. In this paper, we propose a balanced attributable relative accuracy applicable to these association rule techniques, and then check the three conditions of interestingness measures by Piatetsky-Shapiro (1991). The comparative studies with rule accuracy, relative accuracy, attributable relative accuracy, and balanced attributable relative accuracy are shown by numerical example. The results show that balanced attributable relative accuracy is better than any other accuracy measures.

Backward Reasoning in Fuzzy Petri - net Representation for Fuzzy Production Rules (퍼지생성규칙을 위한 퍼지페트리네트표현에서 후진추론)

  • Cho, Sang-Yeop
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.4
    • /
    • pp.951-958
    • /
    • 1998
  • In this paper, we propose a backward reasoning algorithm which can be utilized in the fuzzy Petri-net representation representing fuzzy production rules. The fuzzy Petri-net representation can be used to model a approximate reasoning system and implement a fuzzy inference engine. The proposed algorithm, which uses the proper belief evaluation functions according to fuzzy concepts in antecedentes and consequents of fuzzy production rules, is more closer to human intuition and reasoning than other methods. This algorithm generates the backward reasoning path from the goal to the initial nodes and evaluates the belief value of the goal node using belief evaluation functions.

  • PDF

A Study on Testing the Korean Cataloguing Rules through Analyzing the RDA Test (RDA 테스트 분석을 통해 본 한국목록규칙의 테스트 방안에 관한 연구)

  • Lee, Mihwa;Hyun, Moonsoo
    • Journal of Korean Library and Information Science Society
    • /
    • v.46 no.1
    • /
    • pp.155-176
    • /
    • 2015
  • This study was for suggesting the test methods in the revision process of the cataloging rules to understand the problem of draft cataloging rules and to apply the new cataloging rules correctly in libraries instead of collecting the opinions by the traditional seminar and conference in the process of revising KCR, KCR2, KCR3, KCR4. For this study, the literature review and the case study were used as the research methods. The case study was based on the US RDA Test by US RDA Test Coordinating Committee. The evaluation areas of the test were cataloging rules, record creation and system development by reflecting the new cataloging rules, user, and cost. The data for the analysis was the creation of bibliographic records and authority records by librarians, and the question investigations that were the use of institutions, librarians, and users. This study would contribute to revise the cataloging rules in future by analyzing the errors of applying new rules to bibliographic record and by investigating the difficulties of applying rules in completing the bibliographic record. Also, the libraries could be easy to decide to implement the new rules from the creation time of bibliographic record by new rules and the learning curve of new rules.