• 제목/요약/키워드: Fuzzy data mining

검색결과 90건 처리시간 0.023초

Overview of Fuzzy Associations Mining

  • Chen, Guoqing;Wei, Qiang;Kerre, Etienne;Wets, Geert
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.1-6
    • /
    • 2003
  • Associations, as specific forms of knowledge, reflect relationships among items in databases, and have been widely studied in the fields of knowledge discovery and data mining. Recent years have witnessed many efforts on discovering fuzzy associations, aimed at coping with fuzziness in knowledge representation and decision support processes. This paper focuses on associations of three kinds, namely, association rules, functional dependencies and pattern associations, and overviews major fuzzy logic extensions accordingly.

  • PDF

데이터 마이닝을 이용한 단기부하예측 시스템 연구 (A Study on Short-Term Load Forecasting System Using Data Mining)

  • 김도완;박진배;김정찬;주영훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.588-591
    • /
    • 2003
  • This paper presents a new short-term load forecasting system using data mining. Since the electric load has very different pattern according to the day, it definitely gives rise to the forecasting error if only one forecasting model is used. Thus, to resolve this problem, the fuzzy model-based classifier and predictor are proposed for the forecasting of the hourly electric load. The proposed classifier is the multi-input and multi-output fuzzy system of which the consequent part is composed of the Bayesian classifier. The proposed classifier attempts to categorize the input electric load into Monday, Tuesday$\sim$Friday, Saturday, and Sunday electric load, Then, we construct the Takagi-Sugeno (T-S) fuzzy model-based predictor for each class. The parameter identification problem is converted into the generalized eigenvalue problem (GEVP) by formulating the linear matrix inequalities (LMIs). Finally, to show the feasibility of the proposed method, this paper provides the short-term load forecasting example.

  • PDF

Design of Fuzzy Model for Data Mining

  • Kim, Do-Wan;Joo, Young-Hoon;Park, Jin-Bae
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.107-113
    • /
    • 2003
  • A new GA-based methodology using information granules is suggested for the construction of fuzzy classifiers. The proposed scheme consists of three steps: selection of information granules, construction of the associated fuzzy sets, and tuning of the fuzzy rules. First, the genetic algorithm (GA) is applied to the development of the adequate information granules. The fuzzy sets are then constructed from the analysis of the developed information granules. An interpretable fuzzy classifier is designed by using the constructed fuzzy sets. Finally, the GA are utilized for tuning of the fuzzy rules, which can enhance the classification performance on the misclassified data (e.g., data with the strange pattern or on the boundaries of the classes). To show the effectiveness of the proposed method, an example, the classification of the Iris data, is provided.

데이터 마이닝을 위한 퍼지 모델 동정 (A Construction of Fuzzy Model for Data Mining)

  • Kim, Do-Wan;Park, Jin-Bae;Kim, Jung-Chan;Joo, Young-Hoon
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.191-194
    • /
    • 2002
  • In this paper, a new GA-based methodology with information granules is suggested for construction of the fuzzy classifier. We deal with the selection of the fuzzy region as well as two major classification problems-the feature selection and the pattern classification. The proposed method consists of three steps: the selection of the fuzzy region, the construction of the fuzzy sets, and the tuning of the fuzzy rules. The genetic algorithms (GAs) are applied to the development of the information granules so as to decide the satisfactory fuzzy regions. Finally, the GAs are also applied to the tuning procedure of the fuzzy rules in terms of the management of the misclassified data (e.g., data with the strange pattern or on the boundaries of the classes). To show the effectiveness of the proposed method, an example-the classification of the Iris data, is provided.

다각도 정보융합 방법을 이용한 지능형 에이전트 시스템 (An Intelligent Agent System using Multi-View Information Fusion)

  • 이현숙
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.11-19
    • /
    • 2014
  • 본 논문에서는 데이터마이닝모듈과 정보융합모듈을 핵심구성요소로 가지는 지능형에이전트 시스템을 설계하고 다각도 정보를 융합하여 진단전문가시스템으로 활용할 수 있는 가능성을 제시한다. 데이터마이닝모듈에서는 퍼지신경망 OFUN-NET에 의하여 다각도의 데이터를 분석하고 퍼지 클러스터 정보를 지식베이스로 구축한다. 정보융합모듈과 응용모듈에서는 가능성정도로 제공되는 진단결과와 불확실 결정상태나 비대칭의 발견과 같은 전문가의 진단에 유용한 정보를 제공해 주고 있다. 또한 DDSM 벤치마크 데이터베이스로부터 획득한 디지털 유방 x선 영상의 BI-RADS 기반 특징데이터를 가지고 실험한 결과는 기존의 방법보다 높은 분류 정확도를 보여주면서 컴퓨터보조진단시스템으로서의 가능성을 보여주고 있다.

데이터 마이닝과 지능 모델링에 기반한 에칭공정의 공정관리시스템 설계 (Design of Process Management System based on Data Mining and Artificial Modelling for the Etching Process)

  • Bae, Hyeon;Kim, Sung-shin;Woo, Kwang-Bang
    • 한국지능시스템학회논문지
    • /
    • 제14권4호
    • /
    • pp.390-395
    • /
    • 2004
  • 반도체 공정은 많은 단위 공정으로 이루어진 복잡하고 동적인 공정이다. 그 중 에칭공정은 반도체 생산에서 중요한 공정중 하나이다. 본 논문에서는 데이터 마이닝과 지식 획득을 통한 의사지원시스템으로 생산성과 수율을 높일 수 있는 시스템을 구성하고자 하였다. 제안된 방법은 퍼지 논리와 신경망으로 구성되는데, 신경망으로 에칭공정의 품질을 나타내는 품질에 대한 결과를 예측하고, 예측된 결과를 퍼지 추론 시스템으로 분류하는 과정으로 수행된다. 퍼지 논리에 사용된 규칙은 전문가의 지식에 기반 하여 도출되거나 데이터로부터 도출된다. 본 시스템을 통해 공정의 최적 조건을 찾아 효율을 높이는 것이 본 연구의 주요 목표이다.

Fuzzy Inference in RDB using Fuzzy Classification and Fuzzy Inference Rules

  • 김진성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.153-156
    • /
    • 2005
  • In this paper, a framework for implementing UFIS (Unified Fuzzy rule-based knowledge Inference System) is presented. First, fuzzy clustering and fuzzy rules deal with the presence of the knowledge in DB (DataBase) and its value is presented with a value between 0 and 1. Second, RDB (Relational DB) and SQL queries provide more flexible functionality fur knowledge management than the conventional non-fuzzy knowledge management systems. Therefore, the obtained fuzzy rules offer the user additional information to be added to the query with the purpose of guiding the search and improving the retrieval in knowledge base and/ or rule base. The framework can be used as DM (Data Mining) and ES (Expert Systems) development and easily integrated with conventional KMS (Knowledge Management Systems) and ES.

  • PDF

A Comparison Study of Classification Algorithms in Data Mining

  • Lee, Seung-Joo;Jun, Sung-Rae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권1호
    • /
    • pp.1-5
    • /
    • 2008
  • Generally the analytical tools of data mining have two learning types which are supervised and unsupervised learning algorithms. Classification and prediction are main analysis tools for supervised learning. In this paper, we perform a comparison study of classification algorithms in data mining. We make comparative studies between popular classification algorithms which are LDA, QDA, kernel method, K-nearest neighbor, naive Bayesian, SVM, and CART. Also, we use almost all classification data sets of UCI machine learning repository for our experiments. According to our results, we are able to select proper algorithms for given classification data sets.

동적 그룹 바인딩 기반의 모바일 에이전트를 이용한 인텔리전트 분산 플랫폼 (Intelligent Distributed Platform using Mobile Agent based on Dynamic Group Binding)

  • 마테오 로미오;이재완
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.131-143
    • /
    • 2007
  • 오늘날 정보 기술 및 지능형 시스템에서는 분산 데이터베이스로부터 패턴들을 찾고 규칙들을 추출하기 위해 데이터 마이닝 기술을 사용한다. 분산환경에서 데이터 마이닝 기술을 이용해 추출된 규칙들은 동적인 중복, 적응형 부하 균형 및 기타 기술들에서 활용될 수 있다. 그러나 대량의 데이터 전송은 에러를 야기하며 신뢰할 수 없는 결과를 초래할 수 있다. 이 논문은 이동 에이전트를 사용하여 동적 그룹 바인딩을 기반으로 한 인텔리전트 분산 플랫폼을 제안한다. 그룹서비스를 통해 효율적인 객체 검색을 위한 분류 알고리즘을 구현한다. 지능형 모델은 동적 중복을 위해 추출된 규칙을 사용한다. 데이터 마이닝 에이전트와 데이터 압축 에이전트는 각각 서비스 노드 데이터베이스로부터 규칙을 추출하여 데이터를 압축한다. 제안한 알고리즘은 데이터를 전송하기 전에 neuro-fuzzy 분류기를 사용하여 빈도가 적은 데이터 ???V을 합하는 전처리 과정을 수행한다. 객체그룹 분류, 서비스 노드 데이터베이스 마이닝, 데이터 압축 및 규칙 추출에 대한 시뮬레이션을 수행했다. 효율적인 데이터 압축 및 신뢰성 있는 규칙 추출에 대한 실험 결과 제안한 알고리즘이 다른 방법들과 비교해 이러한 관점에서 성능이 우수함을 나타내었다.

  • PDF

퍼지 결정트리를 이용한 패턴분류를 위한 데이터 마이닝 알고리즘 (Data Mining Algorithm Based on Fuzzy Decision Tree for Pattern Classification)

  • 이중근;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1314-1323
    • /
    • 1999
  • 컴퓨터의 사용이 일반화됨에 따라 데이타를 생성하고 수집하는 것이 용이해졌다. 이에 따라 데이타로부터 자동적으로 유용한 지식을 얻는 기술이 필요하게 되었다. 데이타 마이닝에서 얻어진 지식은 정확성과 이해성을 충족해야 한다. 본 논문에서는 데이타 마이닝을 위하여 퍼지 결정트리에 기반한 효율적인 퍼지 규칙을 생성하는 알고리즘을 제안한다. 퍼지 결정트리는 ID3와 C4.5의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법이다. 특히, 퍼지 규칙은 속성 축에 평행하게 판단 경계선을 결정하는 방법으로는 어려운 속성 축에 평행하지 않는 경계선을 갖는 패턴을 효율적으로 분류한다. 제안된 알고리즘은 첫째, 각 속성 데이타의 히스토그램 분석을 통해 적절한 소속함수를 생성한다. 둘째, 주어진 소속함수를 바탕으로 ID3와 C4.5와 유사한 방법으로 퍼지 결정트리를 생성한다. 또한, 유전자 알고리즘을 이용하여 소속함수를 조율한다. IRIS 데이타, Wisconsin breast cancer 데이타, credit screening 데이타 등 벤치마크 데이타들에 대한 실험 결과 제안된 방법이 C4.5 방법을 포함한 다른 방법보다 성능과 규칙의 이해성에서 보다 효율적임을 보인다.Abstract With an extended use of computers, we can easily generate and collect data. There is a need to acquire useful knowledge from data automatically. In data mining the acquired knowledge needs to be both accurate and comprehensible. In this paper, we propose an efficient fuzzy rule generation algorithm based on fuzzy decision tree for data mining. We combine the comprehensibility of rules generated based on decision tree such as ID3 and C4.5 and the expressive power of fuzzy sets. Particularly, fuzzy rules allow us to effectively classify patterns of non-axis-parallel decision boundaries, which are difficult to do using attribute-based classification methods.In our algorithm we first determine an appropriate set of membership functions for each attribute of data using histogram analysis. Given a set of membership functions then we construct a fuzzy decision tree in a similar way to that of ID3 and C4.5. We also apply genetic algorithm to tune the initial set of membership functions. We have experimented our algorithm with several benchmark data sets including the IRIS data, the Wisconsin breast cancer data, and the credit screening data. The experiment results show that our method is more efficient in performance and comprehensibility of rules compared with other methods including C4.5.