• Title/Summary/Keyword: 규칙추출

Search Result 807, Processing Time 0.028 seconds

Development of Automatic Rule Extraction Method in Data Mining : An Approach based on Hierarchical Clustering Algorithm and Rough Set Theory (데이터마이닝의 자동 데이터 규칙 추출 방법론 개발 : 계층적 클러스터링 알고리듬과 러프 셋 이론을 중심으로)

  • Oh, Seung-Joon;Park, Chan-Woong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.6
    • /
    • pp.135-142
    • /
    • 2009
  • Data mining is an emerging area of computational intelligence that offers new theories, techniques, and tools for analysis of large data sets. The major techniques used in data mining are mining association rules, classification and clustering. Since these techniques are used individually, it is necessary to develop the methodology for rule extraction using a process of integrating these techniques. Rule extraction techniques assist humans in analyzing of large data sets and to turn the meaningful information contained in the data sets into successful decision making. This paper proposes an autonomous method of rule extraction using clustering and rough set theory. The experiments are carried out on data sets of UCI KDD archive and present decision rules from the proposed method. These rules can be successfully used for making decisions.

Sketch Feature Extraction Through Learning Fuzzy Inference Rules with a Neural Network (퍼지규칙의 신경망 학습을 통한 스케치 특징점 추출)

  • Cho, Sung-Mok
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.4
    • /
    • pp.1066-1073
    • /
    • 1998
  • In this paper, we propose a new efficient operator named DBAH (difference between arithmetic mean and harmonic mean) and a technique for extracting sketch features through learning fuzzy inference rules with a neural network. The DBAH operator provide some advantages; sensitivity dependence on local intensities and insensitivity on small rates of intensity change in very dark regions. Also, the proposed fuzzy reasoning technique by a neural network has a good performance in extracting sketch features without human intervention.

  • PDF

An Interface Agent for Creating Information Extraction Rules and Ontology in Electronic Commerce (전자상거래 정보추출 규칙과 Ontology 생성을 위한 인터페이스 에이전트)

  • 서희경;양재영;구남숙;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.30-32
    • /
    • 1999
  • 인터넷의 증가로 온라인 상점들의 수는 매우 빠르게 증가하고 있다. 상점의 수가 늘어날수록 사용자가 이러한 상점들에서 원하는 정보를 찾는 일은 쉽지 않다. 사용자의 어려움을 줄이고자 여러 쇼핑몰의 정보들을 통합해서 보여주는 전자상거래 통합 시스템들이 생겨나고 있지만, 새로운 쇼핑몰이 추가될 때마다 관리자가 추가되는 쇼핑몰의 정보를 추출하기 위한 규칙이나, Ontology등을 수동으로 만들거나 확장해야 하기 때문에 사람이 소비해야 하는 시간과 노력이 많고, 시스템을 관리하는 사람에 다라 정보추출의 정확도도 다르다. 따라서 사람이 소비하는 시간을 줄이고, 좀 더 정확한 정보추출을 위해 쇼핑몰마다 만들어야 하는 규칙과 그러한 규칙 생성에 필요한 Ontology를 자동으로 생성하는 방법과 이 방법에서 요구되는 사용자의 입력을 최소한 줄인 인터페이스 에이전트를 제안한다.

  • PDF

Extracting Arrhythmia Classification Fuzzy Rules Using A Neural Network And Wavelet Transform (퍼지 신경망과 웨이블릿 변환을 이용한 부정맥 분류 퍼지규칙의 추출)

  • Kim Deok-Yong;Lim JoonShik
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.110-113
    • /
    • 2005
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted fuzzy Membership Funcstions, NEWFM)을 이용하여 심전도 신호로부터 조기심실수축(Premature Ventricular Contraction, PVC)을 판별하는 퍼지규칙을 추출하고 있다. NEWFM은 자기적응적(self adaptive) 가중 퍼지소속함수를 가지고 주어진 입력 데이터로부터 학습하여 퍼지규칙을 생성하고 이를 기반으로 정상 파형과 PVC 파형을 구분한다. 분류 성능 평가를 위하여 MIT/BIH 부정맥 데이터 베이스를 사용하였으며, NEWFM의 입력은 심전도의 파형에 웨이블릿 변환을 적용하여 추출된 웨이블릿 계수를 사용하였다. 여기에 비중복면적 분산 측정법을 적용하여 중요도가 낮은 계수를 제거하면서 최소의 m 개 특징입력만을 사용한 하이퍼박스로 단순화 시킨다. 이러한 방법으로 추출된 2개의 웨이블릿 계수를 사용한 퍼지규칙은 $96\%$의 PVC 분류성능을 보여준다.

  • PDF

A Noun Extractor based on Dictionaries and Heuristic Rules Obtained from Training Data (학습데이터를 이용하여 생성한 규칙과 사전을 이용한 명사 추출기)

  • Jang, Dong-Hyun;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.151-156
    • /
    • 1999
  • 텍스트로부터 명사를 추출하기 위해서 다양한 기법이 이용될 수 있는데, 본 논문에서는 학습 데이터를 이용하여 생성한 규칙과 사전을 이용하는 단순한 모델을 통해 명사를 효과적으로 추출할 수 있는 기법에 대하여 기술한다. 사용한 모델은 기본적으로 명사, 어미, 술어 사전을 사용하고 있으며 명사 추정은 학습 데이터를 통해 생성한 규칙을 통해 이루어진다. 제안한 방법은 복잡한 언어학적 분석 없이 명사 추정이 가능하며, 복합명사 사전을 이용하지 않고 복합 명사를 추정할 수 있는 장점을 지니고 있다. 또한, 명사추정의 주 요소인 규칙이나 사전 등록어의 추가, 갱신 등이 용이하며, 필요한 경우에는 특정 분야의 텍스트 분석을 위한 새로운 사전의 추가가 가능하다. 제안한 방법을 이용해 "제1회 형태소 분석기 및 품사 태거 평가대회(MATEC '99')"의 명사 추출기 분야에 참가하였으며, 본 논문에서는 성능평가 결과를 제시하고 평가결과에 대한 분석을 기술하고 있다. 또한, 현재의 평가기준 중에서 적합하지 않은 부분을 규정하고 이를 기준으로 삼아 자체적으로 재평가한 평가결과를 제시하였다.

  • PDF

Using Statistical Correction Rule to Improve Word Alignment (통계적 수정규칙을 이용한 한국어-중국어 단어정렬 개선방법)

  • Jin, Chang-Hu;Li, Jin-Ji;Na, Hwidong;Kim, Dong-Il;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.231-236
    • /
    • 2009
  • 본 논문에서는 통계적으로 추출한 수정규칙을 이용하여 구 기반 한-중 통계기계번역 시스템(PBSMT)의 단어정렬 결과를 개선하는 방법을 제안한다. 논문에서 제안하는 수정규칙은 단어정렬의 결과를 사람이 만든 정답과 비교하여 통계적으로 추출하였다. 본 논문에서는 위에서 추출한 수정규칙을 이용하여 한-중 통계기계번역 시스템의 단어정렬의 결과에서 한국어 기능어(functional word)에 나타나는 오류를 수정함으로써 단어정렬의 결과를 개선하였고 최종적으로 기계번역의 성능을 제고하였다.

  • PDF

An Efficient Terminology Clustering Method Using Datamining Technique (데이타마이닝 기법을 이용한 효율적인 전문 용어 클러스터링)

  • 이정화;남상엽;문현정;우용태
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.210-215
    • /
    • 2000
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 일반적인 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 대량의 문서로부터 유용한 지식 정보를 찾기 위하여 의미적으로 연관된 전문 용어들끼리 클러스터링 하기 위한 방법을 제안하였다. 학술 논문을 대상으로 전문 용어를 추출하여 관련된 용어들끼리 클러스터를 구성하는 실험을 통하여 제안된 방법의 효율성을 보였다.

  • PDF

Rule extraction from trained neural network using NofM algorithm with improved clustering step (개선된 군집화 단계의 NofM 알고리즘을 이용한 훈련된 신경망으로부터의 규칙추출)

  • Lee, Han-Yul;Ra, Jong-Hei;Kim, Moon-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.581-584
    • /
    • 2001
  • 신경망이 만들어내는 출력에 대한 정보는 수치적으로 분산되어 신경망에 저장되므로, 인간이 직접 해석하기가 힘들다. 본 논문에서는 LRE(link rule extraction)기법인 NofM 알고리즘의 6단계 중에서 초기 단계인 가중치 군집화 단계를 개선하여 추출되는 규칙들의 전제부에 들어가는 규칙 조건들의 수를 조절함으로써, 추출된 규칙이 입력 특성에 대한 정보를 과잉 일반화하거나, 과잉 구체화하는 것을 피할 수 있음을 실험을 통해 보였다. 일반적으로 NofM 알고리즘에서 가중치들을 군집화한 때는 Join 알고리즘을 사용하는데, 본 논문에서는 Join 알고리즘의 Join condition을 0.05부터 0.25까지 0.05씩 점진적으로 확대하여 클러스터링을 하여줌으로써 신경망의 출력에 중요한 역할을 하는 가중치들을 효과적으로 군집화함을 보였다.

  • PDF

공간 연관규칙을 이용한 도시성장 확률모형의 구현

  • 조성휘;박수홍
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.11a
    • /
    • pp.40-47
    • /
    • 2003
  • GIS는 공간과 관련된 문제를 해결하는데 있어 좋은 도구가 되며 도시성장 예측과 같은 문제에 사용될 수 있다. 본 연구에서는 수도권 내에 위치한 수원지역을 대상으로 1960년대부터 1990년대까지의 도시성장에 관한 데이터베이스를 구축하고 도시의 물리적인 확산에 초점을 맞추어 모형의 핵심이 되는 공간 연관규칙을 추출하였다. 공간 연관규칙의 추출을 위해 GIS 공간 분석 기능과 데이터마이닝 기법을 이용하였으며, 규칙을 기반으로 모형을 작성하여 도시성장을 분석 및 예측하고 UGM(Urban Growth Model)과 비교하였다.

  • PDF

Extracting Rules from Neural Networks with Continuous Attributes (연속형 속성을 갖는 인공 신경망의 규칙 추출)

  • Jagvaral, Batselem;Lee, Wan-Gon;Jeon, Myung-joong;Park, Hyun-Kyu;Park, Young-Tack
    • Journal of KIISE
    • /
    • v.45 no.1
    • /
    • pp.22-29
    • /
    • 2018
  • Over the decades, neural networks have been successfully used in numerous applications from speech recognition to image classification. However, these neural networks cannot explain their results and one needs to know how and why a specific conclusion was drawn. Most studies focus on extracting binary rules from neural networks, which is often impractical to do, since data sets used for machine learning applications contain continuous values. To fill the gap, this paper presents an algorithm to extract logic rules from a trained neural network for data with continuous attributes. It uses hyperplane-based linear classifiers to extract rules with numeric values from trained weights between input and hidden layers and then combines these classifiers with binary rules learned from hidden and output layers to form non-linear classification rules. Experiments with different datasets show that the proposed approach can accurately extract logical rules for data with nonlinear continuous attributes.