• 제목/요약/키워드: 분류규칙

검색결과 724건 처리시간 0.026초

구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법 (The Method of Classification Considering Rule Weights in the Interval-Valued Fuzzy Sets)

  • 손창식;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.85-89
    • /
    • 2006
  • 구간값 퍼지집합은 일반적인 퍼지집합보다 언어적인 의사결정 절차에서 매핑의 정확성과 계산의 효율성이 뛰어나고, 규칙의 가중치는 패턴 분류문제에서 분류 경계를 효율적으로 조정할 수 있다는 장점을 가지고 있다. 따라서 본 논문에서는 퍼지규칙 기반 분류방법을 구간값 퍼지규칙 기반 분류방법으로 확장하고 규칙의 가중치를 고려한 분류방법을 제안한다. 모의실험에서는 일반 퍼지집합에서 규칙 가중치를 고려한 분류방법과 구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법을 비교하였다.

  • PDF

규칙 성장 기반 퍼지 분류기의 설계 (Design of Growing Rule-based Fuzzy Classifier)

  • 김욱동;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1375-1376
    • /
    • 2015
  • 본 논문은 퍼지 클러스터링을 이용한 규칙 성장 기반 퍼지 분류기의 설계에 대해서 소개한다. 본 논문의 목적은 퍼지 클러스터링을 통해 형성된 증가된 퍼지 규칙을 이용한 새로운 설계 방법론을 개발하는 것이다. 제안된 분류기는 네개의 기능적인 부분으로 구성된다. 퍼지 규칙의 전반부는 퍼지 클러스터링 알고리즘을 이용해 구성된 멤버쉽 함수를 나타낸다. 후반부는 지역 모델을 구성한다. 지역 모델의 파라미터는 가중 최소 자승법에 의해 추정된다. 추론부에서는, 각 퍼지 규칙의 에러 측정후, 가장 높은 에러를 갖는 하나의 퍼지 규칙이 선택된다. 규칙성장 부분에서는, 네트워크의 강화를 위해 규칙의 성장 과정이 이루어지며, 선택된 규칙은 제안된 분류기에서 더 나은 성능을 위해 두 개 또는 세 개의 세분화된 퍼지 규칙으로 나누어진다. 이러한 새로운 규칙은 context 기반 Fuzzy C-Means 클러스터링에 의해서 형성된다. 제안된 규칙 기반 분류기의 효용성을 토론하며, 머신 러닝 데이터를 이용하여 실험을 수행하였다.

  • PDF

가중치가 부여된 연관 규칙을 이용한 문서 분류 (Document Classification using Weighted Associative Classifier)

  • 김흥남;이기성;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.154-156
    • /
    • 2003
  • 인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.

  • PDF

정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법 (A New Importance Measure of Association Rules Using Information Theory)

  • 이창환;배주현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.37-42
    • /
    • 2014
  • 연관 규칙들을 이용한 분류학습은 최근 활발히 연구되는 분야의 하나이다. 이러한 연관 규칙을 이용한 분류에는 연관 규칙들에 대한 수치적 중요도를 계산하는 것이 중요하다. 본 논문에서는 정보 이론을 사용한 H measure 라는 새로운 규칙 중요도 기법을 제안한다. 구체적으로 Hellinger 변량을 이용하여 연관규칙의 중요도를 계산한다. 제안된 H measure 의 다양한 특성들을 분석하였으며 또한 이러한 H measure를 이용한 분류학습의 성능을 다른 규칙 measure를 이용한 분류학습의 성능과 비교하였다.

유전알고리즘을 이용한 최적퍼지 규칙베이스 시스템의 설계 (Design of Optimal Fuzzy Rule-base Systems with Genetic Algorithm)

  • 김종율
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.439-442
    • /
    • 2007
  • 본 논문은 퍼지 분류를 위한 퍼지 규칙베이스 시스템에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화률 하는 유전 알고리즘을 제안한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

새로운 규칙 생성 알고리즘 (A New Rule-Generation Algorithm)

  • 김상귀;윤충화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.721-723
    • /
    • 2005
  • 패턴 분류에 많이 사용되는 MBR(Memory Based Reasoning) 기법은 메모리에 저장된 학습패턴과 테스트 패턴간의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 분류하기 때문에 테스트 패턴을 분류하는 기준을 설명할 수 없다는 문제점을 가지고 있다. 본 논문에서는 RPA(Recursive Partition Averaging) 기법을 이용하여 분류 기준을 설명할 수 있는 IF-THIN 형태의 규칙을 생성하고 생성된 규칙의 일반화 성능을 향상시키기 위하여 불필요한 조건을 제거하는 규칙 pruning 알고리즘과 생성되는 규칙의 개수를 줄일 수 있는 점진적 규칙 추출 알고리즘을 제안한다.

  • PDF

분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 (Genetic Algorithm to find Classification Rule for Classifier Systems)

  • 김대희;박상호
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.16-25
    • /
    • 2004
  • 분류시스템은 현재의 유용한 규칙들로부터 새로운 규칙들을 만들어 가기 위해 학습하는 규칙 기반 시스템이다. 본 논문에서는 방대한 데이터베이스에서 유용한 정보를 얻는 분류시스템의 분류 규칙 발견을 위한 유전자 알고리즘 을 제안하였다. 제안된 방법을 자동차 보험문제에 적용하여 제안된 유전자 알고리즘 기반 분류시스템의 성능을 평가하였다.

  • PDF

나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템 (Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule)

  • 조한철;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.223-225
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.

  • PDF

최적 퍼지 룰 베이스 시스템의 설계를 위한 유전 알고리즘 (Genetic Algorithm for Designing the Optimal Fuzzy Rule-base Systems)

  • 김동훈;김종율
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.772-775
    • /
    • 2008
  • 본 논문은 퍼지 분류 시스템을 위한 퍼지 규칙베이스에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화를 하는 유전 알고리즘을 제안한다. 제안하는 유전 알고리즘은 분류 성능을 보다 더 향상시키기 위해서 인식에 사용된 규칙에 대한 확실성 정도를 개선하는 방법을 포함한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

엔트로피 분포를 이용한 규칙기반 분류분석 연구 (Rule-Based Classification Analysis Using Entropy Distribution)

  • 이정진;박해기
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.527-540
    • /
    • 2010
  • 규칙기반 분류분석(rule-based classification analysis)은 직관적인 이해가 쉽고 알고리즘이 복잡하지 않아 최근 대용량 데이터마이닝에 많이 이용되는 기법이다. 하지만 현재의 규칙기반 분석은 여러 개의 규칙들을 찾은후 이 규칙들을 단순히 다수결이나 또는 중요도의 가중 합으로서 새로운 데이터를 분류한다. 본 연구에서는 다항분포를 이용한 이항데이터의 분류분석 기법을 규칙 조합방법에 응용하고자한다. 다향분포의 추정을 위해서는 변형된 반복 비율 적합(iterative proportional fitting; IPF) 알고리즘을 이용하여 최대 엔트로피 분포(entropy distribution)를 찾는다. 시뮬레이션 실험 결과 이 방법은 두 집단의 데이터가 서로 유사한 경우 어느 정도 의미 있는 분류 결과를 보여주였다.