• 제목/요약/키워드: 분류규칙

검색결과 720건 처리시간 0.025초

신경망과 다단계 연관규칙을 이용한 구매 패턴 분류 시스템의 설계 (Design of Purchasing Pattern Classification System Using Nural Network and Multiple-Level Association Rules)

  • 이종민;정홍
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.203-206
    • /
    • 2000
  • 신경망을 이용해 고객집단을 분류하고 고객의 특성에 따라 세분화된 고객들에 대해 다단계 연관규칙을 적용해서 고객의 상품 구매패턴을 찾아 줌으로써 마케팅 전략 결정을 지원하는 구매패턴분류 시스템을 설계한다. 고객분류를 위한 신경망 시스템은 다층 퍼셉트론에 역전파 알고리즘을 이용한다. 주소, 구매금액, 구매횟수, 고객 구분, 상긴 등과 같은 고객정보를 입력층에 입력변수로 지정하고, 이에 따른 우량/일반고객을 출력변수로 지정한 후 신경망을 학습시키면, 실제의 우량/일반의 간과 예측되는 우량/일반의 값의 차이론 최소화시키면서 모형을 형성시켜 나가게 된다. 구매패턴 분류 시스템은 다단계 연관규칙을 이용한다. 고객분류 서브시스템을 통해 고객집단이 세분화되면 각각의 고객집단에 대해 TID와 품목 트랜잭션을 입력으로 cumulate 알고리즘과 개념계층을 이용해 일반화 과정을 수행하면서 빈발 항목을 찾게 되고 이론 근거로 항목간의 연관규칙을 찾아내게 된다.

  • PDF

규칙기반 리듬 분류에 의한 심전도 신호의 비정상 검출 (Abnormality Detection of ECG Signal by Rule-based Rhythm Classification)

  • 류춘하;김성완;김세윤;김태훈;최병재;박길흠
    • 한국지능시스템학회논문지
    • /
    • 제22권4호
    • /
    • pp.405-413
    • /
    • 2012
  • 심전도 신호의 신뢰성 있는 진단을 위해서는 높은 분류 정확도와 함께 낮은 오분류 성능이 중요하며, 특히 비정상을 정상으로 진단하는 것은 심검자에게 치명적인 문제로 귀결될 수 있다. 본 논문에서는 임상 진단 기준을 반영하는 규칙기반 분류 알고리즘을 이용하여 비정상 리듬을 검출 및 분류하는 방법을 제안한다. 규칙기반 분류는 리듬 구간의 특징에 대한 규칙 베이스를 이용하여 리듬 유형을 분류하도록 하며, 이 때 규칙 베이스는 임상 및 내과 분야의 심전도 전문 임상 자료에 기반한 본 논문의 기준표에 따라 구성된다. MIT-BIH 부정맥 데이터베이스를 이용한 제안 방법의 실험을 통하여 정상동조율, 박동조율, 및 다양한 비정상 리듬에 대한 리듬 유형의 분류가 가능함을 확인하였으며, 특히 비정상 리듬 검출 측면에서는 오분류가 전혀 발생되지 않는 결과를 보였다.

효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법 (A Feature Selection Technique for an Efficient Document Automatic Classification)

  • 김지숙;문현정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.295-302
    • /
    • 2001
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 기존의 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 비감독학습 기법에 의해 대량의 문서를 효율적으로 분류하기 위한 대표 색인어 추출 기법을 제안하였다. 컴퓨터 분야의 논문을 대상으로 각 분야별 대표 색인어를 추출하여 유사한 문서끼리 분류하는 실험을 통해 제안된 방법의 효율성을 보였다.

  • PDF

문제분류규칙을 이용한 변수 순서화 알고리즘 (Variable Ordering Algorithms Using Problem Classifying)

  • 손석원
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.127-135
    • /
    • 2011
  • 백트래킹을 이용한 깊이우선탐색에서 해를 빨리 찾기 위한 방법 중 하나는 결정변수의 순서를 효과적으로 배열하는 것이다. 이 때 문제의 동적 및 정적 특성을 고려한 변수 순서화 알고리즘 개발은 매우 중요한 문제이다. 그러나 문제에 적합한 최적의 변수 순서화 알고리즘을 개발하는 것은 어려운 문제이다. 본 논문에서는 변수의 속성에 기반을 두어 문제의 형태를 규정하는 문제분류규칙을 제안하고 이 규칙을 이용하여 문제에 적합한 변수 순서화 알고리즘의 형태를 예측할 수 있게 한다. 결정변수가 동적 및 정적 특성을 갖는 DS-type 문제로서 주파수 할당문제를 선택하여 최적의 변수 순서화 알고리즘을 예측한다. 또한 문제분류규칙에 의해 생성되지 않는 특별한 형태의 문제인 기지국 위치문제를 적용하여 제안하는 문제분류규칙의 효용성을 입증한다.

수도권 도시개발 분석을 위한 규칙기반 영상분류 (A Rule-Based Image Classification Method for Analysis of Urban Development in the Capital Area)

  • 이진아;이성순
    • Spatial Information Research
    • /
    • 제19권6호
    • /
    • pp.43-54
    • /
    • 2011
  • 본 연구는 위성영상 자료(2000-2009)를 이용하여 성남-용인 인근지역의 지표변화를 시계열 분석하기 위해 규칙기반 영상분류 방법을 제안하였다. 도시지역의 연도별 변화 패턴을 파악하기 위해 통계적/수학적 기반의 규칙에 따라 11개 클래스로 구분하였다. 훈련지역을 설정하지 않는 무감독분류 방법으로서 규칙을 적용할 수 있도록 알고리즘을 일반화 하였다. 분석 결과, 택지개발 등에 의하여 연구범위 내 도시지역면적이 약 1.45배 증가하였으며, 2009년 영상의 분류정확도는 98%로 나타났다. 방법 검증을 위하여 선분류 후비교법을 이용한 토지피복 변화분석 결과와 비교하였다. 다중영상 내 가용한 데이터를 최대한 이용할 수 있었고, 목적에 최적화된 분류가 가능해져, 분류정확도의 향상을 기대할 수 있었다. 본 규칙기반 영상분류 방법은 향후 도시개발 주제도 제작 및 도시개발, 환경변화 모니터링 등 영상 시계열 분석에 다양하게 적용될 수 있을 것이다.

산술 연산자 기반 유전자 프로그래밍을 이용한 효과적인 암 분류 (Effective Cancer Classification Using Genetic Programming based on Arithmetic Operators)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.1-3
    • /
    • 2003
  • 최근 생물정보 기술이 암 진단의 새로운 방법으로 관심을 모으고 있다. 다양한 기계학습 기법을 적용하여 우수한 결과를 얻고 있지만, 의학 분양에서는 정확률이 높은 분류기의 획득과 동시에 획득된 분류규칙을 분석하고 이해할 수 있어야 한다. 생물정보 기술에서 많이 사용되는 유전발현 데이터는 데이터내에 수천 내지 수만의 변수가 존재하여 직접 이들 사이의 복잡한 관계를 표현하고 이해하는 것은 매우 어렵다. 본 논문에서는 이러한 어려움을 극복하기 위해 유전발현 데이터에서 분류에 유용한 특징들을 추출하고 유전자 프로그래밍으로 추출된 특징들을 이용한 암 분류규칙을 생성한다. 림프종 유전발현 데이터에 대하여 실험해본 결과, 90% 수준의 인식 성능을 보였고, 또한 모든 샘플을 완벽하게 분류하는 산술 분류규칙을 발견하였다.

  • PDF

분류 성능 향상을 위한 다양성 기반 앙상블 유전자 프로그래밍 (Diversity based Ensemble Genetic Programming for Improving Classification Performance)

  • 홍진혁;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권12호
    • /
    • pp.1229-1237
    • /
    • 2005
  • 분류 성능을 향상시키기 위해서 다수의 분류기들을 결합하는 연구가 활발히 진행되고 있다. 우수한 앙상블 분류기를 회득하기 위해서는 정확하고 다양한 개별 분류기를 구축해야 한다. 기존에는 Bagging이나 Boosting 등의 앙상블 학습 기법을 이용하거나 획득된 개별 분류기의 학습 데이타에 대한 다양성을 측정하였지만 유전 발현 데이타와 같이 학습 데이타가 적은 경우 한계가 있다. 본 논문에서는 유전자 프로그래밍으로부터 획득된 규칙의 구조적 다양성을 분석하여 결합하는 앙상블 기법을 제안한다. 유전자 프로그래밍으로 해석 가능한 분류 규칙을 생성하고 그들 사이의 다양성을 측정한 뒤, 이들 중 다양한 규칙의 집합을 결합하여 분류를 수행한다. 유전 발현 데이타로부터 림프종 암, 폐 암, 난소 암 등을 분류하는 문제를 대상으로 실험하여 제안하는 방법의 유용성을 검증하였다. 앙상블 시 분류 규칙 사이의 다양성을 분석하여 결합한 결과, 다양성을 고려하지 않을 때보다 높은 분류 성능을 획득하였고, 개별 분류 규칙들 사이의 다양성에 따라서 정분류율이 증가하는 것도 확인하였다.

산술 연산자 기반 유전자 프로그래밍을 이용한 암 분류 규칙 발견 (Rule Discovery for Cancer Classification using Genetic Programming based on Arithmetic Operators)

  • 홍진혁;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.999-1009
    • /
    • 2004
  • 최근 생물정보 기술이 암 진단의 새로운 방법으로 관심을 모으고 있다. 다양한 기계학습 기법이 적용되어 우수한 결과를 얻고 있지만 의학 분야에서는 정확률이 높은 분류기뿐만 아니라 획득된 분류규칙을 사람이 분석하고 이해할 수 있어야 한다. 생물정보 기술에서 많이 이용되는 유전자 발현 데이터는 데이타 내에 수천 내지 수만의 변수가 존재하며, 직접 이들 사이의 복잡한 관계를 표현하고 이해하는 것은 매우 어렵다. 본 논문에서는 이러한 어려움을 극복하기 위해 유전자 발현 데이타에서 분류에 유용한 특징들을 추출하고 산술 연산자 기반 유전자 프로그래밍으로 암 분류규칙을 생성하는 방법을 제안한다. 림프종 유전자 발현 데이타에 대하여 실험하여 96.6%의 인식률을 얻었으며, 획득된 분류 규칙을 분석하여 다양한 지식을 발견할 수 있었다.

예제기반 한국어 표준 산업/직업 코드 분류 (An Example-based Korean Standard Industrial and Occupational Code Classification)

  • 임희석
    • 한국산학기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.594-601
    • /
    • 2006
  • 통계청에서 실시하는 통계 조사에는 한국 표준 산업/직업 분류 코드를 작성하는 작업이 많이 포함되는데, 현재 대부분의 코드 분류 작업은 수작업으로 이루어지고 있으며, 이로 인하여 막대한 노동력과 비용이 소모되고 작업결과의 일관성을 유지하기 어렵다는 문제점이 있다. 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동 분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자 연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다. 수작업 규칙 260여개와 40만여개의 예제를 이용하여 학습한 시스템에 대하여 실험한 결과 제안한 시스템은 직업 코드 분류에서 76.69% 그리고 산업 코드 분류에서는 99.68%의 정확도를 보였다.

  • PDF

소속 함수 학습을 이용한 퍼지 분류의 성능 개선 (Improving the Performance of Fuzzy Classification Using Membership Function Learning)

  • 곽동헌;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.613-615
    • /
    • 2004
  • 수치적인 데이터를 분류하기 위한 대표적인 방법은 퍼지 규칙을 사용하는 것이다. 하지만 퍼지 규칙을 이용하는 방법은 퍼지 소속 함수를 어떻게 정의하느냐에 따라 퍼지 분류의 성능이 크게 영향을 받는다는 문제점이 있다. 따라서 퍼지 규칙을 쉽게 이해하기 위해서는 가능한 퍼지 규칙의 수를 적게 유지하는 것이 필요하다. 본 논문에서는 효과적이며 이해하기 쉬운 퍼지 규칙을 생성하기 위해 기울기 강하법을 기반으로 하는 소속 함수 학습 방법을 제안한다 에러율을 감소하기 위해 Penalty 연산과 Reward 연산을 통해 소속 함수가 반복적으로 조절된다 새로운 소속 함수는 Coverage 연산에 의해 생성된다. 또한 이해하기 쉬운 퍼지 규칙을 최적화하기 위해 학습된 소속 함수골 퍼지 결정 트리에 적용한다. 본 논문에서 제안한 알고리즘의 타당성을 확인하기 위해 벤치 마크 데이터인 Iris, Wisconsin Breast Cancer, Plma, Bupa 데이터를 이용하여 실험 결과를 보인다. 실험 결과를 통해 제안한 알고리즘이 기존의 C4.5와 FID 3.1 알고리즘보다 더 효과적이거나 비슷한 성능을 보임을 알 수 있다.

  • PDF