• 제목/요약/키워드: 규칙기반 분류분석

검색결과 129건 처리시간 0.036초

엔트로피 분포를 이용한 규칙기반 분류분석 연구 (Rule-Based Classification Analysis Using Entropy Distribution)

  • 이정진;박해기
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.527-540
    • /
    • 2010
  • 규칙기반 분류분석(rule-based classification analysis)은 직관적인 이해가 쉽고 알고리즘이 복잡하지 않아 최근 대용량 데이터마이닝에 많이 이용되는 기법이다. 하지만 현재의 규칙기반 분석은 여러 개의 규칙들을 찾은후 이 규칙들을 단순히 다수결이나 또는 중요도의 가중 합으로서 새로운 데이터를 분류한다. 본 연구에서는 다항분포를 이용한 이항데이터의 분류분석 기법을 규칙 조합방법에 응용하고자한다. 다향분포의 추정을 위해서는 변형된 반복 비율 적합(iterative proportional fitting; IPF) 알고리즘을 이용하여 최대 엔트로피 분포(entropy distribution)를 찾는다. 시뮬레이션 실험 결과 이 방법은 두 집단의 데이터가 서로 유사한 경우 어느 정도 의미 있는 분류 결과를 보여주였다.

규칙 및 SVM 기반 알고리즘에 의한 심전도 신호의 리듬 분류 (Rhythm Classification of ECG Signal by Rule and SVM Based Algorithm)

  • 김성완;김대환
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.43-51
    • /
    • 2013
  • 신뢰성 있는 부정맥 진단을 위해서는 리듬 구간 및 심박 단위의 종합적인 분석을 통하여 심전도 신호에 대한 분류 결과가 제시되어야 한다. 본 논문에서는 심전도 신호의 특징점에 기반하여 규칙기반 분류를 이용한 일정 구간의 리듬 분석을 수행하고 SVM기반 분류를 이용한 심박 단위의 리듬분석을 첨가하였다. 규칙기반 분류에서는 리듬 구간의 특징에 대하여 임상 자료로부터 도출된 규칙 베이스를 이용하여 리듬 유형을 분류하도록 하며, SVM기반 분류에서는 심박 단위의 특징에 대하여 미리 학습된 다중 SVM 분류기를 이용하여 단조 리듬 및 주요 비정상 심박을 분류하도록 한다. MIT-BIH 부정맥 데이터베이스를 이용한 실험을 통하여 11가지 리듬 유형에 대하여 규칙기반 방법만을 적용하였을 경우 68.52%, 규칙기반과 SVM기반의 융합 방법을 적용하였을 경우 87.04%의 분류 성능을 각각 보였다. SVM기반 방법으로 단조 리듬과 배열 리듬에 대한 오분류 개선을 통하여 분류 성능에서 19% 정도가 향상됨을 확인하였다.

수도권 도시개발 분석을 위한 규칙기반 영상분류 (A Rule-Based Image Classification Method for Analysis of Urban Development in the Capital Area)

  • 이진아;이성순
    • Spatial Information Research
    • /
    • 제19권6호
    • /
    • pp.43-54
    • /
    • 2011
  • 본 연구는 위성영상 자료(2000-2009)를 이용하여 성남-용인 인근지역의 지표변화를 시계열 분석하기 위해 규칙기반 영상분류 방법을 제안하였다. 도시지역의 연도별 변화 패턴을 파악하기 위해 통계적/수학적 기반의 규칙에 따라 11개 클래스로 구분하였다. 훈련지역을 설정하지 않는 무감독분류 방법으로서 규칙을 적용할 수 있도록 알고리즘을 일반화 하였다. 분석 결과, 택지개발 등에 의하여 연구범위 내 도시지역면적이 약 1.45배 증가하였으며, 2009년 영상의 분류정확도는 98%로 나타났다. 방법 검증을 위하여 선분류 후비교법을 이용한 토지피복 변화분석 결과와 비교하였다. 다중영상 내 가용한 데이터를 최대한 이용할 수 있었고, 목적에 최적화된 분류가 가능해져, 분류정확도의 향상을 기대할 수 있었다. 본 규칙기반 영상분류 방법은 향후 도시개발 주제도 제작 및 도시개발, 환경변화 모니터링 등 영상 시계열 분석에 다양하게 적용될 수 있을 것이다.

개선된 휴리스틱 규칙 및 의사 결정 트리 분석을 이용한 P2P 트래픽 분류 기법 (P2P Traffic Classification using Advanced Heuristic Rules and Analysis of Decision Tree Algorithms)

  • 예우지엔;조경산
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.45-54
    • /
    • 2014
  • 본 논문에서는 기존 기법들의 제한점을 개선하기 위해 휴리스틱 규칙 및 기계학습 분석 결과를 이용한 두 단계의 P2P 트래픽 분류 기법을 제안한다. 첫 번째 단계는 패킷 레벨의 시그니처 기반 분류기이고, 두 번째 단계는 플로우 레벨에서 수행되는 패턴 휴리스틱 규칙 및 통계 기반 분류기이다. 제안된 패턴 휴리스틱 규칙은 분류의 정확도를 높이고 통계 기반 분류기가 처리할 트래픽의 양을 줄일 수 있다. 다양한 의사 결정 트리 알고리즘의 분석을 기반으로 통계 기반 분류기는 가장 효율적인 REPTree로 구현하고, 앙상블 알고리즘을 통해 통계 기반 분류기의 성능을 개선한다. 실제 환경의 데이터 집합을 이용한 검증 분석을 통해, 본 제안 기법이 기존 기법에 비해 높은 정확도와 낮은 과부하를 제공함을 제시한다.

맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘 (Travel Time Prediction Algorithm for Trajectory data by using Rule-Based Classification on MapReduce)

  • 김재원;이현조;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.798-801
    • /
    • 2014
  • 여행 정보 시스템(ATIS), 교통 관리 시스템 (ITS) 등 궤적 기반 서비스에서, 서비스 품질을 향상시키기 위해서는 주어진 궤적 질의에 대한 정확한 주행시간을 예측하는 것이 필수적이다. 이를 위한 대표적인 공간 데이터 분석 기법으로는 데이터 분류에서 높은 정확도를 보장하는 규칙 기반 분류화 기법이 존재한다. 그러나 기존 규칙 기반 분류화 기법은 단일 컴퓨터 환경만을 고려하기 때문에, 대용량 공간 데이터 처리에 적합하지 않은 문제점이 존재한다. 이를 해결하기 위해, 본 연구에서는 맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘을 개발하고자 한다. 제안하는 알고리즘은 첫째, 맵리듀스를 이용하여 대용량 공간 데이터를 병렬적으로 분석함으로써, 활용도 높은 궤적 데이터 규칙을 생성한다. 이를 통해 대용량 공간 데이터 기반의 규칙 생성 시간을 감소시킨다. 둘째, 그리드 구조 기반의 지도 데이터 분할을 통해, 사용자 질의처리 시 탐색 성능을 향상시킨다. 즉, 주행 시간 예측을 위한 규칙 그룹을 탐색 시 질의를 포함하는 그리드 셀만을 탐색하기 때문에, 질의처리 성능이 향상된다. 마지막으로 맵리듀스 구조에 적합한 질의처리 알고리즘을 설계하여, 효율적인 병렬 질의처리를 지원한다. 이를 위해 맵 함수에서는 선정된 그리드 셀에 대해, 질의에 포함된 도로 구간에서의 주행 시간을 병렬적으로 측정한다. 아울러 리듀스 함수에서는 출발 시간 및 구간별 주행 시간을 바탕으로 맵 함수의 결과를 병합함으로써, 최종 결과를 생성한다. 이를 통해 공간 빅데이터 분석을 통한 주행 시간 예측 기법의 처리 시간 및 결과 정확도를 향상시킨다.

정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법 (A New Importance Measure of Association Rules Using Information Theory)

  • 이창환;배주현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.37-42
    • /
    • 2014
  • 연관 규칙들을 이용한 분류학습은 최근 활발히 연구되는 분야의 하나이다. 이러한 연관 규칙을 이용한 분류에는 연관 규칙들에 대한 수치적 중요도를 계산하는 것이 중요하다. 본 논문에서는 정보 이론을 사용한 H measure 라는 새로운 규칙 중요도 기법을 제안한다. 구체적으로 Hellinger 변량을 이용하여 연관규칙의 중요도를 계산한다. 제안된 H measure 의 다양한 특성들을 분석하였으며 또한 이러한 H measure를 이용한 분류학습의 성능을 다른 규칙 measure를 이용한 분류학습의 성능과 비교하였다.

산술 연산자 기반 유전자 프로그래밍을 이용한 암 분류 규칙 발견 (Rule Discovery for Cancer Classification using Genetic Programming based on Arithmetic Operators)

  • 홍진혁;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.999-1009
    • /
    • 2004
  • 최근 생물정보 기술이 암 진단의 새로운 방법으로 관심을 모으고 있다. 다양한 기계학습 기법이 적용되어 우수한 결과를 얻고 있지만 의학 분야에서는 정확률이 높은 분류기뿐만 아니라 획득된 분류규칙을 사람이 분석하고 이해할 수 있어야 한다. 생물정보 기술에서 많이 이용되는 유전자 발현 데이터는 데이타 내에 수천 내지 수만의 변수가 존재하며, 직접 이들 사이의 복잡한 관계를 표현하고 이해하는 것은 매우 어렵다. 본 논문에서는 이러한 어려움을 극복하기 위해 유전자 발현 데이타에서 분류에 유용한 특징들을 추출하고 산술 연산자 기반 유전자 프로그래밍으로 암 분류규칙을 생성하는 방법을 제안한다. 림프종 유전자 발현 데이타에 대하여 실험하여 96.6%의 인식률을 얻었으며, 획득된 분류 규칙을 분석하여 다양한 지식을 발견할 수 있었다.

규칙기반 영상분류 방법의 제주도 지역의 적용 (Application of the Rule-Based Image Classification Method to Jeju Island)

  • 이진아;이성순
    • Spatial Information Research
    • /
    • 제21권1호
    • /
    • pp.63-73
    • /
    • 2013
  • 지형지물은 각각의 특징적 요인을 내포하고 있어 촬영된 위성영상에 반영된다. 촬영시기가 다른 영상을 통하여 변화에 대한 정보를 얻을 수 있다. 다중시기 영상을 무감독 방법으로 분류할 수 있다면 영상 분류의 정확도를 높여 주고, 여러 응용분야에 기여할 수 있다. 규칙기반 영상분류 알고리즘은 사람의 직접적인 개입이 없이 자동화된 방법으로 처리 되도록 개발되었으나, 불완전 요소에 결과가 영향 받는지 확인되어야 한다. 이 연구에서는 제주도 지역의 Landsat 영상으로 규칙기반 영상분류를 수행하였다. 영상의 구름의 존재하고 촬영시기의 차이가 있는 경우, 대상지가 도시, 산지, 농지 등 복합적인 경우에 대하여 적용 결과를 확인하였다. 구름이 있는 부분의 경우, 계수에 영향을 주지 않았으며, 촬영시기의 차이에 따라 분류규칙이 적절이 반영되었다. 제주시 도시지역의 확장, 서귀포시의 비닐하우스 등의 시설물 개체 수 증가 등을 파악 할 수 있었다. 제주도 지역의 공간정보 변화 파악과 분류 정확도를 얻을 수 있었다. 양질의 무감독 분류가 수행되는 것을 목표로 하여 방법의 일반화 및 개선방안을 모색하고자 하였다. 향후 도시개발, 환경변화 모니터링 등 영상 시계열 분석에 다양하게 활용될 수 있을 것이다.

데이터 마이닝의 분류 규칙 발견을 위한 유전자알고리즘 학습방법 (Genetics-Based Machine Learning for Generating Classification Rule in Data Mining)

  • 김대희;박상호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.429-434
    • /
    • 2001
  • 데이터(data)치 홍수와 정보의 빈곤이라는 환경에 처한 지금, 정보기술을 이용하여 데이터를 여과하고, 분석하며, 결과를 해석하는 자동화 된 데이터 분석 방안에 높은 관심을 가지게 되었으며, 데이터 마이닝(Data Mining))은 이러한 요구를 충족시키는 정보기술의 활용방법이다. 특히 데이터 마이닝(Data Mining)의 분류(Classification) 방법은 중요한 분야가 되고 있다. 분류 작업의 핵심은 어떻게 적당한 결정규칙(decision rule)을 정의하느냐에 달려 있는데 이를 위해 학습능력을 가지고 있는 알고리즘이 필요하다. 본 논문에서는 유전자 알고리즘(Genetic Algorithm)을 기반으로 하는 강건한 학습방법을 제시했으며, 이러한 학습을 통해 데이터 마이닝(Data Mining)의 분류시스템을 제안하였다.

  • PDF

영상분류에 의한 하우스재배지 탐지 활용성 분석 (Analyzing the Applicability of Greenhouse Detection Using Image Classification)

  • 성증수;이성순;백승희
    • 한국측량학회지
    • /
    • 제30권4호
    • /
    • pp.397-404
    • /
    • 2012
  • 농업과 관광이 주요 산업인 제주지역은 소득 증대를 위해 노지재배에서 시설재배로의 전환이 활발하게 진행되고 있으므로 하우스재배지에 대한 지속적인 현황 파악이 필요하다. 이에 본 연구에서는 고해상도 위성영상을 이용하여 하우스재배지 탐지를 위한 효과적인 영상분류 방법을 제시하고자 하였다. Formosat-2 위성영상을 대상으로 감독분류와 규칙기반분류 방법을 적용하여 하우스재배지를 분류하였으며, 두 가지 결과를 연계하여 하우스재배지 탐지를 위한 정확도 향상 방안을 모색하였다. 각 분류 방법별 결과는 육안 탐지 결과와의 비교를 통해 정확도를 산출하였다. 연구 결과, 감독분류 방법 중 마하라노비스 거리법이 가장 높은 탐지 결과를 얻을 수 있었으며 감독분류 결과와 규칙기반분류 결과의 연계 시 탐지 정확도가 향상됨을 확인하였다. 향후 감독분류 결과와 규칙기반분류 결과의 연계 과정에 대한 추가적인 연구가 이루어진다면 하우스재배지의 효율적인 탐지가 가능할 것으로 기대된다.