• 제목/요약/키워드: 연관규칙 탐사

검색결과 132건 처리시간 0.035초

데이터마이닝에서 수량연관규칙 탐사방법

  • 박원환
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.91-96
    • /
    • 2003
  • 연관규칙은 데이터베이스에 잠재되어 있는 유용한 정보를 탐사하는 방법으로 데이터마이닝의 한 분야이다. 이는 항목의 발생유무만을 고려하는 이진연관규칙에 대한 연구가 주였으나, 최근에는 항목의 수량까지 고려하는 수량연관규칙 탐사가 소개되고 있다. 수량연관규칙은 수량속성 항목을 임의의 방법으로 여러 개의 소구간 항목으로 분할한 후, 각각을 이진항목으로 취급하여 연관규칙을 탐사하는 방법이다. 본 논문에서는 분할된 여러 소구간 분할항목들 중에서 필요 소구간 항목만을 선택적으로 탐사하는 방법을 제안한다. 제안방법은 블린항목제약식을 사용하여 수량항목의 탐사범위를 제한함으로써 모든 분할을 탐사하지 않고 필요 소구간만을 탐사하기 때문에 탐사시간을 단축할 수 있다.

  • PDF

SQL을 이용한 연관 규칙 탐사 시스템 (An Association Rules Mining System based-on SQL)

  • 전수정;김영지;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.89-94
    • /
    • 2000
  • 본 논문에서는 연관 규칙 탐사 시스템을 설계하고 구현하였다. 본 시스템은 관계형 데이터베이스의 표준 질의어를 이용하여 사용자가 제시한 질의 조건을 만족하는 항목집합에 대해 다양한 형태의 연관규칙을 탐사하기 위한 시스템이다. 질의처리 모듈에서는 사용자가 제시한 조건을 만족하는 질의를 동적으로 구성하여, 연관 규칙 탐사를 위해 사용되는 대상 트랜잭션 데이타베이스의 범위를 조절할 수 있다. 연관 규칙을 발견하기 위한 후보 항목집합을 생성하기 위해 연관 규칙 탐사 알고리즘을 사용하였다. 연관 규칙 알고리즘에서는 한 트랜잭션 데이타에 대해 생성될 수 있는 후보 항목집합을 배열을 이용하여 처리하는 효율적인 방법을 제안하였다.

  • PDF

데이터의 상대 지지도를 이용한 다단계 연관 규칙 탐사 기법 (Discovery of Multiple-Level Association Rules using Relative Support of Data)

  • 하단심;황부현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.195-197
    • /
    • 2000
  • 데이더는 다양한 빈도 형태와 속성을 가지고 있으며 데이터의 연관 규칙 탐사 시 이러한 데이터의 빈도수를 고려할 수 있는 방법이 필요하다. 그러나 기존의 연관 규칙 탐사 알고리즘은 지지도와 신뢰도만을 가지고 데이터의 연관성을 발견하며 데이터들의 발생 빈도는 고려하지 않는다. 본 논문에서는 하위 단계의 데이터나 동일한 단계지만 상대적으로 발생 빈도가 적은 데이터들의 연관 규칙을 탐사할 수 있는 방법을 제안한다. 제안하는 방법은 데이터의 상대 지지도를 이용한 다단계 연관 규칙 탐사 기법을 수행함으로써 데이터의 발생 빈도를 고려한 연관 규칙을 탐사할 수 있다. 그리고 탐사된 연관 규칙은 마케팅 분야 등의 여러 응용에서 유용하게 이용될 수 있다.

  • PDF

시간지원 데에터베이스에서의 시간 연관규칙 탐사 시스템의 설계 (Design of a Temporal Association Rule Mining System in Temporal Databases)

  • 이강태;정동원;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.229-231
    • /
    • 1998
  • 시간지원 데이터베이스내에는 다양한 유형의 시간 정보가 내포되어 있다. 이 논문은 다양한 시간 정보를 기반으로 하는 시간 연관규칙 탐사에 관한연구이다. 기존의 연관규칙 탐사에 관한 연구는 현실세계에 존재하는 사건을 탐사 대상으로 하면서도 시간 개념을 지니지 않은 형태의 데이터 집합을 대상으로 하고 있다. 그리고 단순히 단일 시점의 트랜잭션 시간마을 고려하여 순차패턴을 추출해내는 연구가 진행되었다. 이러한 연구는 시간 데이터의 시간 간격 특성과 시간 위상 특성을 간과하게 된다. 또한 시간 종속적인 데이터에 관한 정보의 탐사 시에는 한계점을 지니게 된다. 따라서 이 논문에서는 시간 간격과 시간 위상을 지니는 시간지원 데이터베이스로부터 추출될 수 있는 시간 정보 유형을 제시하고 이에 기반한 다양한 유형의 연관규칙을 제시한다. 또한 시간 연관규칙을 정의하고 이를 탐사하는 과정을 설명하며 궁극적으로 시간지원 데이터베이스에서의 시간 연관규칙 탐사 시스템을 소개한다.

설문 데이터를 위한 다차원 연관 규칙 마이닝 (Multi-Dimensional Association Rule Mining in Survey Data)

  • 이정수;김교정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.395-399
    • /
    • 2003
  • 본 논문에서는 인문 사회과학 분야의 방대한 설문 데이터를 처리하기 위해 기존의 설문 항목들간의 평면적 관계에만 국한 되었던 연구에 대해 설문데이터 다차원 연관규칙 마이닝 시스템을 설계하고 데이터 간의 연관규칙을 탐사한다. 즉, 직관적으로 분류될 수 있는 기준에 따라 클러스터링을 실행하여 데이터를 분류한 후 각 클러스터로부터 다차원 연관 규칙을 탐사하는 시스템을 제안함으로써 보다 강력한 연관규칙을 탐사한다.

  • PDF

연관규칙 시각화를 위한 구조화된 연관맵 (Structured Association Map for Visualizing Association Rules)

  • 김준우
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.325-326
    • /
    • 2015
  • 연관규칙 탐사는 대표적인 데이터 마이닝 기법 중의 하나로, 트랜잭션 데이터에 포함된 항목들 간의 인과 관계를 의미하는 연관규칙의 추출을 목적으로 한다. 연관 규칙 탐사의 주된 문제 중 하나는 추출된 연관규칙의 수가 많을 경우, 이들을 적절히 해석하고 활용하는 것이 어렵다는 점이다. 이러한 문제를 해결하기 위해 본 논문은 구조화된 연관맵이라는 새로운 시각화 방법을 제안하고자 한다.

  • PDF

저장공간 축소와 실행시간 개선을 고려한 연관규칙 마이닝 (Association Rule Mining for Space Reduction and Performance Improvement)

  • 한영우;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.337-339
    • /
    • 2002
  • 연관규칙 탐사기법은 거래(사건) 속에 포함된 품목(항목)간의 연관관계를 발견하고자 할 때 사용하는 기법이며, 독특한 형태의 자료구조를 사용하는 다양한 연관규칙 알고리즘들이 제안되었다. 다양한 특성을 갖는 대용량의 데이터에 대해 효율적으로 연관규칙 탐사를 수행하기 위해서는 저장공간과 실행시간을 모두 고려해야 한다. 본 논문에서는 후보항목집합 발생과정 없이 압축빈발항목집합과 동적링크집합을 이용하여 저장공간 축소와 실행시간 개선을 동시에 고려한 연관규칙 알고리즘을 제안하며, 그 우수성을 증명하기 위해 연관규칙 탐사의 대표적인 자료 구조인 FP-struct, H-Struct와의 저장공간 비교 및 이들 저장구조를 사용하는 FP-growth, H-mine 알고리즘과의 실행시간을 비교한다.

  • PDF

대화형 환경에서 효율적인 연관 규칙 알고리즘 (Efficient Algorithms for Mining Association Rules Under the Interactive Environments)

  • 이재문
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.339-346
    • /
    • 2001
  • 대화형 환경에서 연관 규칙 탐사 문제는 동일한 데이터베이스에서 다른 최소 지지도로 반복적으로 연관 규칙을 탐사하는 것이다. 이 문제는 반복적으로 연관 규칙을 탐사한다는 사실만 기존의 연관 규칙 탐사와 다를 뿐 기존의 연관 규칙 탐사에서 발생하는 모든 문제를 포함한다. 본 논문은 전 단계에 계산된 후보 항목집합에 대한 정보를 이용함으로써 성능 향상을 가져오는 효율적인 알고리즘을 제안한다. 제안된 알고리즘은 대화형 환경에서 기존의 알고리즘과 수행 시간 측면에서 비교되었다. 성능 비교의 결과로부터 제안하는 알고리즘이 기존의 방법보다 약 10~30% 정도의 상대적 성능 향상 효과가 있음을 알 수 있었다.

  • PDF

확장된 공간 연관 규칙 탐사기법 (Extended Method of Discovery of Spatial Association Rules)

  • 하단심;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.83-86
    • /
    • 2000
  • 공간 데이터가 증가함에 따라 이를 효율적으로 저장하고 분석할 수 있는 기술이 필요하게 되었다. 공간 데이터 마이닝은 데이터베이스에서 유용한 지식을 추출하는 기술로, 기존의 데이터 마이닝 방법에 공간의 개념을 추가하여 확장함으로써 공간 패턴, 공간 객체들의 연관 관계 둥을 얻을 수 있다. 본 논문에서는 공간 데이터 마이닝의 기법 중의 하나인 공간 연관 규칙 탐사 기법을 제안한다. 제안하는 방법은 공간 관계를 포함한 공간 연관 규칙뿐만 아니라 공간 객체의 비공간 속성도 함께 고려함으로써 보다 확장되고 다양한 공간 연관 규칙을 탐사할 수 있다.

  • PDF

일반화된 연관규칙 발견을 위한 Level-based Data Mining 시스템 (Level-based Data Mining System for Generalized Association Rules)

  • 김온실;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.43-45
    • /
    • 2001
  • 데이터로부터 숨겨진 패턴을 추출하는 데이터마이닝 기법 중에서 연관규칙은 대용량의 데이터베이스에서 단위 트랜잭션 당 동시에 발생할 확률이 높은 항목들의 유형을 발견하는 기법이다. 연관규칙 탐사에서 개념계층(taxonomy)을 사용하여 보다 포괄적인 의미를 갖는 규칙을 찾아내는 연구가 일반화된 연관규칙이며 이를 통해 일반화 이전에는 간과될 수 있는 중요한 규칙을 발견할 수 있다. 일반화된 연관규칙에 관한 기존의 접근방법은 후보항목집합의 각 항목에 대한 개념계층상의 모든 조상들을 트랜잭션에 추가한 후 확장된 트랜잭션에 대해 지지도를 계산하는 방법이며. 이렇게 되면 연관규칙의 단점중의 하나인 계산량 문제가 더욱 두드러지게 된다. 이에 본 연구에서는 모든 개념계층 레벨이 아닌, 사용자가 관심 있는 레벨로 제한된 환경에서 연관규칙 탐사를 수행하여 규칙생성의 복잡도를 줄이는 시스템을 구현하였다. 그러나 모든 항목을 한 레벨로 일반화하는데는 무리가 따르기 때문에 관심있는 항목의 경우 일반화 레벨을 따로 명시할 수 있도록 하여 사용자가 원하는 규칙을 발견하도록 하였다.

  • PDF