• 제목/요약/키워드: frequent item set

검색결과 21건 처리시간 0.03초

효율적인 연관규칙 감축을 위한 WT-알고리즘에 관한 연구 (A Study on WT-Algorithm for Effective Reduction of Association Rules)

  • 박진희;피수영
    • 한국산업정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.61-69
    • /
    • 2015
  • 매일 각종 모바일 디바이스와 온라인, 소셜네트워크서비스 등에서 쏟아지는 데이터로 인해 정보의 홍수를 넘어 과부하 상태에 있다. 이미 생성되어 있는 기존 정보들도 있지만 시시각각 새롭게 생겨나고 있는 정보들이 헤아릴 수 없을 정도이다. 연관분석은 이러한 정보들 속에서 나타나는 항목의 발생 빈도수가 최소 지지도보다 큰 빈발항목집합(Frequent Item set)을 찾는 방법이다. 항목의 수가 많아짐에 따라 규칙의 수도 기하급수적으로 늘어나므로 원하는 정보를 찾기가 어려운 단점이 있다. 따라서 본 논문에서는 트랜잭션데이터 집합을 Boolean 변수 아이템으로 나타내었다. 논리함수를 간소화하는데 사용되는 Quine-McKluskey의 방법으로 알고리즘화하여 각 항목에 가중치를 부여한 WT-알고리즘을 제안한다. 제안한 알고리즘은 항목의 개수와 관계없이 간략화가 가능한 장점으로 인하여 불필요한 규칙을 감소시켜 데이터마이닝 효율을 향상시킬 수 있다.

데이터 마이닝에서 기존의 연관규칙을 갱신하는 효율적인 앨고리듬 (An Efficient Algorithm for Updating Discovered Association Rules in Data Mining)

  • 김동필;지영근;황종원;강맹규
    • 산업경영시스템학회지
    • /
    • 제21권45호
    • /
    • pp.121-133
    • /
    • 1998
  • This study suggests an efficient algorithm for updating discovered association rules in large database, because a database may allow frequent or occasional updates, and such updates may not only invalidate some existing strong association rules, but also turn some weak rules into strong ones. FUP and DMI update efficiently strong association rules in the whole updated database reusing the information of the old large item-sets. Moreover, these algorithms use a pruning technique for reducing the database size in the update process. This study updates strong association rules efficiently in the whole updated database reusing the information of the old large item-sets. An updating algorithm that is suggested in this study generates the whole candidate item-sets at once in an incremental database in view of the fact that it is difficult to find the new set of large item-sets in the whole updated database after an incremental database is added to the original database. This method of generating candidate item-sets is different from that of FUP and DMI. After generating the whole candidate item-sets, if each item-set in the whole candidate item-sets is large at an incremental database, the original database is scanned and the support of each item-set in the whole candidate item-sets is updated. So, the whole large item-sets in the whole updated database is found out. An updating algorithm that is suggested in this study does not use a pruning technique for reducing the database size in the update process. As a result, an updating algoritm that is suggested updates fast and efficiently discovered large item-sets.

  • PDF

위치 기반 서비스 지원을 위한 연관 클래스 집합 생성 기법 (An Associative Class Set Generation Method for supporting Location-based Services)

  • 김호숙;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.287-296
    • /
    • 2004
  • 최근 이동 컴퓨팅 환경 하에서 위치를 기반으로 하는 다양한 서비스가 점차 증가하고 있다. 본 논문은 이동 컴퓨팅 환경에서 대량의 공간 데이타베이스를 기반으로 하는 위치 기반 서비스를 지원하기 위하여, 요청되는 질의들 사이에 존재하는 의미적으로 연관성이 있는 빈발 항목인 연관 클래스 집합을 제안하고, 이를 효과적으로 찾는 방법에 대해 소개한다. 이때 요청되는 질의들의 시간적 연관 관계, 그리고 이러한 서비스를 제공해 주는 공간 객체들 사이의 거리와 사용자의 접근 특성이 함께 고려된다 이러한 연구 결과는 이동 환경이 갖는 제약점을 극복하면서 효과적으로 위치 기반 서비스를 지원하는 바탕이 된다 즉 생성된 연관 클래스 집합은 이동 컴퓨팅 환경에서 지리 정보를 서비스 할 때 관련 자료를 추천하는 시스템에 활용할 수 있고, 지리 정보를 고려한 광고 방송이나 도시 개발 계획 둥에 이용할 수 있으며, 이동 사용자를 위한 클라이언트의 캐쉬 정책에 응용될 수 있다.

협업 필터링과 빈발 패턴을 이용한 개인화된 그룹 추천 (Personalized Group Recommendation Using Collaborative Filtering and Frequent Pattern)

  • 김정우;박광현
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.768-774
    • /
    • 2016
  • 본 논문에서는 개인화 서비스를 제공하기 위해 책, 음악, 영화 등과 같이 단일 항목을 추천하는 기존 방법의 한계를 극복하고, 패션, 요리 등과 같이 연관성에 따른 항목의 조합, 즉 그룹을 추천하는 방법을 다룬다. 협업 필터링은 사용자 간의 유사도를 측정하여 비슷한 성향의 사용자들이 선택한 항목을 추천하는 방법이며, 사용자의 성향을 예측할 수 있다는 장점이 있다. 본 논문에서는 이러한 협업 필터링과 연관 규칙을 바탕으로 빈발 항목 집합을 생성하고, 그룹 간의 유사도에 따라 그룹을 추천하는 알고리즘을 제안한다. 제안하는 방법의 타당성을 검증하기 위하여 의류 전자상거래에서 4개월 동안 소비자가 구매한 목록 데이터로 실험을 수행하였다.

데이터베이스에서 빈발패턴의 추출을 위한 메모리 향상기법 (Memory Improvement Method for Extraction of Frequent Patterns in DataBase)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.127-133
    • /
    • 2019
  • 지금까지의 빈발 항목 추출에서는 FP-Tree에 대한 순회와 패턴의 탐색이 필수적인 과정이기 때문에 마이닝 데이터를 트리에 저장하는데 공간이 필요하고 탐색하는데 CPU시간이 필요하기 마련이다. 이러한 단점을 극복하기 위하여 본 논문에서는 조건부 FP-Tree의 의존하지 않고 트랜잭션 데이터의 각 항목들의 위치 정보를 부여하여 트랜잭션 데이터를 2차원의 위치정보 Look-Up테이블로 변환하여 시간과 공간적인 접근성을 용이하게 한다. 또한 항목과 항목의 위치에 대한 매핑배열을 병행하여 시간 복잡도를 줄이는 방법을 고려하는 알고리즘을 제안한다. 실험 결과를 통하여 제안된 방법은 FIMI 저장소 웹 사이트에서 얻은 데이터 세트를 기반으로 많은 실행 시간과 메모리 사용을 줄일 수 있음을 보였다.

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

방화문의 현장품질관리 개선방안에 관한 연구 (A Study on Improvement of the Quality Management for Fire Doors)

  • 최동호
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2019년도 춘계 학술논문 발표대회
    • /
    • pp.93-94
    • /
    • 2019
  • When the fire door is recently installed in the field, there are frequent cases where the fire door is manufactured with fire door having low quality or different structure compared to the performance that the fire door producer has confirmed in the performance test or the construction specification. In order to improve the on-site quality management of the fire door, we comprehensively classify the quality management items of the fire door according to the management subject and the step by stage and set the field quality management procedure, the field quality management inspection item, regulations and standardized checklists were presented.

  • PDF

데이터 베이스 특성에 따른 효율적인 데이터 마이닝 알고리즘 (An Efficient Data Mining Algorithm based on the Database Characteristics)

  • 박지현;고찬
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제10권1호
    • /
    • pp.107-119
    • /
    • 2006
  • 인터넷과 웹 기술 발전에 따라 데이터베이스에 축적되는 자료의 양이 급속히 늘어나고 있다. 데이터베이스의 응용 범위가 확대되고 대용량 데이터베이스로부터 유용한 지식을 발견하고자 하는 데이터 마이닝(Data Mining) 기술에 대한 연구가 활발하게 진행되고 있다. 기존의 알고리즘들은 대부분 후보 항목 집합들을 줄임과 동시에 데이터베이스의 크기를 줄이는 방법으로 발전해 오고 있다. 그러나 후보 항목집합들을 줄이는 노력이나 데이터베이스의 크기를 줄이는 방법들이 빈발 항목집합들을 생성하는 전 과정에서 필요로 하지는 않는다. 그러한 방법들이 어느 과정에서는 시간을 줄이는데 효과가 있지만 다른 과정에서는 오히려 그러한 방법들을 적용하는데 더 많은 시간이 소요되기 때문이다. 본 논문에서는 트랜잭션들의 길이가 짧거나 데이터베이스를 이루는 항목들의 수가 비교적 적은 트랜잭션 데이터베이스에서 해슁 기법을 사용하여 데이터베이스를 한 번 스캔하고 동시에 각 트랜잭션에서 발생 가능한 모든 부분집합들을 해쉬 테이블에 저장함으로써 최소 지지도에 영향을 받지 않고 기존의 알고리즘보다 더 짧은 시간에 빈발항목집합을 발견할 수 있는 효과적인 연관 규칙 탐사 알고리즘을 제안하고 실험하였다.

  • PDF

그래프를 이용한 빈발 서비스 탐사 (Mining Frequent Service Patterns using Graph)

  • 황정희
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.471-477
    • /
    • 2018
  • 시간의 변화에 따라 사용자의 관심도는 변화한다. 이 논문에서는 유비쿼터스 환경에서 연령, 시기, 계절 등에 따라 변화하는 사용자의 서비스 관심도를 고려하기 위하여 서비스에 대한 관심도를 동적 가중치로 부여하여 사용자에게 적합한 서비스를 추천하기 위한 방법을 제안한다. 사용자에게 제공한 서비스 이력 데이터를 기준으로 시기나 연령에 따른 일반적인 서비스 규칙을 저장하고, 실시간으로 변화하는 서비스의 관심도를 고려한 최신의 서비스 규칙을 지속적으로 추가하여 사용자의 관심 변화를 반영하는 서비스를 제공하기 위한 방법이다. 이를 위해 사용자에게 제공하는 일련의 서비스는 트랜잭션으로 고려하고 서비스는 항목으로 고려하여 서비스의 연관관계를 그래프로 표현하고, 이를 기반으로 빈발 서비스 항목을 발견한다. 발견된 빈발 서비스 항목은 사용자에게 유용한 최신의 정보 서비스를 의미한다.

개인화 추천 시스템에서 FP-Tree를 이용한 연관 군집 방법 (Method of Associative Group Using FP-Tree in Personalized Recommendation System)

  • 조동주;임기욱;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권10호
    • /
    • pp.19-26
    • /
    • 2007
  • 협력적 필터링은 아이템에 대한 선호도를 기반으로 이웃 선정 방법을 사용하므로 내용을 반영하지 못할뿐만 아니라 희박성 및 확장성 문제를 가지고 있다. 이러한 문제를 개선하기 위하여 아이템 기반 협력적 필터링이 실용화되었으나 아이템의 속성을 반영하지는 못한다. 본 논문에서는 기존의 개인화 추천 시스템의 문제점을 해결하기 위하여 FP-Tree를 이용한 연관 군집 방법을 제안하였다. 제안된 방법으로는 FP-Tree를 이용하여 후보집합의 발생없이 빈발항목을 구성하고 연관규칙을 생성한다. 생성된 연관 규칙의 신뢰도에 따라서 $\alpha-cut$을 사용하여 효율적인 연관 군집을 한다. 성능평가를 위해 MovieLens 데이터 집합에서 Gibbs Sampling, EM, K-means와 비교 평가하였다.