• Title/Summary/Keyword: Association Rules Mining

Search Result 307, Processing Time 0.027 seconds

The Product Recommender System Combining Association Rules and Classification Models: The Case of G Internet Shopping Mall (연관규칙기법과 분류모형을 결합한 상품 추천 시스템: G 인터넷 쇼핑몰의 사례)

  • Ahn, Hyun-Chul;Han, In-Goo;Kim, Kyoung-Jae
    • Information Systems Review
    • /
    • v.8 no.1
    • /
    • pp.181-201
    • /
    • 2006
  • As the Internet spreads, many people have interests in e-CRM and product recommender systems, one of e-CRM applications. Among various approaches for recommendation, collaborative filtering and content-based approaches have been investigated and applied widely. Despite their popularity, traditional recommendation approaches have some limitations. They require at least one purchase transaction per user. In addition, they don't utilize much information such as demographic and specific personal profile information. This study suggests new hybrid recommendation model using two data mining techniques, association rule and classification, as well as intelligent agent to overcome these limitations. To validate the usefulness of the model, it was applied to the real case and the prototype web site was developed. We assessed the usefulness of the suggested recommendation model through online survey. The result of the survey showed that the information of the recommendation was generally useful to the survey participants.

Research of Knowledge Management and Reusability in Streaming Big Data with Privacy Policy through Actionable Analytics (스트리밍 빅데이터의 프라이버시 보호 동반 실용적 분석을 통한 지식 활용과 재사용 연구)

  • Paik, Juryon;Lee, Youngsook
    • Journal of Korea Society of Digital Industry and Information Management
    • /
    • v.12 no.3
    • /
    • pp.1-9
    • /
    • 2016
  • The current meaning of "Big Data" refers to all the techniques for value eduction and actionable analytics as well management tools. Particularly, with the advances of wireless sensor networks, they yield diverse patterns of digital records. The records are mostly semi-structured and unstructured data which are usually beyond of capabilities of the management tools. Such data are rapidly growing due to their complex data structures. The complex type effectively supports data exchangeability and heterogeneity and that is the main reason their volumes are getting bigger in the sensor networks. However, there are many errors and problems in applications because the managing solutions for the complex data model are rarely presented in current big data environments. To solve such problems and show our differentiation, we aim to provide the solution of actionable analytics and semantic reusability in the sensor web based streaming big data with new data structure, and to empower the competitiveness.

A Large-Interval Itemsets Generation Method for Mining Quantitative Association Rules (수량 연관규칙 탐사를 위한 빈발구간 항목집합 생성방법)

  • 박원환;박두순;유기형;손진곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.402-407
    • /
    • 2001
  • 대용량의 데이터베이스로부터 연관규칙을 발견하고자 하는 연구가 활발하며, 수량 데이터의 항복에도 적용할 수 있도록 이들 방법을 확장하는 연구가 최근에 소개되고 있다. 본 논문에서는 수량 데이터 항목을 이진 항목으로 변환하기 위하여 빈발구간 항목집합을 생성할 때, 수량 데이터 항목의 정의 영역 내에서 특정 영역에 집중하여 발생하는 특성인 지역성을 이용하는 방법을 제안한다. 이 방법은 기존의 방법보다 많은 수의 세밀한 빈발구간 항목들을 생성할 수 있을 뿐만 아니라 세밀의 정도를 판단하여 활용할 수 있는 생성순서 정보도 포함하고 있어, 원 데이터가 가지고 있는 특성의 손실을 최소화한 수 있는 특징이 있다. 성능평가를 통하여 기존의 방법보다 우수함을 보였다.

  • PDF

An Efficient Algorithm for Mining Association Rules using a Compound Hash Tree (복합 해쉬트리를 이용한 효율적인 연관규칙 탐사 알고리즘)

  • Lee, Jae-Mun;Park, Jong-Su
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.3
    • /
    • pp.343-352
    • /
    • 1999
  • 본 논문에서는 대용량 데이터베이스에서 효율적인 연관 규칙 탐사에 대한 알고리즘을 제안하였다. 제안하는 알고리즘은 복합 해쉬 트리를 사용하여 해쉬 트리 탐색 비용과 데이터베이스 스캔 비용을 동시에 줄임으로서 성능을 향상시켰다. 복합 해쉬 트리는 같은 크기의 항목집합들 대신에 크기가 다른 여러 항목집합을 하나의 해쉬 트리로 구성한다. 복합 해쉬 트리의 유용성을 보이기 위하여 제안한 알고리즘은 잘 알려져 있는 Apriori, DHP 방밥과 수행 시간 측면에서 성능 비교를 하였다. 그 결과 대부분의 최소 지지도에서제안한 알고리즘이 Apriori, DHP 방법보다 우수하게 나타났으며, 최소 지지도가 0.5% 이하인 경우 DHP 방법에 비하여 약 30%의 이득 향상이 있었다.

Design of the web data mining system and definition of useful access patterns (웹 마이닝 시스템 설계 및 유용한 접근 패턴 정의)

  • 김종달;김성민;남도원;이동하;이전영
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.283-291
    • /
    • 2000
  • 인터넷 서비스 제공자들이 관심을 가지고 있는 것 중 하나는 인터넷 사용자들의 서비스 이용 패턴과 경향을 분석하는 것이다. 이를 통해 매출 증대와 실제 경영에 도움이 되는 사용자의 특성을 이해할 수 있기 때문이다. 이와 관련된 기본적인 접근방법은 사용자가 웹 서버에 접근했을 때 서버에 남는 웹 로그를 분석하여 사용자 패턴을 분석하는 것이다. 웹 로그 분석에 전형저인 통계기법이 사용되고 있다. 그러나 단순 통계 기법만으로는 알려지지 않는 데이터들 사이에 숨겨진 유용한 정보를 찾는 데에는 한계가 있다. 최근에는 이러한 한계를 극복하기 위해 데이터 마이닝 기술을 이용한 새로운 접근 방법이 시도되고 있다. 그러나 실제로 웹 로그에서부터 데이터 마이닝 기술을 이용하는 데에는 전처리 과정의 어려움과 실제 유용한 패턴을 어떻게 정의하는 가가 어려운 문제이다. 본 연구에서는 로(raw) 데이터인 웹 로그에서 유용한 패턴을 찾기 위한 전처리 과정을 알아보고, 웹 마이닝 시스템에 적합한 트랜잭션의 데이터 구조를 제시한다. 그리고 정의된 데이터 구조를 통한 패턴 발견 과정인 웹 사이트의 개념계층을 이용한 통계 기법과 연관규칙(Association Rules) 탐사에 대해 알아본다. 마지막으로 정의된 데이터 구조를 통한 새로운 유용한 패턴을 정의한ㄷ.

  • PDF

Mining the Change of Customer Buying Behavior for Collaborative Recommendations

  • Cho, Yeong-Bin;Cho, Yoon-Ho;Kim, Soung-Hie
    • Proceedings of the CALSEC Conference
    • /
    • 2004.02a
    • /
    • pp.239-250
    • /
    • 2004
  • The preference of customers change as time goes by. The existing Collaborative Filtering (CF) techniques has no room for including this change yet, although these techniques have been known to be the most successful recommendation technique that has been used in a number of different applications. In this study, we proposed a new methodology for enhancing the quality of recommendation using the customers' dynamic behaviors over time. The proposed methodology is applied to a large department store in Korea, compared to existing CF techniques. Some experiments on the real world data show that the proposed methodology provides higher quality recommendations than other CF techniques, especially better performance on heavy users.

  • PDF

Mining Association Rules with Time Intervals (연관 규칙과 시간 간격을 함께 탐색하는 알고리즘)

  • Shin, YoonJae;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.559-561
    • /
    • 2016
  • 로그 테이터 속에서 시간차를 두고 발생하는 트랜잭션 혹은 이벤트를 감지하는 일은 유통, 마케팅, 금융 등 다양한 분야에서 활용될 수 있다. 데이터베이스 분야에서 반복되는 패턴을 감지하는 알고리즘은 종종 소개되었지만, 데이터의 특성과 트랜잭션 간의 시간 간격을 고려한 연관 규칙 탐색 알고리즘 연구는 빈약했다. 본 논문에서는 정해진 구간에서 반복되는 패턴을 찾거나 주어진 아이템에 대한 주기를 찾는 등의 기존연구와 달리 전체 데이터베이스를 스캔하여 찾을 수 있는 연관 규칙과 그 연관 규칙이 반복되는 시간 간격을 함께 탐색하는 알고리즘을 제안한다. 또한, 제안하는 알고리즘의 처리시간에 대한 실험을 통해 성능을 확인한다.

An Incremental Mining Technique for Maintenance for Temporal Association Rules (시간 연관규칙의 유지를 위한 점진적인 마이닝 기법)

  • 백옥현;이준욱;김영균;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.178-180
    • /
    • 2001
  • 실세계의 여러 응용에서 데이터베이스의 크기는 계속적으로 증가되어 왔으며, 이러한 데이터베이스 내에서 유용한 지식을 찾아내기 위한 다양한 연구가 진행되어 왔다. 데이터베이스는 시간이 흐름에 따라 동적으로 변환된다. 현재의 연구는 이러한 데이터베이스에서 효과적으로 규칙을 발견하는데 초점이 모아지고 있다. 그러나, 이런 변화에 따라서 기존에 발견되었던 규칙들은 더 이상 유효하지 않을 수 있기 때문에 이전에 발견되었던 규칙들은 유효한지 검증되어야 한다. 데이터베이스가 증가할 때마다 전체를 다시 탐색해서 규칙을 찾는 것은 효과적인 방법이 아니므로, 점진적으로 규칙을 유지할 수 있는 알고리즘이 필요하다. 이 논문에서는 이전에 발견되었던 규칙이 물리적으로 저장되었고 그 후에 데이터베이스가 업데이트된 것을 고려하여 규칙, 특히 시간 연관규칙을 점진적으로 유지할 수 있는 기법을 제시한다.

  • PDF

Processing Multi-Valued Attributes in Association Rules for Data Mining (데이터 마이닝을 위한 연관규칙의 다중 값 속성 처리방법)

  • 김산성;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.340-342
    • /
    • 2002
  • 다중 값이란 속성 값이 집합인 것을 말한다. 즉, 관계형 데이터베이스에서 자료 유형이 집합인 속성을 의미한다. 이러한 다중 값 속성 처리는 기존 데이터마이닝 기술 자체로는 처리한 수 없으며 후처리나 선처리 과정을 이용하여 처리하고 있다. 전처리나 후처리 과정을 통해 처리할 경우 수행과장에 있어 많은 시간이 소요되고 혹은 타당하지 않은 규칙이 생성되는 문제점을 가지고 있다. 특히 연관화 기법 특성상 분석하고자 할 항목이 증가할수록 연관성의 수가 지수(exponential)단위이기 때문에 이를 해결하는데는 상당한 어려움이 따르게 된다. 본 논문에서는 관계형 데이터베이스 테이블 구조에서 데이터 마이닝의 수행을 위한 전처리나 후처리의 과정을 고려하지 않음으로 위에서 언급된 문제점들을 해결하고자 한다. 특히 데이터 변환 작업 없이 정량적(Quantitative)연관 규칙과 연관 규칙(Market Basket Analysis)의 혼합 형태의 규칙을 생성할 수 있게끔 알고리즘을 확장하여 보다 효율적인 규칙이 생성될 수 있도록 한다. 마지막으로 Each Movie 데이터를 사용하여 확장한 알고리즘의 다중 값 속성 처리 방법의 효율성과 타탕성을 검증한다.

  • PDF

Association Rules Mining of Image Data using Spatial Factor (공간 분할 지수를 이용한 이미지 데이터 연관 규칙 마이닝)

  • Song ImYoung;Kim K.C.;Suk S.K.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.82-84
    • /
    • 2005
  • 본 논문에서는 기존의 멀티미디어 연관 규칙 알고리즘인 Max occur 알고리즘에서 추출한 빈발 항목 집합의 결과들에 대하여 빈발 항목 집합들끼리의 공간적인 연관 관계를 고려하기 위챈 공간 데이터 마이닝의 대표적인 공간 분할 방법인 그리드 셀 기반으로 곰간 분할 지수(spatial facotr)인 SF를 이용한 이미지 공간 연관 규칙 마이닝 방법을 제시한다. 또한 최소 공간 지지도를 적용하여 이미지 데이터에서 반복적으로 발생하는 항목과 항목간의 공간 관계를 통해 이미지 연관 규칙을 마이닝 하는데 보다 유효한 알고리즘을 제안한다.

  • PDF