• Title/Summary/Keyword: 연관 규칙 마이닝

Search Result 286, Processing Time 0.028 seconds

Effective Association Rule Method for Personalized Recommender System (개인화 추천시스템을 위한 효율적 연관 규칙 방법)

  • Ko, Byoung-Jin;Yu, Young-Hoon;Jo, Ceun-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2133-2136
    • /
    • 2002
  • 인터넷 특성상 방대한 양의 정보와 상품 등으로 사용자들이 원하는 정보를 찾기 위해서 많은 시간을 낭비하고 있는 실정이다. 이러한 사용자의 시간 소모를 중이기 위해서 추천 시스템이 개발되었다. 현재 인터넷 상의 추천 기술 중에서 가장 많이 사용하는 기법으로는 협력적 여과(Collaborative filtering) 방법이다. 그러나, 협력적 추천 방법으로 추천 받기 위해서는 특정수 이상의 아이템에 대한 평가가 필요하며, 또한 비슷한 성향을 가지는 일부 사용자 정보에 근거하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 이러한 문제점이 발생되므로 최근에는 데이터 마이닝(Data Mining) 기법 중 연관 규칙(Association Rule)을 이용한 추천 시스템이 개발되고 있다[1,10]. 그러나, 연관 규칙 기법은 개인별 사용자의 성향을 반영하지 못하는 단점이 있다[4]. 연관 규칙은 단지 대용량 데이터 베이스에서 아이템간의 지지도(Support)와 신뢰도(Confidence)에 근거하여 규칙을 발견하는 특징을 가지고 있기 때문이다. 즉 개인성향을 무시하고 아이템간의 연관성만을 근거로 하여 아이템을 추천하기 때문이다. 본 논문에서는 효율적인 연관 규칙을 이용한 개인화 추천 시스템을 구현하기 위해서 연관 규칙과 여과 방법을 통합한 시스템을 제안한다. 본 시스템에 대하여 성능 비교 실험을 수행함으로써 제안한 방법의 타당성을 제시한다.

  • PDF

A Measure for Improvement in Quality of Association Rules in the Item Response Dataset (문항 응답 데이터에서 문항간 연관규칙의 질적 향상을 위한 도구 개발)

  • Kwak, Eun-Young;Kim, Hyeoncheol
    • The Journal of Korean Association of Computer Education
    • /
    • v.10 no.3
    • /
    • pp.1-8
    • /
    • 2007
  • In this paper, we introduce a new measure called surprisal that estimates the informativeness of transactional instances and attributes in the item response dataset and improve the quality of association rules. In order to this, we set artificial dataset and eliminate noisy and uninformative data using the surprisal first, and then generate association rules between items. And we compare the association rules from the dataset after surprisal-based pruning with support-based pruning and original dataset unpruned. Experimental result that the surprisal-based pruning improves quality of association rules in question item response datasets significantly.

  • PDF

Weighted association rules considering item RFM scores (항목 알에프엠 점수를 고려한 가중 연관성 규칙)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.6
    • /
    • pp.1147-1154
    • /
    • 2010
  • One of the important goals in data mining is to discover and decide the relationships between different variables. Association rules are required for this technique and it find meaningful rules by quantifying the relationship between two items based on association measures such as support, confidence, and lift. In this paper, we presented the evaluation criteria of weighted association rule considering item RFM scores as importance of items. Original RFM technique has been used most widely applied method using customer information to find the most profitable customers. And then we compared general association rule technique with weighted association rule technique through the simulation data.

Prediction of Yeast Protein-Protein Interactions by Neural Feature Association Rule (Neural Feature Association Rule을 이용한 효모 단백질-단백질 상호작용의 예측)

  • Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.277-279
    • /
    • 2005
  • 단백질들은 서로 다른 단백질들과 상호작용하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질들 간의 상호작용 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이터가 산출된 후게놈시대(post-genomic era)에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터들에서 속성들 간의 연관규칙 학습을 통해 잠재적 단백질 상호작용들을 예측하기 위한 연관규칙 기반의 상호작용 예측 방법을 제시한다. 단백질들 간의 상호작용 예측을 위해 고려되는 각 단백질의 다수의 속성차원은 정보이론 기반의 속성선택 알고리즘을 이용하여 효율적으로 줄이며 상호작용의 속성집합을 이용하여 신경망을 훈련시키고 이렇게 훈련된 신경망에서 속성들 간의 연관규칙을 디코딩하여 연관규칙 기반의 상호작용 예측에 활용한다. 연관속성 발굴을 통한 상호작용 예측을 위한 마이닝 방법으로는 연관규칙 발견 알고리즘을 사용하였으며 예측 정확도를 높이기 위하여 신경망 예측 모델의 학습 결과를 디코딩한 규칙들이 추가적으로 사용하였다. 논문에서 제안한 방법을 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 평균 약 $94.5\%$의 예측 정확도를 보였다.

  • PDF

An In-depth Analysis on Soccer Game via Webcast and Association Rule Mining (웹 캐스트와 연관규칙 마이닝을 이용한 축구 경기의 심층 분석)

  • Jung, Ho-Seok;Lee, Jong-Uk;Yu, Jae-Hak;Park, Dai-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.17-20
    • /
    • 2011
  • 축구 비디오를 분석하고 이를 팀 전략 수립에 활용하는 축구 비디오 분석관의 역할이 강조됨에 따라, 축구 비디오에서 주요 이벤트의 탐지와 같은 절차적 기능에서 부터 고수준의 해석 방법에 이르는 다양한 기능들이 요구된다. 본 논문에서는 축구 웹 캐스트에서 실시간으로 제공하는 텍스트 정보를 기반으로 메타데이터 키워드 매칭을 통하여 축구 경기의 다양한 속성들을 추출하고 텍스트 마이닝의 대표적 해석 기법인 연관규칙 마이닝을 사용함으로써 축구 경기의 전략 수립이 가능한 고수준의 해석 방법을 소개한다. 실제 2010년 월드컵의 스페인 경기를 중계한 웹 캐스트의 텍스트 정보를 대상으로 제안된 방법론의 타당성을 검증한다.

Dynamic Load Balancing Algorithm for Parallel Association Rule Mining (병렬 연관 규칙 마이닝을 위한 동적 부하 분산 알고리즘)

  • Kim, Min-Ho;Kim, Gye-Hyung;Ramakrishna, R.S.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.377-380
    • /
    • 2002
  • 본 논문에서는 대표적인 데이터 마이닝 기법 중 하나인 연관 규칙 마이닝에 대해 PC 성능의 급속한 발전으로 인한 PC 클러스터 시스템의 이종화의 필연성을 효과적으로 대처할 수 있는 부하 분산 알고리즘을 제안한다. 제안한 부하 분산 기법은 실행 전 성능을 미리 측정할 필요가 없이 실행 중에 성능을 측정할 수 있는 동적 부하 분산 알고리즘으로써 노드들 사이에 성능 정보의 교환 비용밖에 요구되지 않는다. 실험 결과는 제안한 알고리즘이 이종의 클러스터 시스템의 효율성을 극대화함을 보여준다. 또한 본 논문에서는 부하 분산 알고리즘의 성능을 분석할 수 있는 방법을 제시한다.

  • PDF

RFM based Incremental Frequent Patterns mining Method for Recommendation in e-Commerce (전자상거래 추천을 위한 RFM기반의 점진적 빈발 패턴 마이닝 기법)

  • Cho, Young Sung;Moon, Song Chul;Ryu, Keun Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.135-137
    • /
    • 2012
  • A existing recommedation system using association rules has the problem, which is suffered from inefficiency by reprocessing of the data which have already been processed in the incremental data environment in which new data are added persistently. We propose the recommendation technique using incremental frequent pattern mining based on RFM in e-commerce. The proposed can extract frequent items and create association rules using frequent patterns mining rapidly when new data are added persistently.

  • PDF

An Efficient Algorithm for Mining Association Rules using a Binary Representation (이진 표현을 이용한 효율적인 연관 규칙 탐사 알고리즘)

  • Won-Young Kim;Won-Gil Choi;Ung-Mo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.375-378
    • /
    • 2008
  • 오늘날 지식을 기반으로 하는 고도의 정보사회로 나아가는 시점에서 우리는 대량의 데이터 속에서 필요한 지식을 찾아내는 것에 초점을 모으게 되었다. 따라서 대량의 데이터 속에서 필요한 지식을 자동으로 찾아내는 데이터 마이닝에 대한 연구가 활발히 진행되고 있다. 데이터 마이닝은 대용량의 데이터를 대상으로 하기 때문에 정확도뿐만이 아니라 소요시간도 중요하기 때문에 성능 향상을 위한 알고리즘들이 많이 개발되었다. 데이터 마이닝의 성능을 향상시키기 위해서 가장 좋은 방법이 데이터베이스의 스캔의 횟수를 줄이는 것이다. 본 논문에서는 연관 규칙 탐사에서 빈발 항목 집합을 찾아내는 부분을 이진 표현을 이용하여 좀 더 성능을 향상시킬 수 있는 알고리즘을 제안한다.

Analysis of Internet User Features using Multi-dimensional Association Analysis (다차원 연관 분석을 이용한 인터넷 이용자의 특징 분석)

  • Lee, Su-Eun;Jung, Yong-Gyu
    • Journal of Service Research and Studies
    • /
    • v.1 no.1
    • /
    • pp.61-69
    • /
    • 2011
  • Data mining that can not be extracted with a simple query in the form of "useful" means to find information in large databases from the existing and unknown knowledge. It is based on this insight about the data can be defined as a gain. In this paper, we use the Internet to find useful patterns on the Web or saved data to the target Web site, which is to analyze the characteristics of users. A general statistical information on Internet users to the data by applying a relevance analysis, Internet use affect the amount of time to analyze the characteristics of Internet users. Only through experiments extracting data from the association rules, producing optimal results apply for the data pre-processing and algorithm for mining the Web to Internet users. characteristics were analyzed.

  • PDF

Personalized Recommendation System using FP-tree Mining based on RFM (RFM기반 FP-tree 마이닝을 이용한 개인화 추천시스템)

  • Cho, Young-Sung;Ho, Ryu-Keun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.2
    • /
    • pp.197-206
    • /
    • 2012
  • A exisiting recommedation system using association rules has the problem, such as delay of processing speed from a cause of frequent scanning a large data, scalability and accuracy as well. In this paper, using a Implicit method which is not used user's profile for rating, we propose the personalized recommendation system which is a new method using the FP-tree mining based on RFM. It is necessary for us to keep the analysis of RFM method and FP-tree mining to be able to reflect attributes of customers and items based on the whole customers' data and purchased data in order to find the items with high purchasability. The proposed makes frequent items and creates association rule by using the FP-tree mining based on RFM without occurrence of candidate set. We can recommend the items with efficiency, are used to generate the recommendable item according to the basic threshold for association rules with support, confidence and lift. To estimate the performance, the proposed system is compared with existing system. As a result, it can be improved and evaluated according to the criteria of logicality through the experiment with dataset, collected in a cosmetic internet shopping mall.