• 제목/요약/키워드: item-based filtering

검색결과 147건 처리시간 0.029초

이미지 기반 필터링을 이용한 개인화 아이템 추천 (Personalized Item Recommendation using Image-based Filtering)

  • 정경용
    • 한국콘텐츠학회논문지
    • /
    • 제8권3호
    • /
    • pp.1-7
    • /
    • 2008
  • 유비쿼터스 컴퓨팅의 발달로 인하여 다양하고 폭넓은 정보가 디지털 형태로 빠르게 생산 및 배포되고 있다. 사용자가 이러한 정보과잉 속에서 자신이 원하는 정보를 단시간 내에 검색하는 것은 그리 쉬운 일이 아니다. 본 논문에서는 이미지 기반 필터링을 이용한 개인화 아이템 추천 기법을 제안한다. 피상적인 내용분석이라는 단점을 개선하기 위하여 사용자가 관심을 가지는 이미지 데이터로부터 특징을 추출하는 이미지 기반 필터링을 사용하였다. 제안한 방법에 대해 MovieLens 데이터에서 내용 기반 필터링과 협력적 필터링과의 비교 실험을 통해 성능을 평가하였다. 실험 결과, 제안한 방법이 기존의 다른 방법보다 우수함을 확인하였다.

A Robust Bayesian Probabilistic Matrix Factorization Model for Collaborative Filtering Recommender Systems Based on User Anomaly Rating Behavior Detection

  • Yu, Hongtao;Sun, Lijun;Zhang, Fuzhi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권9호
    • /
    • pp.4684-4705
    • /
    • 2019
  • Collaborative filtering recommender systems are vulnerable to shilling attacks in which malicious users may inject biased profiles to promote or demote a particular item being recommended. To tackle this problem, many robust collaborative recommendation methods have been presented. Unfortunately, the robustness of most methods is improved at the expense of prediction accuracy. In this paper, we construct a robust Bayesian probabilistic matrix factorization model for collaborative filtering recommender systems by incorporating the detection of user anomaly rating behaviors. We first detect the anomaly rating behaviors of users by the modified K-means algorithm and target item identification method to generate an indicator matrix of attack users. Then we incorporate the indicator matrix of attack users to construct a robust Bayesian probabilistic matrix factorization model and based on which a robust collaborative recommendation algorithm is devised. The experimental results on the MovieLens and Netflix datasets show that our model can significantly improve the robustness and recommendation accuracy compared with three baseline methods.

Privacy-Preserving Two-Party Collaborative Filtering on Overlapped Ratings

  • Memis, Burak;Yakut, Ibrahim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2948-2966
    • /
    • 2014
  • To promote recommendation services through prediction quality, some privacy-preserving collaborative filtering solutions are proposed to make e-commerce parties collaborate on partitioned data. It is almost probable that two parties hold ratings for the same users and items simultaneously; however, existing two-party privacy-preserving collaborative filtering solutions do not cover such overlaps. Since rating values and rated items are confidential, overlapping ratings make privacy-preservation more challenging. This study examines how to estimate predictions privately based on partitioned data with overlapped entries between two e-commerce companies. We consider both user-based and item-based collaborative filtering approaches and propose novel privacy-preserving collaborative filtering schemes in this sense. We also evaluate our schemes using real movie dataset, and the empirical outcomes show that the parties can promote collaborative services using our schemes.

개인화 추천 시스템에서 FP-Tree를 이용한 연관 군집 방법 (Method of Associative Group Using FP-Tree in Personalized Recommendation System)

  • 조동주;임기욱;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권10호
    • /
    • pp.19-26
    • /
    • 2007
  • 협력적 필터링은 아이템에 대한 선호도를 기반으로 이웃 선정 방법을 사용하므로 내용을 반영하지 못할뿐만 아니라 희박성 및 확장성 문제를 가지고 있다. 이러한 문제를 개선하기 위하여 아이템 기반 협력적 필터링이 실용화되었으나 아이템의 속성을 반영하지는 못한다. 본 논문에서는 기존의 개인화 추천 시스템의 문제점을 해결하기 위하여 FP-Tree를 이용한 연관 군집 방법을 제안하였다. 제안된 방법으로는 FP-Tree를 이용하여 후보집합의 발생없이 빈발항목을 구성하고 연관규칙을 생성한다. 생성된 연관 규칙의 신뢰도에 따라서 $\alpha-cut$을 사용하여 효율적인 연관 군집을 한다. 성능평가를 위해 MovieLens 데이터 집합에서 Gibbs Sampling, EM, K-means와 비교 평가하였다.

협업 필터링 기반 추천 알고리즘 연구 (Collaborative filtering-based recommendation algorithm research)

  • 이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.655-656
    • /
    • 2022
  • 추천 시스템을 위한 분석방법들 가운데 협업 필터링은 데이터 분석에 기반한 추천 시스템에서 주요 대표적 방법이다. 일반적 사용 방법은 다양한 아이템에 대해서 사용자들의 평가 데이터를 활용하여 공통적인 패턴을 찾으며, 특정 사용자에 대한 선호 아이템을 추천하는 기법이다. 이에 본 논문에서는 여러가지 알고리즘을 사용하여 지표 측정에 활용하였으며, 사용자 선호에 대한 예측에 적합한 알고리즘을 찾아서 제시하였다.

  • PDF

협업 필터링과 빈발 패턴을 이용한 개인화된 그룹 추천 (Personalized Group Recommendation Using Collaborative Filtering and Frequent Pattern)

  • 김정우;박광현
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.768-774
    • /
    • 2016
  • 본 논문에서는 개인화 서비스를 제공하기 위해 책, 음악, 영화 등과 같이 단일 항목을 추천하는 기존 방법의 한계를 극복하고, 패션, 요리 등과 같이 연관성에 따른 항목의 조합, 즉 그룹을 추천하는 방법을 다룬다. 협업 필터링은 사용자 간의 유사도를 측정하여 비슷한 성향의 사용자들이 선택한 항목을 추천하는 방법이며, 사용자의 성향을 예측할 수 있다는 장점이 있다. 본 논문에서는 이러한 협업 필터링과 연관 규칙을 바탕으로 빈발 항목 집합을 생성하고, 그룹 간의 유사도에 따라 그룹을 추천하는 알고리즘을 제안한다. 제안하는 방법의 타당성을 검증하기 위하여 의류 전자상거래에서 4개월 동안 소비자가 구매한 목록 데이터로 실험을 수행하였다.

협업 필터링 기반 상품 추천에서의 평가 횟수와 성능 (Number of Ratings and Performance in Collaborative Filtering-based Product Recommendation)

  • 이홍주;박성주;김종우
    • 한국경영과학회지
    • /
    • 제31권2호
    • /
    • pp.27-39
    • /
    • 2006
  • The Collaborative Filtering (CF) is one of the popular techniques for personalization in e-commerce storefronts. For CF-based recommendation, every customer needs to provide subjective evaluation ratings for some products based on his/her preference. Also, if an e-commerce site recommends a new product, some customers should rate it. However, there is no in-depth investigation on the impacts on recommendation performance of two number of ratings, i.e. the number of ratings of an individual customer and the number of ratings of an item, even though these are important factors to determine performance of CF methods. In this study, using publicly available EachMovie data set, we empirically investigate the relationships between the two number of ratings and the performance of CF. For the purpose, three analyses were executed. The first and second analyses were performed to investigate the relationship between the number of ratings of a particular customer and the recommendation performance of CF. In the third analysis, we investigate the relationship between the number of ratings on a particular item and the recommendation performance of CF. From these experiments, we can find that there are thresholds in terms of the number of ratings below which the recommendation performances increase monotonically. That is, the number of ratings of a customer and the number of ratings on an item are critical to the recommendation performance of CF when the number of ratings is less than the thresholds, but the value of the ratings decreases after the numbers of ratings pass the thresholds. The results of the experiments provide insight to making operational decisions concerning collaborative filtering in practice.

Addressing the New User Problem of Recommender Systems Based on Word Embedding Learning and Skip-gram Modelling

  • Shin, Su-Mi;Kim, Kyung-Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권7호
    • /
    • pp.9-16
    • /
    • 2016
  • Collaborative filtering(CF) uses the purchase or item rating history of other users, but does not need additional properties or attributes of users and items. Hence CF is known th be the most successful recommendation technology. But conventional CF approach has some significant weakness, such as the new user problem. In this paper, we propose a approach using word embedding with skip-gram for learning distributed item representations. In particular, we show that this approach can be used to capture precise item for solving the "new user problem." The proposed approach has been tested on the Movielens databases. We compare the performance of the user based CF, item based CF and our approach by observing the change of recommendation results according to the different number of item rating information. The experimental results shows the improvement in our approach in measuring the precision applied to new user problem situations.

사용자 정보 가중치를 이용한 추천 기법 (A Recommendation Technique using Weight of User Information)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.877-885
    • /
    • 2011
  • 협업 필터링은 추천시스템들 중에서 가장 널리 사용되는 기법이다. 그러나 협업 필터링은 추천의 정확성을 떨어뜨리는 희소성과 확장성 문제를 가지고 있으며 이를 해결하기 위한 다양한 연구가 이루어지고 있다. 본 논문에서는 협업필터링의 희소성과 확장성의 문제를 해결하기 위해 가중치를 사용한 기법을 제안한다. 제안한 기법은 데이터 셋에서 추천의 정확성을 높이기 위해 평가값이 4이상인 데이터들만을 사용하여 아이템을 선호하는 사용자 정보를 분석한다. 아이템의 장르 정보와 분석한 사용자 정보를 유사도 계산 시 가중치로 사용하고 임계값 이상의 유사도를 가진 데이터들만으로 예측값을 계산하여 평가되지 않은 데이터의 평가값으로 사용한다. 제안한 기법은 아이템에 대한 특성을 분석하여 예측값을 계산함으로써 희소성을 줄임과 동시에 정확성을 더 높일 수 있고 새로운 아이템과 사용자가 등록되었을 때 분석된 정보를 바탕으로 빠른 분류가 가능하다. 실험을 통해 제안한 기법이 기존의 아이템 기반, 장르 기반 기법보다 추천의 정확성이 향상되는 것을 확인하였다.

A Hybrid Recommendation System based on Fuzzy C-Means Clustering and Supervised Learning

  • Duan, Li;Wang, Weiping;Han, Baijing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권7호
    • /
    • pp.2399-2413
    • /
    • 2021
  • A recommendation system is an information filter tool, which uses the ratings and reviews of users to generate a personalized recommendation service for users. However, the cold-start problem of users and items is still a major research hotspot on service recommendations. To address this challenge, this paper proposes a high-efficient hybrid recommendation system based on Fuzzy C-Means (FCM) clustering and supervised learning models. The proposed recommendation method includes two aspects: on the one hand, FCM clustering technique has been applied to the item-based collaborative filtering framework to solve the cold start problem; on the other hand, the content information is integrated into the collaborative filtering. The algorithm constructs the user and item membership degree feature vector, and adopts the data representation form of the scoring matrix to the supervised learning algorithm, as well as by combining the subjective membership degree feature vector and the objective membership degree feature vector in a linear combination, the prediction accuracy is significantly improved on the public datasets with different sparsity. The efficiency of the proposed system is illustrated by conducting several experiments on MovieLens dataset.