• 제목/요약/키워드: MovieLens

검색결과 74건 처리시간 0.024초

영화 데이터를 위한 쌍별 규합 접근방식의 군집화 기법 (Pairwise fusion approach to cluster analysis with applications to movie data)

  • 김희진;박세영
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.265-283
    • /
    • 2022
  • 사용자들의 영화정보를 기록한 MovieLens 데이터는 추천 시스템 연구에서 아이디어를 탐색하고 검증하는데 상당한 가치가 있는 데이터로, 기존 데이터 분할 및 군집화 알고리즘을 사용하여 사용자 평점 데이터를 기반으로 항목 집합을 분할하는 연구 등에 사용되는 데이터이다. 본 논문에서는 기존 연구에서 대표적으로 사용되었던 영화 평점 데이터와 영화 장르 데이터를 통해 사용자의 장르 선호도를 예측하여 선호도 패턴을 기반으로 사용자를 군집화(clustering)하고, 유의미한 정보를 얻는 연구를 진행하였다. MovieLens 데이터는 영화의 전체 개수에 비해 사용자별 평균 영화 평점 수가 낮아 결측 비율이 높다. 이러한 이유로 기존의 군집화 방법을 적용하는 데 한계가 존재한다. 본 논문에서는 MovieLens 데이터 특성에 모티브를 얻어 쌍별 규합 벌점함수(pairwise fused penalty)를 활용한 볼록 군집화(convex clustering) 기반의 방법을 제안한다. 특히 결측치 대체(missing imputation)도 동시에 해결하는 최적화 문제를 통해 기존의 군집화 분석과 차별화하였다. 군집화는 반복 알고리즘인 ADMM을 통해 제안하는 최적화 문제를 풀어 진행한다. 또한 시뮬레이션과 MovieLens 데이터 적용을 통해 제안하는 군집화 방법이 기존의 방법보다 노이즈 및 이상치에 상대적으로 민감하지 않은 것으로 보인다.

커널 함수를 도입한 새로운 추천 시스템 (A New Kernelized Approach to Recommender System)

  • 이제헌;황재필;김은태
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.624-629
    • /
    • 2011
  • 본 논문에서는 커널 함수를 이용한 기법을 통한 추천 시스템을 제안한다. 제안된 추천 시스템은 기계 학습 기법을 이용하여 새로운 아이템에 대한 사용자의 선호도를 예측하고 예측된 결과를 바탕으로 사용자가 선호할만한 아이템들을 추천한다. 일반적으로 사용자의 평가 정보는 잡음이 포함되어 있고 일관성이 적으므로 잡음에 영향을 적게 받는 이원 분류기인 이중 마진 Lagrangian support vector machine (DMLSVM) 을 사용한다. 제안된 기법은 MovieLens 데이터베이스에 적용하였다. 또한 시뮬레이션을 통해 제안된 방법의 우수성을 확인하였다.

MEC 기반 비디오 캐시 시나리오를 위한 시계열 사용자 요청 패턴 데이터 세트 분석 (Analysis of time-series user request pattern dataset for MEC-based video caching scenario)

  • 왈리드 아크바르;아팍 모하마드;송왕철
    • KNOM Review
    • /
    • 제24권1호
    • /
    • pp.20-28
    • /
    • 2021
  • 소셜 미디어 애플리케이션 및 모바일 장치의 광범위한 사용으로 인해 데이터 트래픽이 지속해서 증가하고 있다. 소셜 미디어 애플리케이션은 끝없이 많은 양의 멀티미디어 트래픽, 특히 비디오 트래픽을 생성하고 있다. YouTube, Daily Motion 및 Netflix와 같은 많은 소셜 미디어 플랫폼이 생성하는 것이다. 이러한 플랫폼에서는 다른 비디오와 비교하여 몇 개의 인기 비디오가 여러 번 요청된다. 이러한 인기 있는 비디오는 지속적인 사용자 요구 사항을 충족하기 위해 사용자 주변에 캐시해야 한다. MEC는 일관된 사용자 요구와 사용자 근접 캐시를 위한 필수 패러다임으로 부상했다. 시간에 따라 사용자 요구 패턴이 어떻게 달라지는지를 이해하는 것이 과제이다. 본 논문은 공개 데이터셋인 MovieLens 20M, MovieLens 100K, The Movies Dataset 3개를 분석하여 시간에 따른 사용자 요청 패턴을 찾는다. 모든 데이터셋의 시간별, 일별, 월별 및 연간 추세를 확인할 수 있다. MEC 기반 비디오 캐시 시나리오에서 사용자 요청 패턴을 분석 및 생성함으로써, 많은 연구에서 사용될 수 있을 것이다.

개인성향과 협업 필터링을 이용한 개선된 영화 추천 시스템 (Improved Movie Recommendation System based-on Personal Propensity and Collaborative Filtering)

  • 박두순
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권11호
    • /
    • pp.475-482
    • /
    • 2013
  • 추천 시스템들에 대한 여러 방법들이 연구되고 있다. 개인화와 추천 시스템 중에서 가장 성공적인 방법은 협업 필터링이다. 협업 필터링은 고객들의 프로파일 정보를 기반으로 추천을 하므로 데이터가 충분하지 않다면 항목을 추천하는데 있어서 희박성의 문제가 제기된다. 본 연구에서는 희박성의 문제를 해결하는 방법으로 가중치를 가진 개인 성향을 협업 필터링에 활용하는 방법을 제안한다. 본 연구에서 가중치를 가진 최적의 개인 성향을 찾기 위해 공개 데이터인 MovieLens Data를 이용하여 성능 평가하였다. 실험 결과 본 연구에서 제안한 가중치를 가진 개인 성향들로 구축된 시스템이 기존의 개인 성향들을 이용한 시스템보다 향상된 성능을 보였다.

장르유사도와 선호장르를 이용한 협업필터링 설계 (Collaborative Filtering Design Using Genre Similarity and Preffered Genre)

  • 김경록;변재희;문남미
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.159-168
    • /
    • 2011
  • 전자상거래와 소셜미디어 서비스의 활성화에 따라, 집단지성을 개인 맞춤 서비스에 활용하는 추천시스템에 관한 연구가 활발히 진행되고 있다. 또한, 스마트폰의 발달과 모바일 환경의 발달에 따라 단말의 제약성에도 불구하고 개인화 서비스에 대한 연구가 가속화되고 있다. 대표적인 예로 위치기반 서비스와의 결합이다. 이에 본 연구에서는 영화의 장르유사도와 선호장르를 이용한 추천시스템을 제안한다. 영화 장르 유사도 프로파일을 생성하여 이를 모바일실험 환경에서 서비스 될 수 있도록 설계하고 프로토 타이핑 한 후에 MovieLens 데이터를 적용하여 평가한다.

Bayesian Approach to Users' Perspective on Movie Genres

  • Lenskiy, Artem A.;Makita, Eric
    • Journal of information and communication convergence engineering
    • /
    • 제15권1호
    • /
    • pp.43-48
    • /
    • 2017
  • Movie ratings are crucial for recommendation engines that track the behavior of all users and utilize the information to suggest items the users might like. It is intuitively appealing that information about the viewing preferences in terms of movie genres is sufficient for predicting a genre of an unlabeled movie. In order to predict movie genres, we treat ratings as a feature vector, apply a Bernoulli event model to estimate the likelihood of a movie being assigned a certain genre, and evaluate the posterior probability of the genre of a given movie by using the Bayes rule. The goal of the proposed technique is to efficiently use movie ratings for the task of predicting movie genres. In our approach, we attempted to answer the question: "Given the set of users who watched a movie, is it possible to predict the genre of a movie on the basis of its ratings?" The simulation results with MovieLens 1M data demonstrated the efficiency and accuracy of the proposed technique, achieving an 83.8% prediction rate for exact prediction and 84.8% when including correlated genres.

Movie Popularity Classification Based on Support Vector Machine Combined with Social Network Analysis

  • Dorjmaa, Tserendulam;Shin, Taeksoo
    • 한국IT서비스학회지
    • /
    • 제16권3호
    • /
    • pp.167-183
    • /
    • 2017
  • The rapid growth of information technology and mobile service platforms, i.e., internet, google, and facebook, etc. has led the abundance of data. Due to this environment, the world is now facing a revolution in the process that data is searched, collected, stored, and shared. Abundance of data gives us several opportunities to knowledge discovery and data mining techniques. In recent years, data mining methods as a solution to discovery and extraction of available knowledge in database has been more popular in e-commerce service fields such as, in particular, movie recommendation. However, most of the classification approaches for predicting the movie popularity have used only several types of information of the movie such as actor, director, rating score, language and countries etc. In this study, we propose a classification-based support vector machine (SVM) model for predicting the movie popularity based on movie's genre data and social network data. Social network analysis (SNA) is used for improving the classification accuracy. This study builds the movies' network (one mode network) based on initial data which is a two mode network as user-to-movie network. For the proposed method we computed degree centrality, betweenness centrality, closeness centrality, and eigenvector centrality as centrality measures in movie's network. Those four centrality values and movies' genre data were used to classify the movie popularity in this study. The logistic regression, neural network, $na{\ddot{i}}ve$ Bayes classifier, and decision tree as benchmarking models for movie popularity classification were also used for comparison with the performance of our proposed model. To assess the classifier's performance accuracy this study used MovieLens data as an open database. Our empirical results indicate that our proposed model with movie's genre and centrality data has by approximately 0% higher accuracy than other classification models with only movie's genre data. The implications of our results show that our proposed model can be used for improving movie popularity classification accuracy.

무비렌즈 데이터를 이용한 하이브리드 추천 시스템에 대한 실증 연구 (An Empirical Study on Hybrid Recommendation System Using Movie Lens Data)

  • 김동욱;김성근;강주영
    • 한국빅데이터학회지
    • /
    • 제2권1호
    • /
    • pp.41-48
    • /
    • 2017
  • 최근 추천 시스템의 인기와 함께 추천 시스템의 알고리즘의 성능에 대한 평가가 중요해 졌다. 본 연구는 영화 데이터에서 다양한 알고리즘 중 어떤 알고리즘의 효과적인지 판단하기 위하여 모델링과 RMSE를 통한 모델 검증을 하였다. 본 연구의 데이터는 무비렌즈의 평가 데이터 10만건을 활용하여 피어슨 상관계수를 활용한 사용자 기반 협업 필터링, 코사인 상관계수를 활용한 아이템 기반 협업 필터링 그리고 특이 값분해를 활용한 아이템 기반 협업 필터링 모델을 만들었다. 세가지 추천 모델로 평점을 예측한 결과 사용자 기반 협업 필터링보다 아이템 기반 협업 필터링의 정확도가 월등히 높은 것을 확인했고, 행렬 분해를 사용했을 때 더 정확한 추천을 할 수 있었다.

  • PDF

클러스터링 기반 협업 필터링 알고리즘을 사용한 분산 추천 시스템 (Distributed Recommendation System Using Clustering-based Collaborative Filtering Algorithm)

  • 조현제;이필규
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.101-107
    • /
    • 2014
  • 본 논문에서는 협업 필터링 알고리즘을 클러스터링 기반으로 분산 환경에서 구현하여, 추천을 위한 수행 시간을 최적화 하는 방법에 대한 제안을 한다. 하둡 기반으로 시스템을 구성하였고, 분산 Min-hash 클러스터링 기반의 협업 필터링 방법을 제안하고, 이를 기반으로 분산 추천 시스템을 구성하였다. 분산 사용자 기반 협업 필터링 기법을 사용하여 무비렌즈 (Movie Lens)의 영화 평점 데이터를 기반으로 각각의 사용자에게 알맞은 영화를 추천해주는 분산추천 시스템을 구현하고 실험을 통하여 성능의 우수성을 검증하였다.

MovieLens-1M, Avazu4, Criteo 데이터셋에 기반한 클릭률 예측을 위한 어텐션 네트워크 (Attention Network For Click-through Rate Prediction Based On MovieLens-1M, Avazu4, Criteo Datasets)

  • 안자건;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.522-523
    • /
    • 2023
  • CTR(Click Through Rate) 예측은 사용자가 광고나 아이템을 클릭할 확률을 예측하는 데 사용되는 용어로, 광고 분야에서 중요한 연구 분야로 자리 잡았다. 인터넷 데이터의 양이 증가함에 따라, 전통적인 피쳐 엔지니어링의 인건비는 계속해서 상승하고 있다. 특징 상호 작용에 대한 의존도를 줄이기 위해, 본 논문은 TMH(Two-Tower Multi-Headed Attention Neural Network) 접근법이라고 하는 명시적인 특징 상호 작용과 암시적인 특징 상호 작용을 결합한 융합 모델을 제안한다. CTR 예측에서 TMH 의 효과를 평가하기 위해 3 개의 실제 데이터 세트를 사용하여 많은 수의 실험을 수행하였다. 성능은 3 개의 데이터 세트에서 0.12%, 0.41% 및 0.68%으로 향상되었다.