• Title/Summary/Keyword: Collaborative Clustering

Search Result 93, Processing Time 0.028 seconds

Clustering-Based Recommendation Using Users' Preference (사용자 선호도를 사용한 군집 기반 추천 시스템)

  • Kim, Younghyun;Shin, Won-Yong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.2
    • /
    • pp.277-284
    • /
    • 2017
  • In a flood of information, most users will want to get a proper recommendation. If a recommender system fails to give appropriate contents, then quality of experience (QoE) will be drastically decreased. In this paper, we propose a recommender system based on the intra-cluster users' item preference for improving recommendation accuracy indices such as precision, recall, and F1 score. To this end, first, users are divided into several clusters based on the actual rating data and Pearson correlation coefficient (PCC). Afterwards, we give each item an advantage/disadvantage according to the preference tendency by users within the same cluster. Specifically, an item will be received an advantage/disadvantage when the item which has been averagely rated by other users within the same cluster is above/below a predefined threshold. The proposed algorithm shows a statistically significant performance improvement over the item-based collaborative filtering algorithm with no clustering in terms of recommendation accuracy indices such as precision, recall, and F1 score.

Improved Collaborative Information Filtering with User Clustering (사용자 클러스터링을 통한 개선된 협력적 정보여과)

  • 김학균;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.75-77
    • /
    • 1999
  • 정보추천 시스템은 사용자가 어떤 정보를 선호하는지를 식별함으로써 산재한 정보 중에서 적절한 정보만을 제공하는 것을 목표로 한다. 이러한 정보추천 시스템에서 사용되는 정보여과 기술에는 내용기반 여과와 협력적 여과가 있다. 기존의 협력적 정보여과 기술은 선호도를 적게 제시한 사용자에게 정보를 추천하기 어렵고, 동일한 상품 정보에 대해서 사용자의 평가가 없을 경우 사용자간의 유사성을 판단하기 어려운 단점이 있다. 본 논문은 SVD (Singular Value Decomposition)를 통해 사용자 프로파일을 정량화함으로써 사용자 선호도 행렬로부터 숨어있는 의미정보를 추출하여 동일한 정보에 대해 선호도를 평가해야 한다는 단점을 극복한다. 이때, 사용자 프로파일 벡터를 비감독 학습 알고리즘인 SOM (Self0Organizing Map)으로 클러스터링하여 사용자를 분류하고, 정보추천은 사용자 그룹간에서 이루어지며 Pearson correlation 알고리즘을 이용한다. 기존의 방법과 비교한 결과, 제안한 방법이 새로운 사용자에 대해서도 적절한 정보를 추천할 수 있음을 볼 수 있었다.

  • PDF

A Collaborative Fi1tering based Context Information in Pure P2P Environments (Pure P2P 환경에서 컨텍스트 정보에 기반을 둔 협력적 필터링)

  • Lee Se-Il;Lee Sang-Yong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.363-366
    • /
    • 2005
  • Pure P2P 환경에서는 축적된 자료를 사용하지 않고 실시간 정보를 사용하여 소수의 서비스 항목만으로도 협력적 필터링을 제공할 수 있어야 한다 그러나 지역에서 수집된 소수의 서비스 항목만으로 협력적 필터링을 할 경우 추천 서비스의 질이 떨어지게 되므로, 사용자의 컨텍스트 정보를 이용하여 추천 서비스의 질을 높일 수 있는 방법이 연구되어야 한다. 하지만 사용자 컨텍스트 정보는 다량의 정보가 순간에 인식될 수 있기 때문에 확장성 문제(Scalability Problem)가 발생하고, 영역과 아이템에 따라 차별화된 서비스를 지원하기에는 한계성을 가지고 있다. 이러한 문제점을 해결하기 위하여 본 연구에서는 SOM을 이용하여 컨텍스트 정보를 서비스 영역별로 클러스터링(Clustering)하여, 사용자별로 분류함으로 확장성 문제를 해결하였다. 또한, 분류된 자료들 중 서비스 요구자와 비슷한 분류에 있는 사용자들의 컨텍스트 정보들을 정량화하여 협력적 필터링함으로 사용자에게 적합한 서비스를 지원할 수 있다.

  • PDF

A Collaborative Recommendation Based on Neural Networks Using the Clustering (클러스터링을 이용한 신경망 기반 협력적 추천)

  • 김은주;류정우;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.343-345
    • /
    • 2002
  • 개인화를 위한 협력적 추천의 대표적인 방법인 최근접 이웃 방법은 적용이 쉽지만, 사용자의 선호도 정보가 적을 경우 회소성(sparsity)문제와 사용자 수가 많은 경우 수행 속도가 느려지는 범위성(Scalability)문제 그리고 사용자간의 가중치가 결여되었다는 점에서 추천의 정확성이 떨어진다. 신경망 기반 추천은 자료의 유형에 상관없이 데이터의 처리가 용이하고, 사용자간의 가중치를 학습할 수 있으며, 내용 정보, 인구통계학적 정보 등을 입력 노드에 추가함으로써 희소성 문제를 해결할 수 있으나. 범위성 문제는 존재한다. 따라서 본 논문에서는 최근접 이웃 방법으로 클러스터링 한 유사한 사용자 또는 항목들을 고려한 신경망 기반 추천 방법을 제안하여 범위성 문제를 최소화시킴으로써 추천의 성능을 향상시키고 있다. 제안한 추천 방법의 타당성을 보이기 위해 EachMovie데이터를 이용하여 기존 신경망 추천과 비교 실험하여 성능을 분석한다.

  • PDF

A New Collaborative Filtering Using Associative Relation Clustering (연관 관계 군집에 의한 협력적 여과 방법)

  • 김진현;정경용;김태용;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.331-333
    • /
    • 2002
  • 협력적 여과 방법은 사용자의 평가 데이터를 이용하므로, 항상 초기 평가 문제(First-Rating Problem)와 희박성 문제(Sparsity Problem)가 발생한다. 최근 이러한 문제를 해결하기 위해 많은 연구가 진행되고 있는 데, 본 논문에서는 연관 규칙을 이용하여 이러한 문제를 해결하고자 한다. 사용자의 평가 데이터를 이용하여 아이템간의 연관성을 산출하고, 연관성이 높은 아이템끼리 군집한다. 사용자와 군집간에 피어슨 상관 계수(Pearson Correlation Coefficient)를 이용하여 가중치를 구하고, 이것으로 선호도를 예측한다. 이러한 방법을 기존의 협력적 여과 방법과 함께 속성에 의한 군집 방식과 비교 평가하였다. 또한, 효율적인 군집을 위한 Split Cluster Method를 제안하고, 기존의 트리 방식의 군집과 비교 평가하였다.

  • PDF

An Improved Neighbor Selection Method for Recommender Systems based on Collaborative Filtering (협동적 필터링 기반 추천 시스템을 위한 향상된 이웃 선정 방법)

  • Kim, Taek-Hun;Yang, Sung-Bong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.453-456
    • /
    • 2004
  • 전자상거래에서 추천 시스템은 일반적으로 협동적 필터링이라는 정보 필터링 기술을 사용한다. 협동적 필터링 기술은 유사한 성향을 갖는 다른 고객들이 상품에 대해서 매긴 평가에 기반한다. 협동적 필터링이 유사 선호도를 갖는 이웃 고객들의 평가에 근거하기 때문에 고객에게 가장 적합한 유사 이웃들을 적절히 선정해 내는 것은 추천 시스템에서 예측의 질 향상을 위해 필요하다. 본 논문에서 우리는 ordered clustering을 이용하여 협동적 필터링을 위한 향상된 이웃선정 방법을 제안한다. 이 방법은 탐색 공간을 줄이기 위해 k-means 클러스터링 방법을 사용한다. 그리고 클러스터링에 의해 구성된 고객들에 대해서 threshold 값에 의해 보다 정제된 고객들을 최종 선정함으로써 고객에게 보다 의미 있는 적합한 고객이 최종적인 이웃으로 선정될 수 있도록 한다. 실험은 Compaq Computer Corporation에 의해 제공된 EachMovie 데이터 셋을 사용하였다. 실험 결과로 우리는 제안한 방법이 다른 방법보다 좋은 예측 정확도를 갖는 것을 확인할 수 있었다.

  • PDF

Attribute-based Multi-level Clustering for Collaborative Filtering (협동적 필터링을 위한 속성기반 다단계 클러스터링)

  • Kim, Taek-Hun;Yang, Sung-Bong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.525-528
    • /
    • 2007
  • 추천시스템은 일반적으로 협동적 필터링이라는 정보 필터링 기술을 사용한다. 협동적 필터링은 유사한 성향을 갖는 다른 고객들이 상품에 대해서 매긴 평가에 기반하기 때문에 고객에게 가장 적합한 유사 이웃들을 적절히 선정해 내는 것이 추천시스템의 예측의 질 향상을 위해서 필요하다. 본 논문에서는 속성 정보를 기반으로 한 다단계 클러스터링을 통한 이웃선정 방법을 제안한다. 이 방법은 대규모 데이터 셋에서 탐색 공간을 줄이기 위해 클러스터링을 수행하여 적절한 이웃 고객들의 집합을 추출한다. 이 때, 속성 정보에 따라 단계적으로 클러스터링을 수행함으로써 보다 정제된 고객집합을 구성할 수 있도록 한다. 본 논문에서는 고객 선호도와 위치 정보를 대표적인 속성 정보로 사용함으로써 모바일 환경에서 보다 정확한 추천이 이루어질 수 있도록 한다.

Social Network Analysis for the Effective Adoption of Recommender Systems (추천시스템의 효과적 도입을 위한 소셜네트워크 분석)

  • Park, Jong-Hak;Cho, Yoon-Ho
    • Journal of Intelligence and Information Systems
    • /
    • v.17 no.4
    • /
    • pp.305-316
    • /
    • 2011
  • Recommender system is the system which, by using automated information filtering technology, recommends products or services to the customers who are likely to be interested in. Those systems are widely used in many different Web retailers such as Amazon.com, Netfix.com, and CDNow.com. Various recommender systems have been developed. Among them, Collaborative Filtering (CF) has been known as the most successful and commonly used approach. CF identifies customers whose tastes are similar to those of a given customer, and recommends items those customers have liked in the past. Numerous CF algorithms have been developed to increase the performance of recommender systems. However, the relative performances of CF algorithms are known to be domain and data dependent. It is very time-consuming and expensive to implement and launce a CF recommender system, and also the system unsuited for the given domain provides customers with poor quality recommendations that make them easily annoyed. Therefore, predicting in advance whether the performance of CF recommender system is acceptable or not is practically important and needed. In this study, we propose a decision making guideline which helps decide whether CF is adoptable for a given application with certain transaction data characteristics. Several previous studies reported that sparsity, gray sheep, cold-start, coverage, and serendipity could affect the performance of CF, but the theoretical and empirical justification of such factors is lacking. Recently there are many studies paying attention to Social Network Analysis (SNA) as a method to analyze social relationships among people. SNA is a method to measure and visualize the linkage structure and status focusing on interaction among objects within communication group. CF analyzes the similarity among previous ratings or purchases of each customer, finds the relationships among the customers who have similarities, and then uses the relationships for recommendations. Thus CF can be modeled as a social network in which customers are nodes and purchase relationships between customers are links. Under the assumption that SNA could facilitate an exploration of the topological properties of the network structure that are implicit in transaction data for CF recommendations, we focus on density, clustering coefficient, and centralization which are ones of the most commonly used measures to capture topological properties of the social network structure. While network density, expressed as a proportion of the maximum possible number of links, captures the density of the whole network, the clustering coefficient captures the degree to which the overall network contains localized pockets of dense connectivity. Centralization reflects the extent to which connections are concentrated in a small number of nodes rather than distributed equally among all nodes. We explore how these SNA measures affect the performance of CF performance and how they interact to each other. Our experiments used sales transaction data from H department store, one of the well?known department stores in Korea. Total 396 data set were sampled to construct various types of social networks. The dependant variable measuring process consists of three steps; analysis of customer similarities, construction of a social network, and analysis of social network patterns. We used UCINET 6.0 for SNA. The experiments conducted the 3-way ANOVA which employs three SNA measures as dependant variables, and the recommendation accuracy measured by F1-measure as an independent variable. The experiments report that 1) each of three SNA measures affects the recommendation accuracy, 2) the density's effect to the performance overrides those of clustering coefficient and centralization (i.e., CF adoption is not a good decision if the density is low), and 3) however though the density is low, the performance of CF is comparatively good when the clustering coefficient is low. We expect that these experiment results help firms decide whether CF recommender system is adoptable for their business domain with certain transaction data characteristics.

Optimal Associative Neighborhood Mining using Representative Attribute (대표 속성을 이용한 최적 연관 이웃 마이닝)

  • Jung Kyung-Yong
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.43 no.4 s.310
    • /
    • pp.50-57
    • /
    • 2006
  • In Electronic Commerce, the latest most of the personalized recommender systems have applied to the collaborative filtering technique. This method calculates the weight of similarity among users who have a similar preference degree in order to predict and recommend the item which hits to propensity of users. In this case, we commonly use Pearson Correlation Coefficient. However, this method is feasible to calculate a correlation if only there are the items that two users evaluated a preference degree in common. Accordingly, the accuracy of prediction falls. The weight of similarity can affect not only the case which predicts the item which hits to propensity of users, but also the performance of the personalized recommender system. In this study, we verify the improvement of the prediction accuracy through an experiment after observing the rule of the weight of similarity applying Vector similarity, Entropy, Inverse user frequency, and Default voting of Information Retrieval field. The result shows that the method combining the weight of similarity using the Entropy with Default voting got the most efficient performance.

Improvement of Cognitive Rehabilitation Method using K-means Algorithm (K-MEANS 알고리즘을 이용한 인지 재활 훈련 방법의 개선)

  • Cho, Ha-Yeon;Lee, Hyeok-Min;Moon, Ho-Sang;Shin, Sung-Wook;Chung, Sung-Taek
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.18 no.6
    • /
    • pp.259-268
    • /
    • 2018
  • The purpose of this study is to propose a training method customized to the level of cognitive abilities to increase users' interest and engagement while using cognitive function training contents. The level of cognitive ability of the users was based on the clustering based on the users' information and Mini-Mental Statue Examination-Korea Child test score using the K-means algorithm applied collaborative filtering. The results were applied to the integrated cognitive function training system, and the contents order and difficulty level of the cognitive function training area were recommended to the user's cognitive ability level. Particularly, the contents difficulty control was designed to give a high immersion feeling by applying the 'flow theory' method that users can repeatedly feel tension and comfort. In conclusion, the user-customized cognitive function training method proposed in this paper can be expected to be more effective and rehabilitative results than existing therapists' subjective setting of contents order and difficulty level.