• 제목/요약/키워드: Nearest-Neighbor Collaborative Filtering

검색결과 21건 처리시간 0.024초

비부정 행렬 인수분해 차원 감소를 이용한 최근 인접 협력적 여과 (Nearest-Neighbor Collaborative Filtering Using Dimensionality Reduction by Non-negative Matrix Factorization)

  • 고수정
    • 정보처리학회논문지B
    • /
    • 제13B권6호
    • /
    • pp.625-632
    • /
    • 2006
  • 협력적 여과는 사용자 선호도를 예측하기 위해 그 사용자의 유형을 학습하는 데 목적을 둔 기술이다. 협력적 여과 시스템이 전자상거래에서 성공적인 기술일지라도 그들은 데이터의 고차원성과 희박성이라는 문제점을 갖는다. 본 논문에서는 이와 같은 문제점을 해결하기 위하여 비부정 행렬 인수분해(NNMF, Non-negative Matrix Factorization) 방법을 이용한 최근 인접 협력적 여과 방법을 제안한다. 행렬을 분해하기 위한 전처리로서 사용자 변동 계수를 이용하여 사용자-아이템 행렬의 결측치를 채우고, 이를 대상으로 비부정 분해 방식을 적용하여 행렬을 인수분해 한다. 비부정 분해 방식을 적용한 긍정 분해는 사용자들을 의미를 갖는 벡터로써 표현함으로써 사용자들을 의미 관계를 갖는 그룹으로 표현한다. 이와 같이 벡터로 표현된 사용자들은 벡터 유사도에 의해 그들간의 유사도를 계산한다. 계산된 유사도의 정도에 의해 이웃을 결정하고, 이웃들이 평가한 아이템에 대한 흥미도를 기반으로 새로운 사용자가 평가하지 않은 아이템에 대한 결측치를 예측한다.

근접 이웃 선정 협력적 필터링 추천시스템에서 이웃 선정 방법에 관한 연구 (A study on neighbor selection methods in k-NN collaborative filtering recommender system)

  • 이석준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.809-818
    • /
    • 2009
  • 협력적 필터링 기법은 전자상거래에서 거래되는 아이템에 대하여 고객들이 평가한 선호 정보를 이용하여 특정 상품에 대한 선호도 예측 대상 고객의 선호도를 예측하는 기법이다. 협력적 필터링 기법을 통한 예측 정확도를 향상시키기 위해서는 예측에 이용할 수 있는 고객들의 선호 정보를 충분히 확보하여야 한다. 그러나 과도한 이웃 고객의 선호 정보는 오히려 예측 정확도에 부정적 영향을 미치며 또한 과소 정보 역시 예측 정확도 감소에 영향을 미칠 수 있다. 본 연구에서는 협력적 필터링 알고리즘 적용에 있어 k명의 근접 이웃을 결정하는 이웃 선정방법을 개선하였으며 개별 고객의 선호도 평가 정보를 이용하여 적정 이웃 수를 결정할 수 있는 방법을 제시한다. 본 연구의 결과는 근접 이웃 수 결정을 위한 기존 방법인 탐색적 방법을 개선함과 동시에 선호도 예측 정확도를 향상시키는데 유용한 방법을 제공할 수 있다.

  • PDF

이러닝 마켓플레이스에서 자기주도학습지원을 위한 추천시스템 (Recommendation system for supporting self-directed learning on e-learning marketplace)

  • 권병일;문남미
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.135-146
    • /
    • 2010
  • 본 논문에서는 이러닝 마켓플레이스에서 자기주도학습지원을 위한 추천시스템을 제안한다. 이 시스템은 마켓플레이스를 지원하기위한 개선된 협업필터링을 이용한 추천시스템이다. 기존의 협업필터링 기법은 입력데이터구성, 최근접 이웃선정을 통한 유사고객 그룹을 형성하고, 추천목록 생성하는 3단계로 구성되었다. 본 연구는 이를 개선하여 산업 수준을 고려한 최근접 이웃 교육과정 선정 단계를 추가한 협업필터링에 사용하여, 자기주도학습을 지원할 수 있는 추천시스템을 설계하였다. 이 서비스는 산업체 학습자에게 보다 정확한 교육과정을 선택할 수 있도록 도와준다. 추천시스템은 다양한 기법을 통해 구축되며, 협업필터링 방식을 사용하여 명시적인 속성이 부여 되어진 콘텐츠를 추천하는 것은, 기존 콘텐츠 추천의 한계를 해결하고자 하였다.

고객 맞춤 서비스를 위한 HPPS(Hybrid Preference Prediction System) 설계 (A Design of HPPS(Hybrid Preference Prediction System) for Customer-Tailored Service)

  • 정은희;이병관
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1467-1477
    • /
    • 2011
  • 본 논문에서는 고객 맞춤 서비스의 선호도를 정확하게 예측하기 위하여 사용자 프로파일 분석, 사용자간 유사도 분석을 이용한 HPPS(Hybrid Preference Prediction System) 설계를 제안한다. 기존의 NBCFA(Neighborhood Based Collaborative Filtering Algorithm)과 달리, 본 논문은 첫째, 선호도 예측식에서 이웃의 상품 평가가 없을 경우 상품에 대한 평균값을 이용하도록 하였고, 둘째, 선호도 예측식에서 사용자의 특성을 분석한 가중치를 반영하도록 하였고, 끝으로, 인접 이웃을 선정할 때 유사도, 상품 평가 여부, 평가 횟수를 반영하여 HPPS에 선호도의 정확도를 향상시켰다. 따라서 첫째와 둘째의 선호도 예측식을 이용하면 HPPS의 정확도는 기존의 NBCFA에 비해 97.24% 향상되었고, 인접이웃 선정방식에서도 HPPS 시스템의 정확도가 75% 향상되었다.

Improving Web Service Recommendation using Clustering with K-NN and SVD Algorithms

  • Weerasinghe, Amith M.;Rupasingha, Rupasingha A.H.M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1708-1727
    • /
    • 2021
  • In the advent of the twenty-first century, human beings began to closely interact with technology. Today, technology is developing, and as a result, the world wide web (www) has a very important place on the Internet and the significant task is fulfilled by Web services. A lot of Web services are available on the Internet and, therefore, it is difficult to find matching Web services among the available Web services. The recommendation systems can help in fixing this problem. In this paper, our observation was based on the recommended method such as the collaborative filtering (CF) technique which faces some failure from the data sparsity and the cold-start problems. To overcome these problems, we first applied an ontology-based clustering and then the k-nearest neighbor (KNN) algorithm for each separate cluster group that effectively increased the data density using the past user interests. Then, user ratings were predicted based on the model-based approach, such as singular value decomposition (SVD) and the predictions used for the recommendation. The evaluation results showed that our proposed approach has a less prediction error rate with high accuracy after analyzing the existing recommendation methods.

협동적 필터링을 이용한 K-최근접 이웃 수강 과목 추천 시스템 (K-Nearest Neighbor Course Recommender System using Collaborative Filtering)

  • 손기락;김소현
    • 정보교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.281-288
    • /
    • 2007
  • 협동적 필터링은 사용자가 좋아할 만한 항목을 예측하기 위하여 비슷한 선호도를 가지는 다른 사람들의 평가 항목에 근거하여 추천하는 방법이다. 이러한 협동적 필터링 기법은 오늘날과 같이 대규모의 정보가 효과적으로 축적되고 이용 가능하게 된 정보화된 사회에서는 현명한 의사결정을 하도록 도와주는 역할을 한다. 본 논문에서는 대학생들이 수강과목의 취사선택을 용이하게 할 수 있도록 수강과목 추천 시스템을 설계하고 구현하였으며 실험적으로 평가하였다. 먼저, 학생들은 과거 자신이 수강하였던 과목에 대한 과목 선호도를 데이터베이스에 입력한다. 과목 선호도의 패턴이 유사한 학생들은 유사 그룹으로 간주된다. 성향이 유사한 사용자를 찾기 위해 일반적으로 사용되고 있는 피어슨 상관계수에 의한 유사도를 이용하였다. 수강 과목을 예측하려는 학생과 가장 유사한 패턴을 보이는 K 명의 학생들의 수강 과목에서 가장 높은 선호도를 보이는 과목들의 순서화된 리스트를 추천 과목으로 제시한다. 설문 조사를 통한 실험 데이터를 이용하였으며 평균 절대 에러를 사용하여 제안한 방법의 정확도를 평가하였다.

  • PDF

대규모 데이터를 위한 k-최근접 이웃 학습 기반의 효율적인 협력적 여과 기법 (An Efficient Collaborative Filtering Method Based on k-Nearest Neighbor Learning for Large-Scale Data)

  • 전광성;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.376-380
    • /
    • 2008
  • 사회의 복잡화와 인터넷의 성장으로 폭발적으로 늘어나고 있는 정보들을 사용자가 모두 검토한 후 여과하기는 어려운 일이다. 이러한 문제를 보완하기 위해서 자동화된 정보 여과 기술이 사용되는데, k-최근접 이웃(k-nearest neighbor) 알고리즘은 그 구현이 간단하며 비교적 정확하여 가장 널리 쓰이고 있는 알고리즘 중 하나이다. k 개의 최근접 이웃들로부터 평가값을 계산하는 데 흔히 쓰이는 방법은 상관계수를 이용한 가중치에 기반하는 것이다. 본 논문에서는 이를 보완하여 대규모 데이터에 대해서도 속도는 크게 저하되지 않으며 정확도는 대폭 향상시킬 수 있는 방법을 적용하였다. 또한, 최근접 이웃을 구하는 거리함수로 다양한 방법을 시도하였다. 영화추천을 위한 실제 데이터에 대한 실험 결과, 속도의 저하는 미미하였으나 정확도에 있어서는 크게 향상된 결과를 가져올 수 있었다.

  • PDF

Personalized Movie Recommendation System Combining Data Mining with the k-Clique Method

  • Vilakone, Phonexay;Xinchang, Khamphaphone;Park, Doo-Soon
    • Journal of Information Processing Systems
    • /
    • 제15권5호
    • /
    • pp.1141-1155
    • /
    • 2019
  • Today, most approaches used in the recommendation system provide correct data prediction similar to the data that users need. The method that researchers are paying attention and apply as a model in the recommendation system is the communities' detection in the big social network. The outputted result of this approach is effective in improving the exactness. Therefore, in this paper, the personalized movie recommendation system that combines data mining for the k-clique method is proposed as the best exactness data to the users. The proposed approach was compared with the existing approaches like k-clique, collaborative filtering, and collaborative filtering using k-nearest neighbor. The outputted result guarantees that the proposed method gives significant exactness data compared to the existing approach. In the experiment, the MovieLens data were used as practice and test data.

협력 필터링 기반의 추천 시스템을 위한 이웃 선정 전략 (A Strategy for Neighborhood Selection in Collaborative Filtering-based Recommender Systems)

  • 이수정
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1380-1385
    • /
    • 2015
  • 협력 필터링은 가장 성공적으로 사용되는 추천 시스템의 방법으로서, 서적, 음악 등 다방면의 상업 시스템에서 활용되어왔다. 이러한 방법의 핵심은 사용자에게 가장 적합한 추천인들을 선정하는 것인데, 이를 위하여 다양한 유사도 측정 방법이 연구되었다. 본 연구에서는 추천 성능의 향상을 위하여 기존의 유사도 값에 근거한 추천인 선정의 문제점을 파악하고 이의 개선책으로서 유사도 값과 공통평가항목수의 비율을 기준으로 하여 가변적으로 추천인을 결정하는 방법을 제시한다. 실험을 통하여 다양한 기준값에 대해 성능 변화를 관찰한 결과, 예측 성능과 추천 성능의 두 측면 모두에서 제안 방법이 매우 향상된 결과를 가져왔으며, 특히 주어진 기준값을 만족하는 추천인 수가 적을 때에도 향상된 성능 결과를 보였다.

A New Similarity Measure based on Separation of Common Ratings for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.149-156
    • /
    • 2021
  • 추천 시스템의 여러 구현 기법들 중 협력 필터링은 과거 평가 이력을 토대로 유사성이 높은 인접 이웃들을 선정하여, 그들이 선호했던 상품들을 추천하는데, 많은 상업 사이트에서 성공적으로 활용되고 있다. 유사도의 정확한 측정은 시스템의 성능을 좌우하는 매우 중요한 요소이다. 기존에 다양한 방식의 유사도 척도들이 개발되었는데, 대개 전통적인 유사도 척도와 기개발된 여러 계수들과의 통합 방식이었다. 본 연구에서는 새로운 방식의 유사도 척도를 제안한다. 두 사용자 간의 공통 평가 영역을 평가치 크기에 따라 분할하여 각 부분 영역별로 유사도를 측정하고 이들을 가중 통합함으로써, 유사한 영역이 구체적으로 파악되어 최종 유사도값에 반영된다. 두 종류의 개방형 데이터셋을 활용한 성능을 측정하였고, 그 결과 특히 밀집 데이터셋에서 제안 방법의 예측 정확도, 순위 정확도, 평균 정밀도 성능이 기존보다 우수하였다. 제안 척도는 다양한 상업 시스템에서 사용자들의 선호에 보다 적합한 상품을 추천하는데 유용하게 활용될 것으로 기대한다.