• 제목/요약/키워드: personalized recommender algorithm

검색결과 29건 처리시간 0.019초

추천 시스템을 위한 2-way 협동적 필터링 방법을 이용한 예측 알고리즘 (A Predictive Algorithm using 2-way Collaborative Filtering for Recommender Systems)

  • 박지선;김택헌;류영석;양성봉
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.669-675
    • /
    • 2002
  • 최근 전자상거래에서 대부분의 개인화 된 추천 시스템들은 고객의 취향에 맞는 적절한 상품을 추천하기 위하여 협동적 필터링 기술을 적용하고 있다. 사용자 기반 협동적 필터링은 특정 고객의 선호도와 가장 유사한 선호도를 가지는 고객 그룹의 선호도를 바탕으로 그 고객의 특정 상품에 대한 선호도를 예측하는 기법이다. 그러나 이 방법은 두 고객이 모두 평가를 한 상품이 있어야 하고 오직 두 고객 사이에서만 상관 관계를 구할 수 있으므로 예측의 정확성이 떨어질 가능성이 있다. 아이템 기반 협동적 필터링은 고객이 선호도를 입력한 기존의 상품들과 예측하고자 하는 상품의 상관 관계를 계산하여 선호도를 예측한다. 이 방법에서는 상품들간의 유사도를 계산하기 위하여 두 상품에 대해 선호도를 입력한 고객들의 정보를 사용한다. 그러나 고객들간의 유사도가 전혀 고려되지 않기 때문에 만약 특정 고객과 전혀 선호도가 비슷하지 않은 사용자들의 평가를 기반으로 한다면, 상품들간의 유사도가 정확 하지 않고 아울러 추천 시스템의 예측 능력과 추천 능력이 저하되는 문제점이 있다. 본 논문에서는 기존의 아이템 기반 협동적 필터링 기술의 문제점을 보완하고 추천 시스템의 예측 능력을 향상시키기 위하여 유사한 선호도를 가지는 고객들의 평가에 근거하여 상품들간의 유사도를 구하여 특정 상품에 대한 고객의 선호도를 예측하여 추천해 주는 기법을 제안한다. 본 논문에서 제안한 방법의 성능을 기존의 여러 다른 협동적 필터링 방법들과의 비교실험을 통해 평가하였다. 실험 결과 본 논문에서 제안한 방법이 기존의 다른 방법들보다 우수함을 확인할 수 있었다.

유비쿼터스 환경에서 상황 인지 정보를 이용한 적응형 추천 서비스 기법 (An Adaptive Recommendation Service Scheme Using Context-Aware Information in Ubiquitous Environment)

  • 최정환;류상현;장현수;엄영익
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.185-193
    • /
    • 2010
  • 최근 유비쿼터스 시대의 도래와 함께 개인화된 서비스를 제공하기 위한 다양한 서비스 모델들이 제안되어 왔으며, 특히, 사용자에게 개인화된 서비스를 선응적으로 제공하기 위한 다양한 추천 서비스 기법들이 고안되었다. 그러나, 기존의 기법들은 수 많은 데이터를 여과 과정 없이 분석함으로써 추천의 효율성이 떨어지며, 한정된 상황 인지 정보만용 추천 요소로 고려하기 때문에 사용자에게 개인화된 서비스를 제공하기에 적합하지 않다. 본 논문에서는 유비쿼터스 환경에서 사용자의 현재 상황에 가장 적합한 서비스를 제공하는 적응형 추천 서비스 기법을 제안한다. 본 기법은 사용자의 선호도 예측을 위해 누적된 사용자와 장치 간의 상호작용 상황 정보들을 이용하며, 군집 및 협업 필터링 기법을 이용하여 사용자에게 현재 상황에 적응적인 서비스를 추천한다. 군집 기법을 통해 사용자의 현재 위치에 근접한 데이터만을 분석함으로써, 추천의 효율성을 높이며, 협업 필터링을 이용하여 누적된 정보들이 충분하지 않은 상황에서도 정확한 추천을 보장한다. 끝으로, 시뮬레이션을 통해 본 기법의 성능 및 신뢰성을 평가한다.

협업필터링에서 포괄적 성능평가 모델 (A Comprehensive Performance Evaluation in Collaborative Filtering)

  • 유석종
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.83-90
    • /
    • 2012
  • 대규모의 상품을 다루는 전자상거래 시스템에서 개인화된 추천은 필수적인 기능이 되고 있다. 대표적 추천 알고리즘인 협업필터링은 내용기반 추천에 비하여 뛰어난 추천성능을 제공해 주고 있으나, 희박성, 신규 아이템 문제(Cold-start), 확장성 등의 근본적인 한계를 갖고 있다. 본 연구에서는 추가적으로 협업필터링이 목표 대상자에 따라 비일관된 예측 능력의 차이를 보이는 추천 성능의 편차 문제를 제기하고자 한다. 추천성능의 편차는 기존의 Mean Absolute Error(MAE)에 의해서는 측정되기 어려우며 또한 정확도, 재현율 지표와도 독립적으로 평가되고 있다. 협업알고리즘의 정확한 성능평가를 위해서 본 연구에서는 MAE, MAE 편차, 정확도, 재현율을 포괄적으로 평가할 수 있는 확장 성능평가모델을 제안하고 이를 클러스터링 기반 협업필터링에 적용하여 성능을 비교 분석한다.

개인화 된 추천정보 소기를 위한 Web Usage Mining 알고리즘 (Web Usage Mining Algorithm for Personalized Recommender System)

  • 이은영;곽미라;염선희;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 추계학술대회 논문집 학회본부 D
    • /
    • pp.827-829
    • /
    • 2000
  • 오늘날 인터넷 사용자들은 정보의 홍수 속에 놓여있다. 웹사이트에 들어가면 대부분은 자신과 관련 없는 정보들이 쏟아진다. 따라서 인터넷 사용자들의 관심에 맞는 내용을 제 공해주어 시간의 절약과 동시에 사용자에게 가치 있는 정보를 제공할 수 있게 하는 서비스가 필요하다. 이러한 개인화 된 서비스를 제공해주기 위해 사용자에 대한 정확한 분석을 바탕으로 사용자에게 효율적인 서비스를 제공하여야 할 것이다. 따라서 본 논문에서는 사용자 프로파일 및 웹 로그 등을 토대로 각 고객의 성향과 패턴을 정확하게 분석하여, 사용자 각 개인에게 적합하며 효율적인 서비스를 제공해 줄 수 있는 Web Usage Mining 을 통한 사용자 패턴 추출 알고리즘을 개발하고자 한다. 본 논문에서 연구한 Web Usage Mining 알고리즘은 사용자의 웹 사용 습관을 토대로 데이터 마이닝의 과정을 거쳐 사용자의 성향과 관심을 결정하고, 이를 바탕으로 사용자에게 알맞은 내용을 제공할 수 있도록 할 것이다. 이때, 사용자의 정보는 웹 내에서의 행동 중에서 중요하게 사용되는 특정한 페이지를 보는 시간, 웹 서핑 패턴, 전자 상거래 사이트의 경우에는 구매한 상품과 쇼핑 카트에 넣은 상품 등의 관찰된 정보를 기반으로 하며, 개인의 사생활을 침해하지 않는 범위 내에서 이루어지도록 했다.

  • PDF

종합 평점과 다기준 평점을 선택적으로 활용하는 협업필터링 기반 하이브리드 추천 시스템 (A Hybrid Recommender System based on Collaborative Filtering with Selective Use of Overall and Multicriteria Ratings)

  • 구민정;안현철
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.85-109
    • /
    • 2018
  • 추천시스템은 사용자의 과거 구매행동을 통해 향후 구매할 것이라고 예상되는 제품을 자동으로 검색하여 추천해준다. 특히 전자상거래 기업의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로 가치가 있다. 하지만, 전통적인 추천시스템, 특히 학계 및 산업계에서 가장 널리 사용되고 있는 전통적인 협업필터링 기법은 단일차원의 '종합 평점'만을 고려하여 추천결과를 생성하도록 설계되어 있어, 사용자들의 정확한 니즈를 이해하고 대응하는데 근본적인 한계가 있다. 최근에는 전자 상거래 기업들도 고객들로부터 보다 다각화된, 다기준 방식으로 피드백을 받고 있다. 특히 다기준 평점은 정량적으로 입력되는 정보이므로 상대적으로 분석 및 처리가 용이하다는 장점이 있다. 그러나 다기준 평점 역시 사전에 정해진 기준에 대해서만 사용자의 피드백이 이루어지기 때문에, 보다 상세하게 사용자의 의견을 이해하여 추천에 반영하는 데에는 한계가 있다. 이에 본 연구는 다기준 평점 정보와 선택적 협업필터링의 서로 다른 접근방법을 통해 도출된 추천결과를 종합하여, 최종적으로 추천 대상리스트를 산출할 수 있는 하이브리드 기술을 제안한다. 본 연구에서 제안한 연구모형의 유용성을 검증하기 위해, 식음료점(식당, 카페 등)에 대한 실제 이용자를 대상으로 온라인 설문을 통해 종합 평점과 다기준 평점을 수집하였으며, 데이터를 학습용과 검증용으로 구분하여 학습시키고 성과를 평가하였다. 이 기법은 결합 함수 기반 접근법과 사용자마다 구매의사결정의 체계가 다르다는 전제하에, 사용자들을 유형화하고, 유형에 따라 정보원을 선택적으로 활용하는 협업필터링 알고리즘을 활용했다. 실험결과, 제안 알고리즘을 통한 추천 방법이 단일 차원을 고려하는 전통적인 협업필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인했다. 아울러, 본 연구가 제안하는 다기준 평점과 선택적 협업필터링 알고리즘을 종합하여 추천하는 방법이, 단순히 다기준 평점을 고려했을 때 보다 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.

고객의 동적 선호 탐색을 위한 순차패턴 분석: (주)더페이스샵 사례 (A Sequential Pattern Analysis for Dynamic Discovery of Customers' Preference)

  • 송기룡;노성호;이재광;최일영;김재경
    • 경영정보학연구
    • /
    • 제10권2호
    • /
    • pp.195-209
    • /
    • 2008
  • 고객의 니즈가 시시각각 변화하는 경영환경에서 획일화된 매장관리 방법으로 매장의 수익성을 증대시키기에는 한계가 있다. 따라서 고객의 선호 변화를 예측하여 각 매장에 적절한 상품을 추천할 필요가 있다. 본 연구에서는 판매 데이터 분석을 통해 시간 순서를 고려한 상품 추천 및 매장관리 방법을 제안한다. 즉 자기조직화지도(Self Organizing Map) 알고리즘을 이용하여 매장의 판매 프로파일을 군집화하고, 매장 궤적의 예측을 통해 목표 매장을 관리하는 방법을 제시한다. 본 연구의 방법론을 검증하기 위해 (주)더페이스샵 판매데이터를 적용하여 평가하였으며, 평가결과 제시한 방법론은 화장품처럼 유행에 민감하고 라이프사이클이 짧은 특징을 지닌 상품을 판매하는 매장의 수익성 증대에 기여할 수 있을 것으로 기대된다.

확장된 사용자 유사도를 이용한 CF-기반 건강기능식품 추천 시스템 (A CF-based Health Functional Recommender System using Extended User Similarity Measure)

  • 홍세인;정의주;김재경
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.1-17
    • /
    • 2023
  • 정보통신기술의 발전과 디지털 기기의 대중화로 인해, 온라인 시장의 규모가 커지고 있다. 그 결과 고객들은 상품을 선택하는데 많은 시간과 비용이 소요되는 정보 과부하(Information Overload) 문제에 직면하고 있다. 따라서 고객이 선호할만한 상품을 추천해 주는 추천 시스템은 필수적인 도구가 되었으며 협업 필터링(Collaborative Filtering) 기법은 가장 널리 쓰이는 추천 방법이다. 전통적인 추천 시스템은 평점과 같은 정량적인 데이터만을 사용하기 때문에 추천의 정확도는 높지 않다. 이와 같은 문제를 해결하기 위해 요즘에는 사용자 리뷰와 같은 정성적 데이터를 반영하는 연구가 활발히 진행되고 있다. 협업 필터링의 일반적인 절차는 사용자-상품 행렬 생성, 이웃 집단 탐색, 추천 목록 생성 3단계로 구성되며 코사인 같은 사용자 유사도를 사용하여 목표 고객의 이웃을 탐색하며, 추천 상품 목록을 생성한다. 본 연구에서는 이웃 집단 탐색 및 추천 목록 생성 단계에서 사용하는 사용자 간의 유사도를 기존의 사용자 평점을 이용한 유사도에 고객의 리뷰 데이터를 사용하는 확장된 사용자 유사도를 제시한다. 리뷰를 정량화 하기 위해 본 연구에서는 텍스트 마이닝을 활용한다. 즉, 리뷰 데이터에 TF-IDF, Word2Vec, 그리고 Doc2Vec 기법을 사용하여 두 사용자 간의 리뷰 유사도를 구한 후 사용자 평점을 사용한 유사도와 리뷰 유사도를 결합한 확장된 유사도를 생성하는 것이다. 이를 검증하기 위해 전자상거래 사이트인 Amazon의 'Health and Personal Care'의 사용자 평점과 리뷰 데이터를 사용하였다. 실험 결과, 사용자 간 유사도를 산출할 때 기존의 평점에 기반한 유사도만을 사용하는 것보다, 사용자 리뷰의 유사도를 추가로 반영한 확장된 유사도를 사용하면 추천의 정확도가 높아진다는 것을 확인했다. 또한, 여러 텍스트 마이닝 기법 중에서 TF-IDF 기법을 사용한 확장된 유사도를 이웃 집단 탐색 및 추천 목록 생성단계에서 사용할 때의 성능이 가장 좋게 나타났다.

네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 (A Study on the Effect of Network Centralities on Recommendation Performance)

  • 이동원
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.23-46
    • /
    • 2021
  • 개인화 추천에서 많이 사용되는 협업 필터링은 고객들의 구매이력을 기반으로 유사고객을 찾아 상품을 추천할 수 있는 매우 유용한 기법으로 인식되고 있다. 그러나, 전통적인 협업 필터링 기법은 사용자 간에 직접적인 연결과 공통적인 특징을 기반으로 유사도를 계산하는 방식으로 인해 신규 고객 혹은 상품에 대해 유사도를 계산하기 힘들다는 문제가 제기되어 왔다. 이를 극복하기 위하여, 다른 기법을 함께 사용하는 하이브리드 기법이 고안되기도 하였다. 이런 노력의 하나로서, 사회연결망의 구조적 특성을 적용하여 이런 문제를 해결하려는 시도가 있었다. 이는, 직접적으로 유사성을 찾기 힘든 사용자 간에도 둘 사이에 놓인 유사한 사용자 또는 사용자들을 통해 유추해내는 방식으로 상호 간의 유사성을 계산하는 방식을 적용한 것이다. 즉, 구매 데이터를 기반으로 사용자의 네트워크를 생성하고 이 네트워크 내에서 두 사용자를 간접적으로 이어주는 네트워크의 특성을 기반으로 둘 사이의 유사도를 계산하는 것이다. 이렇게 얻은 유사도는 추천대상 고객이 상품의 추천에 대한 수락여부를 결정하는 척도로 활용될 수 있다. 서로 다른 중심성 척도는 추천성과에 미치는 영향이 서로 다를 수 있다는 점에서 중요한 의미를 갖는다 할 수 있다. 이런 유사도의 계산을 위해서 네트워크의 중심성을 활용할 수 있다. 본 연구에서는 여기서 더 나아가 이런 중심성이 추천성과에 미치는 영향이 추천 알고리즘에 따라서도 다를 수 있다는 데에서 주목하여 수행되었다. 또한, 이런 네트워크 분석을 활용한 추천기법은 신규 고객 혹은 상품뿐만 아니라 전체 고객 혹은 상품으로 그 대상을 넓히더라도 추천 성능을 높이는 데 기여할 것을 기대할 수 있을 것이다. 이런 관점에서 본 연구는 네트워크 모형에서 연결선이 생성되는 것을 이진 분류의 문제로 보고, 추천 모형에 적용할 분류 기법으로 의사결정나무, K-최근접이웃법, 로지스틱 회귀분석, 인공신경망, 서포트 벡터 머신을 선택하고, 온라인 쇼핑몰에서 4년2개월간 수집된 구매 데이터로 실험을 진행하였다. 사회연결망에서 측정된 중심성 척도를 각 분류 기법에 적용하여 생성한 모형을 비교 실험한 결과, 각 모형 별로 중심성 척도의 추천성공률이 서로 다르게 나타남을 확인할 수 있었다.

보다 정확한 동적 상황인식 추천을 위해 정확 및 오류 패턴을 활용하여 순차적 매칭 성능이 개선된 상황 예측 방법 (Context Prediction Using Right and Wrong Patterns to Improve Sequential Matching Performance for More Accurate Dynamic Context-Aware Recommendation)

  • 권오병
    • Asia pacific journal of information systems
    • /
    • 제19권3호
    • /
    • pp.51-67
    • /
    • 2009
  • Developing an agile recommender system for nomadic users has been regarded as a promising application in mobile and ubiquitous settings. To increase the quality of personalized recommendation in terms of accuracy and elapsed time, estimating future context of the user in a correct way is highly crucial. Traditionally, time series analysis and Makovian process have been adopted for such forecasting. However, these methods are not adequate in predicting context data, only because most of context data are represented as nominal scale. To resolve these limitations, the alignment-prediction algorithm has been suggested for context prediction, especially for future context from the low-level context. Recently, an ontological approach has been proposed for guided context prediction without context history. However, due to variety of context information, acquiring sufficient context prediction knowledge a priori is not easy in most of service domains. Hence, the purpose of this paper is to propose a novel context prediction methodology, which does not require a priori knowledge, and to increase accuracy and decrease elapsed time for service response. To do so, we have newly developed pattern-based context prediction approach. First of ail, a set of individual rules is derived from each context attribute using context history. Then a pattern consisted of results from reasoning individual rules, is developed for pattern learning. If at least one context property matches, say R, then regard the pattern as right. If the pattern is new, add right pattern, set the value of mismatched properties = 0, freq = 1 and w(R, 1). Otherwise, increase the frequency of the matched right pattern by 1 and then set w(R,freq). After finishing training, if the frequency is greater than a threshold value, then save the right pattern in knowledge base. On the other hand, if at least one context property matches, say W, then regard the pattern as wrong. If the pattern is new, modify the result into wrong answer, add right pattern, and set frequency to 1 and w(W, 1). Or, increase the matched wrong pattern's frequency by 1 and then set w(W, freq). After finishing training, if the frequency value is greater than a threshold level, then save the wrong pattern on the knowledge basis. Then, context prediction is performed with combinatorial rules as follows: first, identify current context. Second, find matched patterns from right patterns. If there is no pattern matched, then find a matching pattern from wrong patterns. If a matching pattern is not found, then choose one context property whose predictability is higher than that of any other properties. To show the feasibility of the methodology proposed in this paper, we collected actual context history from the travelers who had visited the largest amusement park in Korea. As a result, 400 context records were collected in 2009. Then we randomly selected 70% of the records as training data. The rest were selected as testing data. To examine the performance of the methodology, prediction accuracy and elapsed time were chosen as measures. We compared the performance with case-based reasoning and voting methods. Through a simulation test, we conclude that our methodology is clearly better than CBR and voting methods in terms of accuracy and elapsed time. This shows that the methodology is relatively valid and scalable. As a second round of the experiment, we compared a full model to a partial model. A full model indicates that right and wrong patterns are used for reasoning the future context. On the other hand, a partial model means that the reasoning is performed only with right patterns, which is generally adopted in the legacy alignment-prediction method. It turned out that a full model is better than a partial model in terms of the accuracy while partial model is better when considering elapsed time. As a last experiment, we took into our consideration potential privacy problems that might arise among the users. To mediate such concern, we excluded such context properties as date of tour and user profiles such as gender and age. The outcome shows that preserving privacy is endurable. Contributions of this paper are as follows: First, academically, we have improved sequential matching methods to predict accuracy and service time by considering individual rules of each context property and learning from wrong patterns. Second, the proposed method is found to be quite effective for privacy preserving applications, which are frequently required by B2C context-aware services; the privacy preserving system applying the proposed method successfully can also decrease elapsed time. Hence, the method is very practical in establishing privacy preserving context-aware services. Our future research issues taking into account some limitations in this paper can be summarized as follows. First, user acceptance or usability will be tested with actual users in order to prove the value of the prototype system. Second, we will apply the proposed method to more general application domains as this paper focused on tourism in amusement park.