• 제목/요약/키워드: Gower's distance

검색결과 1건 처리시간 0.013초

콘텐츠 속성에 따른 계층적 그룹화 추천시스템: 'The Movie Dataset' 분석사례연구 (Hierarchical grouping recommendation system based on the attributes of contents: a case study of 'The Movie Dataset')

  • 김윤경;여인권
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.833-842
    • /
    • 2020
  • 넷플릭스, 아마존, 유튜브 등 대형 플랫폼에서는 고객의 다양한 정보를 활용하여 정밀한 추천시스템을 마련하고 여기서 추천된 상당수의 아이템이 실제 구매로 이어지고 있다. 본 논문에서는 추천 컨텐츠의 속성에 따라 사용자의 선호도에 차이가 있을 것이라고 예상하고 콘텐츠의 속성에 따라 군집분석을 실시하였다. 속성의 형태와 관계없이 사용할 수 있도록 Gower 거리를 사용했다. 본 논문에서는 영화 평점 사이트인 'The Movie Dataset'의 자료를 이용하여 영화의 기본정보인 장르, 감독 및 배우 변수를 바탕으로 사용자를 계층적으로 분류하고 영화를 추천하였다. 본 논문에서 제안한 추천 시스템을 평가하기 위하여 각 사용자 그룹별로 훈련자료와 검증자료로 나누어 정밀도를 살펴보았다. 그 결과 UBCF보다 월등히 높은 정밀도를 갖는 것으로 나타났다.