Similarity Measurement with Interestingness Weight for Improving the Accuracy of Web Transaction Clustering

웹 트랜잭션 클러스터링의 정확성을 높이기 위한 흥미도 가중치 적용 유사도 비교방법

  • Kang, Tae-Ho (Dept of Information & Industrial Engineering, Chung-Buk University) ;
  • Yoo, Jae-Soo (Dept of Information & Communication Engineering, Chung-Buk University)
  • 강태호 (충북대학교 정보산업공학과) ;
  • 유재수 (충북대학교 정보통신공학과)
  • Published : 2002.11.15

Abstract

최근 들어 웹사이트 개인화(Web Personalization)에 관한 연구가 활발히 진행되고 있다. 웹 개인화는 클러스터링과 같은 데이터 마이닝 기법을 이용하여 개개의 사용자에게 가장 흥미를 갖을만한 URLs의 집합을 예측하는 것이라 할 수 있다. 기존에는 웹 트랜잭션을 클러스터링 하기 위해서 사용자의 방문여부에 따라 트랜잭션을 비트벡터(bit vector)로 표현하였다. 하지만 이것은 웹 트랜잭션의 클러스터링에 있어서 사용자의 흥미를 배제하고 단순히 방문여부만을 반영하게 된다. 이에 본 논문에서는 사용자의 흥미도(Interestingness)를 반영할 수 있도록 보완된 웹 트랜잭션 모델을 제시하고 제안된 트랜잭션 모델을 적용한 유사도 비교방법을 제안한다. 그리고 성능평가를 통하여 제안한 방법이 기존 방법에 비해 클러스터링의 정확성을 높임을 보인다.

Keywords