Development and Application of An Adaptive Web Site Construction Algorithm

적응형 웹 사이트 구축을 위한 연관규칙 알고리즘 개발과 적용

  • 최윤희 (서울오류남초등학교) ;
  • 전우천 (서울교육대학교 컴퓨터교육과)
  • Published : 2009.06.30


Advances in information and communication technologies are changing our society greatly. In knowledge-based society, information can be obtained easily via communication tools such as web and e-mail. However, obtaining right and up-to-date information is difficult in spite of overflowing information. The concept of adaptive web site has been initiated recently. The purpose of the site is to provide information only users want out of tons of data gathered. In this paper, an algorithm is developed for adaptive web site construction. The proposed algorithm is based on association rules that are major principle in adaptive web site construction. The algorithm is constructed by analysing log data in web server and extracting meaning documents through finding behavior patterns of users. The proposed algorithm has the following characteristics. First, it is superior to existing algorithms using association rules in time complexity. Its superiority is proved theoretically. Second, the proposed algorithm is effective in space complexity. This is due to that it does not need any intermediate products except a linked list that is essential for finding frequent item sets.

컴퓨터의 보급과 인터넷의 발달로 인해 데이터의 유통은 증가하고 있으나 전통적인 방법으로는 가치 있고 의미 있는 정보를 획득하는 것은 어렵다. 또한, 정보화 사회에서의 많은 정보 중에서 자신에게 알맞은 정보를 탐사하는 데이터 마이닝의 필요성이 대두되고 있다. 또한 사용자들의 편리한 인터넷 항해를 돕고 적절한 정보를 제공할 수 있는 적응형 웹 사이트에 관한 연구도 필요하다. 본 연구의 목적은 사용자들에게 연관성이 있는 웹 페이지를 연결해 주는 적응형 웹 사이트 구축을 위해 웹 로그 분석을 통한 웹 사이트 사용자들의 행동 패턴을 발견하는 연관규칙 알고리즘의 개발에 있다. 데이터 마이닝의 기법 중에서 연관규칙은 웹 사이트에 접속하는 사용자들의 행동을 파악하는데 효과적이다. 본 논문에서는 웹 사용 마이닝을 이용하여 웹 서버의 로그 데이터를 분석하여 트랜잭션을 구성하고, 사용자들의 행동 패턴을 발견하기 위한 의미 있는 문서만을 추출하여 추출된 문서를 대상으로 발견한 빈발 항목으로 연결리스트를 구성하며, 빈발 패턴을 찾아 웹 페이지에 적용하는 일련의 알고리즘을 제안한다. 제안한 알고리즘의 특징은 첫째, 빈발패턴 발견을 위해 생성하는 연결리스트 이외에는 마이닝 과정에서 다른 중간생성물이 필요하지 않으므로 공간 사용면에 있어 효율적이다. 둘째, 기존의 연관규칙 알고리즘에 비해 데이터 베이스의 스캔 횟수를 줄이고, 시간복잡도를 개선하였다.



  1. 고경자, 웹 마이닝을 이용한 적응형 웹 사이트 구축에 관한 연구, 석사학위논문, 경기대학교, 2001
  2. 김영태, 웹 로그와 구매 DB를 이용한 개인화 시스템에 관한 연구, 석사학위논문, 조선대학교, 2004
  3. 박인창, L2-tree 기반의 빈발항목집합 탐사 기법, 석사학위논문, 연세대학교, 2003
  4. 박종배, 클릭스트림 분석을 이용한 사용자별 메뉴 생성 시스템의 설계 및 구현, 석사학위논문, 순천대학교, 2005
  5. indeutation 오근정, 쇼핑몰의 상품간 연관규칙 탐색을 위한 빈발항목 발견에 관한 연구 : Matrix 접근법, 석사학위논문, 대전대학교, 2004
  6. 이정민, 연관규칙을 이용한 적응형 학교 웹사이트 구축 알고리즘, 석사학위논문, 서울교육대학교, 2005
  7. 주종성, 다중항목지지도를 고려한 수정된 H-마이닝 빈발 패턴탐색, 석사학위논문, 한양대학교, 2005
  8. 박종수, 웹 로그 파일에서 빈발항목 집합 탐사, 성신여자대학교 기초과학연구지 Vol.17 pp.1-16, 1999
  9. Pei, J., Pattern growth methods for frequent pattern mining, the degree of doctor of philosophy, Simon Fraser university, 2002
  10. Dai, Y. M., A data mining system for mining library borrowing history records, A Master's Thesis, National Chiao-Tung University, 2001
  11. Agrawl, R., Srikant, R., Fast algorithm for mining association rules, In Proc. 1994 Int. Conf. Very Large Data Bases (VLDB'94), pp.487-499, 1994
  12. Borgelt, C., Keeping things simple : Finding frequent item sets by recursive elimination, Workshop Open Source Data Mining Software (OSDM'05, Chicago, IL), pp.66-70, 2005
  13. Goebel, M., Gruenwald, L., A survey of data mining software tools, ACM SIGKDD Exploration Vol.1 Issue1, pp.20-33, 1999
  14. Gopalan, R. P., Sucahyo, Y. G., Fast frequent itemset mining using compressed data representation, Applied Informatics 2003. pp.1203-1208, 2003
  15. Mehmed Kantardzic, Data Mining : Concepts, Models, Methods and Algorithms, Wiley-IEEE Press, 2002
  16. Pei, J., Han, H., Lu, H., Nishio, S., Tang, S., Yang, D., H-mine: hyper-struct mining of frequent patterns in large databases, In Proceedings of the 2001 IEEE International Conference on Data Mining (ICDM'01), pp.441-448, 2001
  17. Prasetyo, B., Pramudiono, I., Kitsuregawa, M., Hmine- rev: toward H-mine parellelization on mining frequent patterns in large databases, 情報處理學會技術硏究報告 2005-DBS-137(44), No.68, pp.329-336, 2005