The Design of Web Archive System on the WebBase

WebBase 기반 웹 아카이브 시스템의 설계

  • Lee, Min-Hee (Dept of Computer Engineering, Han-Nam University) ;
  • Lee, Moo-Hoon (Dept of Computer Engineering, Han-Nam University) ;
  • Jang, Chang-Bok (Dept of Computer Engineering, Han-Nam University) ;
  • Kim, Dong-Hyuk (Dept of Computer Engineering, Han-Nam University) ;
  • Goh, Byoung-Oh (Dept of Computer Education, Gongju National University of Education) ;
  • Choi, Eui-In (Dept of Computer Engineering, Han-Nam University)
  • 이민희 (한남대학교 컴퓨터공학과) ;
  • 이무훈 (한남대학교 컴퓨터공학과) ;
  • 장창복 (한남대학교 컴퓨터공학과) ;
  • 김동혁 (한남대학교 컴퓨터공학과) ;
  • 고병오 (공주교육대학교 컴퓨터교육과) ;
  • 최의인 (한남대학교 컴퓨터공학과)
  • Published : 2003.11.14

Abstract

웹의 성장으로 사용자는 언제 어디서든지 유용한 정보의 이용이 가능해졌다. 웹이 광범위하게 사용됨에 따라 정보를 획득하기 위해 대다수의 사용자들이 웹을 의존하고 있다. 그러나 웹상의 모든 정보는 정보가 저장되어 있는 서버의 관리자들에 의해 계속적으로 갱신 또는 삭제되어 가고 있어 기존의 정보들은 그것의 중요성 여부와 관계없이 대다수의 정보가 소멸되고 있다. 따라서 오랜 기간에 거쳐 생성된 웹상의 중요 데이터(importance data)들을 효율적으로 활용하기 위한 웹 아카이브(archive) 시스템이 연구되었다. 그러나 현재 존재하는 웹 아카이브 시스템은 갱신되기 이전의 데이터를 다루기 위한 체계적인 처리기법을 제시하지 못하고, 수집된 데이터들에 대한 연관관계를 저장하지 못하여 데이터 관리에 있어 비효율적이라는 문제점을 가지고 있다. 이에 따라 본 논문에서는 웹으로부터 다운로드한 데이터를 레포지토리(repository)에 효율적으로 저장하기 위해 설계된 대표적인 WebBase를 기반으로 하여 갱신되기 이전의 모든 정보들에 대한 내용을 히스토리(history) 저장소내에 저장하여 정보를 효율적으로 활용할 수 있는 웹 아카이브 시스템의 구조를 제안한다.

Keywords