Link Extraction and Validation for Web-page Maintenance

웹 페이지 관리를 위한 링크 추출과 검증

  • 엄정섭 (울산대학교 컴퓨터·정보통신공학부) ;
  • 유대승 (울산대학교 컴퓨터·정보통신공학부) ;
  • 심민석 (울산대학교 컴퓨터·정보통신공학부) ;
  • 이명재 (울산대학교 컴퓨터·정보통신공학부)
  • Published : 2001.10.01

Abstract

웹의 발전에 따라 거대해진 웹사이트들은 서로 복잡하게 얽혀진 링크들로 인해 웹 개발과 유지보수에 큰 어려움이 따른다. 효율적인 웹 개발과 유지보수를 위해서는 웹에서 가장 중요한 정보의 단위인 링크정보들을 추출할 수 있는 방법이 요구된다. 본 논문에서는 웹 브라우저 요청에 의해 반환된 HTTP 헤더분석과 HTML 문서의 태그분석을 통해 링크들을 추출하여 “끊어진 링크”를 찾고, 추출된 “링크요소”들과 서버에 저장된 파일들을 비교하여 “사용되지 않는 파일”들을 찾아주는 “링크 분석기”시스템을 개발함으로 써 웹 개발과 유지보수에 있어서 가장 기본적이면서도 중요한 링크관리에 대한 방법을 제시한다

Keywords