Proceedings of the KAIS Fall Conference (한국산학기술학회:학술대회논문집)
- 2008.11a
- /
- Pages.49-52
- /
- 2008
Design and implementation of web-robot using XML
XML을 이용한 웹 문서 수집기 설계 및 구현
- Lee, Sae-Byuk (Dept of Computer Engineering, Hanshin University) ;
- Lim, Heui-Seok (Dept of Computer Science Education, Korea University)
- Published : 2008.11.27
Abstract
웹2.0, RIA(Rich Internet Application)의 발전으로 웹 기반 서비스가 다양해지고 기존의 응용프로그램 역시 웹 기반 인터페이스로 제공되면서 사용자 또한 단순 사용자가 아닌 서비스를 제공하는 컨슈머(Consumer)의 형태가 되었다. 따라서 웹 문서는 더욱 방대해 지고 검색, 분류, 색인 등을 위해서 웹문서의 수집이 새로운 형태로 필요하게 되었다. 그러나 기존의 데이터베이스 사용 방법이나, 문서의 전문을 파일형식으로 저장하는 방법은 웹문서를 이용하여 다양한 컨텐츠를 제공하기에 적합하지 않다. 그러므로 본 연구는 웹 문서를 파싱(Parsing)하여 필요한 부분을 XML파일 형태로 저장하여, 재사용성을 높이는데 초점을 맞추어 HTML을 파싱하고 자동으로 임의의 파일을 수집하는 문서수집기를 구현하게 되었다.
Keywords