A Personalized XML Documents Delivery System

사용자 정보에 기반한 XML문서 전달 시스템

  • 유상원 (서울대학교 컴퓨터공학부) ;
  • 이형동 (서울대학교 컴퓨터공학부) ;
  • 김형주 (서울대학교 컴퓨터공학부)
  • Published : 2003.10.01


There have been many filtering systems covering mail or news. Documents filtered by them consist of general text or HTML. XML is emerging as a new standard for information exchange. So, filtering systems need new approaches in dealing with XML documents. Our system suggests a method to describe user profiles with XML's ability to represent schema and structure. An user profile is made from DTD information and it is supposed to point the specific part of a document conforming to the DTD. More, it is different from the existing systems in extracting part of a document. An user profile is reflected in XML query to get part of an XML document.

그동안 메일이나 뉴스등을 필터링하여 사용자에게 전달해 주는 많은 시스템들이 개발되었다. 이 시스템들이 필터링하는 문서들은 일반 덱스트나 HTML으로 작성된 것들이었다. 새로운 정보 교환 표준으로 떠오르고 있는 XML은 문서를 필터링하는 시스템들에 있어서도 다른 접근 방법을 요구하고 있다. 본 논문에서 구현한 시스템은 XML이 가진 스키마 표현 능력과 구조 정보를 이용하여 사용자 정보를 기술하는 방법을 제안한다. 사용자 정보는 DTD로부터 추출된 정보를 이용하여 DTD를 따르는 문서내의 특정 부분을 가리킬 수 있도록 만들어진다. 또한 기존의 필터링 시스템이 문서단위의 필터링에 초점을 맞추고 있는 것을 개선하기 위해 문서에서 사용자가 원하는 부분만을 제공하고 있다. 사용자 정보는 XML질의에 반영되어 XML로 이루어진 문서에서 일부분을 얻어내는데 사용된다.



  1. Alin Deutsch, Mary Fernandez, Daniela Florescu, Alon Levy, and Dan Suciu. XML-QL: A Query Language for XML. http://www.w3.org/TRI NOTE-xml-ql, 1998
  2. S. Abiteboul, D. Quass, J. McHugh, J. Widom, and J. Wiener. The Lorel Query Language for Semistructured Data. International Journal on Digital Library, 1(1), 4, 1997 https://doi.org/10.1007/s007990050005
  3. J. Clark and S. DeRose. XML Path Language (XPath) v1.0. http://www.w3.org/TR/XPath
  4. J. Clark XSL Transformation v1.0. http://www.w3c.org/TR/xslt
  5. Dan Suciu. Semistructured data and XML in FODO, 1998
  6. S. Abiteboul, P. Buneman and D. Suciu, 'Data on the Web,' 38-44. Morgan Kaufmann Publishers. San Francisco, CA, 2000
  7. P. Buneman, S. Davidson, G. Hillebrand, and D. Suciu. A query language and optimization techniques for unstructured data. Proc. ACM SIGMOD Conf., 1996 https://doi.org/10.1145/233269.233368
  8. M. Franklin and S. Zdonik. Data in Your Face: Push Technology in Perspective. Proc, ACM SIGMOD Conf., 1998 https://doi.org/10.1145/276304.276360
  9. P. W. Foltz and S. T. Dumais. Personalized Information Delivery: an analysis of information filtering methods. CACM, 35(12):51-60, December 1992 https://doi.org/10.1145/138859.138866
  10. T. Yan and H. Garcia-Molina. The SIFT Information Dissemination System. ACM TODS, 24(4): 529-565, 1999 https://doi.org/10.1145/331983.331992
  11. R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley. 1999
  12. Burkowski F. Retrieval activities in a database consisting of heterogeneous collections of structured texts. In SIGIR 1992 https://doi.org/10.1145/133160.133185
  13. Gonzalo Navarro and Ricardo A. Baeza-Yates, Proximal nodes: A model to query document database by content and structure, Information Systems, 15(4), 1997 https://doi.org/10.1145/263479.263482
  14. xml.apache.org. Coccon. http://xml.apache.org/cocoon/index.html, 2002
  15. Reuters. Reuter Internet Delivery System. http://about.reuters.com, 2002
  16. Associated Press. AP MegaSports XML Solution http://www.apdigitalnews.com/megasports, 2002
  17. Internaltional Press Telecommunications Council. News Industry Text format. http://www.itpc.org, 2001
  18. International Press Telecommunications Council. XML DTD for sports, http://www.sportsml.com. 2001
  19. M. Altinel and M. Franklin, 'Efficient Filtering of XML Documents for Selective Dissemination of Information,' VLDB 2000: 53-64
  20. Chee Yong Chan, Pascal Felber, Minos N. Garofalakis, and Rajeev Rastogi. Efficient filtering of XML documents with XPath experssions. in ICDE 2002 https://doi.org/10.1007/s00778-002-0077-6
  21. Julian Kupiec, Jan O. Pedersen and Francine Chen. A trainable document summarizer. In SIGIR, 1995 https://doi.org/10.1145/215206.215333
  22. The New York Times, http://www.nytimes.com/, 2001
  23. Mark Wutka. DTD parser. http://www.wutka.com/dtdparser.html, 2000
  24. Megginson Technologies, 'SAX 1.0 : a free API for event-based XML parsing,' http://www.megginson.com/SAX/index.html, 1998
  25. Xerces2. Java XML Parser, http://xml.apache.org/xerces2-j/index.html, 2001
  26. Xalan, Java XSLT processor, http://xml.apache.org/xalan-j/index.html 2001