• Title/Summary/Keyword: XPath 패턴

Search Result 5, Processing Time 0.016 seconds

A Lattice Structure for Efficiently Maintaining Homomorphism Information Among XPath Patterns (XPath패턴들간의 준동형 정보를 효율적으로 유지하기 위한 래티스 구조)

  • Yoo, Sang-Hyun;Son, Jin-Hlrun;Kim, Myoung-Ho
    • Journal of KIISE:Databases
    • /
    • v.32 no.3
    • /
    • pp.326-333
    • /
    • 2005
  • Many XML applications use XPath Patterns as a query language for XML documents. Two XPath patterns may have containment relationship, and the containment problem between two XPath patterns is a problem that determines whether one XPath pattern contains another XPath Pattern. Although the containment problem occurs in many applications, it is known as a co-NP complete. A homomorphism problem, which is a sufficient condition for the containment problem, is solved in polynomial time. We first discuss applications that replace the containment problem with the homomorphism problem, and maintaining homomorphism information among XPath patterns will benefit those applications. Then, we propose a lattice structure, called POX (Partially Ordered Set of XPath Patterns), and develop algorithms for maintaining it. As our analyses show, the algorithms can efficiently maintain POX in polynomial time.

FiST: XML Document Filtering by Sequencing Twig Patterns (가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링)

  • Kwon Joon-Ho;Rao Praveen;Moon Bong-Ki;Lee Suk-Ho
    • Journal of KIISE:Databases
    • /
    • v.33 no.4
    • /
    • pp.423-436
    • /
    • 2006
  • In recent years, publish-subscribe (pub-sub) systems based on XML document filtering have received much attention. In a typical pub-sub system, subscribing users specify their interest in profiles expressed in the XPath language, and each new content is matched against the user profiles so that the content is delivered only to the interested subscribers. As the number of subscribed users and their profiles can grow very large, the scalability of the system is critical to the success of pub-sub services. In this paper, we propose a novel scalable filtering system called FiST(Filtering by Sequencing Twigs) that transforms twig patterns expressed in XPath and XML documents into sequences using Prufer's method. As a consequence, instead of matching linear paths of twig patterns individually and merging the matches during post-processing, FiST performs holistic matching of twig patterns with incoming documents. FiST organizes the sequences into a dynamic hash based index for efficient filtering. We demonstrate that our holistic matching approach yields lower filtering cost and good scalability under various situations.

XML Document Filtering based on Segments (세그먼트 기반의 XML 문서 필터링)

  • Kwon, Joon-Ho;Rao, Praveen;Moon, Bong-Ki;Lee, Suk-Ho
    • Journal of KIISE:Databases
    • /
    • v.35 no.4
    • /
    • pp.368-378
    • /
    • 2008
  • In recent years, publish-subscribe (pub-sub) systems based on XML document filtering have received much attention. In a typical pub-sub system, subscribed users specify their interest in profiles expressed in the XPath language, and each new content is matched against the user profiles so that the content is delivered to only the interested subscribers. As the number of subscribed users and their profiles can grow very large, the scalability of the system is critical to the success of pub-sub services. In this paper, we propose a fast and scalable XML filtering system called SFiST which is an extension of the FiST system. Sharable segments are extracted from twig patterns and stored into the hash-based Segment Table in SFiST system. Segments are used to represent user profiles as Terse Sequences and stored in the Compact Segment Index during filtering. Our experimental study shows that SFiST system has better performance than FiST system in terms of filtering time and memory usage.

Client Segmentation using XML-based Multiform Profile (XML 기반 여러 형태 프로파일을 이용한 고객세분화)

  • An Hyoung-Keun;Lee Dan-Young;Koh Jae-Jin
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.88-90
    • /
    • 2006
  • 최근 정보 통신기술의 발전으로 인하여 전자상거래가 확산되고 있는 실정이며, 이용하는 고객 또한 상당히 증가하고 있다. 고객의 활발한 구매 거래 활동으로 하루에도 아주 많은 양의 데이터가 생성되고 있는 실정이다. 이에 전자상거래의 웹 사이트 관리자나 경영자는 고객의 구매형태나 패턴의 특징을 파악하여 보다 효율적인 서비스를 고객에게 제공하기 위하여 현재까지 유사그룹의 고객 세분화를 적용하는 연구가 이루어지고 있다. 본 논문에서는 전자상거래에서 고객들의 정보를 분석하여 개인화하기 위한 방법으로 사용되는 고객 프로파일을 이용하여 고객세분화 하는데 적용을 하고자 한다. 기존 고객세분화의 통계적인 분석이 아닌 XML 기반의 고객 정보를 XPath를 이용하여 고객세분화에 필요한 규칙을 생성하고, 그 규칙을 바탕으로 고객 프로파일을 생성하는 방법과 프로파일을 이용한 군집에 따른 분석 결과 및 추천서비스를 소개하고자 한다.

  • PDF

Design and Implementation User Profile Creation System using XML Document (XML문서를 이용한 사용자 프로필 생성 시스템 설계 및 구현)

  • 권순덕;고재진;정승훈;양상석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.19-21
    • /
    • 2003
  • 본 논문은 다양한 인터넷 컨텐츠를 제공하는 시스템에서 XML문서를 이용한 사용자 프로필 생성 시스템을 설계하고 구현하였다. 본 시스템은 구매와 같은 하나의 트랜잭션이 발생하기 전에 사용자 구매 패턴을 분석하기 위해서 필요한 프로필을 정의하는 모듈과 이를 적용한 사용자 프로필 생성 모듈로 구성되어 있다. 프로필 정의 단계에서는 XML의 DTD를 이용해서 사용자 프로필 규칙을 정의하고 저장한다. 그리고 사용자 프로필 생성 모듈에서는 트랜잭션이 일어날 때 발생되는 XML문서를 파싱해서 XPath형태로 저장되어 있는 규칙 리스트에 적용한 후 필요한 XML문서의 요소 값들을 이용해서 사용자 프로필을 생성한다. 또한 추가적인 장점으로는 하나의 복잡한 모듈이나 패키지로만 제공되어지는 규칙을 사용하지 않고 관리자나 사이트를 운용하는 운영자가 직접 규칙을 정의하고 규칙에 대한 설명을 통해서 자신의 환경에 맞는 사용자 프로필에 대한 정보 추출 및 CRM(Customer Relationship Management)을 지원 할 수 있다.

  • PDF