• 제목/요약/키워드: XPath pattern

검색결과 3건 처리시간 0.019초

XPath패턴들간의 준동형 정보를 효율적으로 유지하기 위한 래티스 구조 (A Lattice Structure for Efficiently Maintaining Homomorphism Information Among XPath Patterns)

  • 유상현;손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.326-333
    • /
    • 2005
  • 많은 XML 응용들은 XML 문서에 대한 질의 언어로 XPath 패턴을 사용한다. XPath 패턴들 사이에는 포함 관계가 존재할 수 있으며, 하나의 XPath 패턴이 다른 XPath 패턴을 포함하는지를 결정하는 문제를 포함 문제라고 한다. 포함 문제는 많은 응용들에서 발생하고 있지만 co-NP complete 문제로 알려져 있다. 한편 XPath 패턴들 사이의 준동형 관계는 포함 관계의 충분 조건이면서 다항 시간에 얻을수 있다. 본 논문에서는 준동형 문제가 포함 문제를 대체하여 유용하게 쓰일 수 있는 응용들에 대해 논의하고, XPath 패턴들 사이의 준동형 정보를 유지하면 많은 이점을 얻을 수 있다는 사실에 대해 논의한다. 그리고 XPath 패턴들 사이의 준동형 관계를 유지하기 위하여 POX(Partially Ordered Set of XPath Patterns)라는 래티스 구조를 제안하고, 그것을 유지할 수 있는 알고리즘을 개발한다. 알고리즘 분석을 보면 알 수 있듯이, 본 논문에서 제안하는 알고리즘은 다항 시간에 POX를 효율적으로 유지할 수 있다.

가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링 (FiST: XML Document Filtering by Sequencing Twig Patterns)

  • 권준호;;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.423-436
    • /
    • 2006
  • 최근 XML 문서 필터링에 기반한 출판 -구독 (publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판 구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판 구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 XPath 로 명세된 가지형 패턴과 입력 XML 문서들을 Prufer의 방법을 사용하여 시퀀스로 변환하는 FiST라 불라는 새로운 필터링 시스템을 제안한다. FiST 시스템은 가지형 패턴을 구성하는 선형 경로들에 대하여 각각 매칭을 수행하고 후처리 과정에서 그 결과들을 병합하는 방법을 이용하는 대신에 가지형 패턴 전체를 사용하여 입력 문서에 대하여 매칭을 수행한다. 또한 효율적인 필터링을 위하여 시퀀스들을 해시 기반의 동적 인덱스로 구성한다. 실험 결과를 통해 전체 매칭 접근 방법이 다양한 환경에서 낮은 필터링 비용과 좋은 확장성을 가짐을 알 수 있다.

세그먼트 기반의 XML 문서 필터링 (XML Document Filtering based on Segments)

  • 권준호;;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.368-378
    • /
    • 2008
  • 최근 XML 문서 필터링에 기반한 출판-구독(publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판-구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판-구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 FiST 시스템을 확장한 세그먼트 기반의 XML 문서 필터링 시스템인 SFiST 시스템을 제안한다. SFiST 시스템은 XML 문서 필터링에서 중복된 처리를 없애기 위해서 가지형 패턴의 사용자 프로파일에서 세그먼트를 추출하여 해시 기반의 세그먼트 테이블에 저장하고 유지한다. 이 세그먼트는 사용자 프로파일을 터스 시퀀스 형태로 표현하는데 이용되고, 효율적인 필터링을 위한 컴팩트 시퀀스 인덱스에도 사용된다. 실험을 통하여 세그먼트 기반의 SFiST 시스템이 이전의 연구인 FiST 시스템보다 좋은 성능을 가지고 있음을 보였다.