• Title/Summary/Keyword: XML 데이터 필터링

Search Result 18, Processing Time 0.025 seconds

WFilter (Weighted Filter) for XML filtering (XML 필터링을 위한 WFilter(Weighted Filter))

  • 최정필;최오훈;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.253-255
    • /
    • 2003
  • XML 문서를 비롯하여 인터넷을 통해 교환되는 문서의 비약적인 증가로 인하여, 불필요한 문서에 대한 필터링 및 문서 내의 데이터를 필터링하여 정보를 선택적으로 사용하고자 하는 사용자의 요구가 증대되었다. 기존 XML 필터링 방식은 질의 구조에 의존적이기 때문에, 질의 증가에 따른 필터링 인덱스 구성 및 유지의 문제점을 야기할 수 있다. 본 논문에서는 정보 추출 분야에서 널리 사용되는 단어 벡터의 개념을 사용하여 선택적으로 질의에 가중치를 주어 데이터를 효율적으로 추출할 수 있는 XML WFilter (Weighted Filtering) 기법을 제안한다.

  • PDF

Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries (XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법)

  • Yeo, Dae-Hwi;Lee, Jong-Hak
    • Journal of Information Technology and Architecture
    • /
    • v.10 no.1
    • /
    • pp.123-135
    • /
    • 2013
  • This paper presents a two-dimensional grouping index(2DG-index) for efficient processing of XML filtering queries. Recently, many index techniques have been suggested for the efficient processing of structural relationships among the elements in the XML database such as an ancestor- descendant and a parent-child relationship. However, these index techniques focus on simple path queries, and don't consider the path queries that include a condition value for filtering. The 2DG-index is an index structure that deals with the problem of clustering index entries in the twodimensional domain space that consists of a XML path identifier domain and a filtering data value domain. For performance evaluation, we have compared our proposed 2DG-index with the conventional one dimensional index structure such as the data grouping index (DG-index) and the path grouping index (PG-index). As the result of the performance evaluations, we have verified that our proposed 2DG-index can efficiently support the query processing in XML databases according to the query types.

A Keyword-based Filtering Technique of Document-centric XML using NFA Representation (NFA 표현을 사용한 문서-중심적 XML의 키워드 기반 필터링 기법)

  • Lee Kyoung-Han;Park Seog
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.25-27
    • /
    • 2006
  • XPath 명세는 XML 원소 내용을 필터링하기 위한 질의어 작성이 어렵다. 본 논문은 이러한 문제점을 해결하기 위해 SQL의 LIKE 연산자에서 사용되던 특별한 매칭 문자 '%' 를 허용한 확장된 XPath 명세와 그것을 표준 질의어로 사용하는 문서-중심적 XML 필터링 기법인 Pfilter를 제안한다. Pfilter는 값-기반 술어(value-based predicate)에서 피연산자의 공통 앞부분 문자를 공유하여 값-기반 술어의 처리 성능을 향상시킨다. 또한 본 논문은 Pfilter와 대표적인 데이터-중심적 XML 필터링 기법인 Yfilter를 값-기반 술어 처리의 확장성과 효율성에 대해 비교하고 Pfilter의 값-기반 술어 삽입, 삭제, 처리 결과를 제공한다.

  • PDF

Design and Implementation of Filtering Management Scheme for Synchronization in the Realtime RFID Middleware System (실시간 RFID 미들웨어시스템에서의 동기화를 고려한 필터링관리 기법의 설계 및 구현)

  • Park, Byoung-Seob
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.8
    • /
    • pp.50-58
    • /
    • 2007
  • We design a filtering management scheme with synchronization function under a realtime RFID middleware system for larger-scale data processing. The application interface(AI) is to support a various access protocol, HTTP, XML, JMS, and SOAP for the RFID applications. Generally, the synchronization problem is occurred in multiple accessing of clients for single filtering file. In this paper, we implement a filtering management scheme supporting the synchronization using the filter management process, and then demonstrate the RFID middleware filtering scheme.

SemFilter: A Simple and Efficient Semantic XML Message Filtering (SemFilter: 단순하며 효율적인 시맨틱 XML 메시지 필터링)

  • Kim, Jae-Hoon;Park, Seog
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.7
    • /
    • pp.680-693
    • /
    • 2008
  • Recent studies on XML filtering assume that all data sources follow a single global schema defined in a filtering system. However, beyond this simple assumption, a filtering system can provide a service that allows data publishers to have their own schema; hence, the data sources will become heterogeneous. The number of data sources is expected to be large in a filtering system and the data sources are frequently published, updated, and disappeared, that is, dynamic. In this paper, we introduce implementing a simple and efficient XPath query translation method for such a dynamic environment. The method is especially targeted for a query which is composed based only on users' knowledge and experience without a graphical guidance of the global schema. When a user queries a large number of heterogeneous data, there is a high possibility that the query is not consistent with the same local schema assumed by the user. Our query translation method also supports a function for this problem. Some experimental results for query translation performance have shown that our method has reasonable performance, and is more practical than the existing method.

MPEG-7 Content-Based Retrieval System using XML (XML을 이용한 MPEG-7 내용기반 검색 시스템)

  • 조철범;박만곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.632-635
    • /
    • 2004
  • 디지털 정보기술의 급속한 발전과 고속 네트워크의 보급으로 멀티미디어 데이터가 급격하게 늘어나고 있다. 이러한 데이터들을 빠르고 정확하게 검색하기 위하여 가장 중요한 기반이 되는 것이 데이터의 적절한 표현이다. 최근 최종화 단계를 거친 MPEG-7은 멀티미디어 데이터에 대한 구조화 및 의미 정보를 제공함으로써 효율적인 검색과 필터링을 가능하게 하는 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본논문에서는 MPEG-7의 표준화와 내용기반 검색 시스템을 소개하고 MPEG-7의 비주얼 기술자를 내용 정보 간의 상호 연관성을 표현하기에 적합한 XML로 구조화 하여 효과 적인 검색이 가능한 내용기반 검색 시스템을 제안한다.

  • PDF

XML Streaming Data Filtering using CXQuery (CXQuery 를 이용한 XML 스트리밍 데이터 필터링)

  • Kim, So-Ra;Lee, Wol-Young;Yong, Hwan-Seung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.117-120
    • /
    • 2005
  • XML 은 환경에 독립적인 특징으로 인하여 다양한 환경에서 데이터 교환을 위한 표준으로서 자리잡아가고 있다. 특히 분산 환경에서 스트림 데이터들도 XML 을 이용하여 표현되고 있는데 이러한 데이터에 대해 기존의 질의 언어를 사용하여 질의하기 위해서는 사용자들은 XML 문서의 구조를 알아야 하고, 같은 질의의 내용일지라도 XML 문서의 DTD 가 다르게 되면 사용자는 상이한 DTD 에 대해서 모두 다른 질의문을 작성하여야 한다. 이러한 사용자들의 불편함을 없애기 위하여 사용자에게 XML 문서의 구조에 대해서 고려 하지 않아도 검색할 수 있는 CXQuery 의 개념을 도입하여 스트리밍 XML 데이터를 효과적으로 처리할 수 있는 질의 처리 시스템을 구현하였다.

  • PDF

PrimeFilter: An Efficient XML Data Filtering based on Prime Number Indexing (PrimeFilter: 소수 인덱싱 기법에 기반한 효율적 XML 데이타 필터링)

  • Kim, Jae-Hoon;Kim, Sang-Wook;Park, Seog
    • Journal of KIISE:Databases
    • /
    • v.35 no.5
    • /
    • pp.421-431
    • /
    • 2008
  • Recently XML is becoming a de facto standard for online data exchange between heterogeneous systems and also the research of streaming XML data filtering comes into the spotlight. Since streaming XML data filtering technique needs rapid matching of queries with XML data, it is required that the query processing should be efficiently performed. Until now, most of researches focused only on partial sharing of path expressions or efficient predicate processing and they were work for time and space efficiency. However, if containment relationship between queries is previously calculated and the lowest level query is matched with XML data, we can easily get a result that high level queries can match with the XML data without any other processing. That is, using this containment technique can be another optimal solution for streaming XML data filtering. In this paper, we suggest an efficient XML data filtering based on prime number indexing and containment relationship between queries. Through some experimental results, we present that our suggested method has a better performance than the existing method. All experiments have shown that our method has a more than two times better performance even though each experiment has its own distinct test purpose.

Content-Based Dynamic Event Notification System for Collaborative Virtual Environment (협력적 가상환경을 위한 내용기반 동적 이벤트 통지시스템)

  • 장진윤;탁진현;이세훈;왕창종
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.408-410
    • /
    • 2000
  • 이 논문에서는 협력적 가상환경에서 이벤트의 내용에 기반한 동적 이벤트 통지 시스템을 제안한다. 제안된 시스템은 이벤트 송신자와 수신자 사이에 투명성을 제공하며, 다른 시스템에 영향을 주지 않고, 이벤트 수신자를 동적으로 추가, 삭제할 수 있는 노티파이어 모델을 구성한다. 시스템은 기본적인 이벤트 형태들을 정의하고, 다른 환경을 구성하고 있는 특정 응용에 독립적으로 동작하도록 하기 위해서 이벤트들을 XML로 표현한다. 본 시스템은 XML을 사용하여 이벤트를 표현하기 때문에 발생된 이벤트를 로그데이터에 저장할 수 있고, 로그 데이터를 사용하여 이벤트들을 검색하고 필터링할 수 있도록 하여 시스템의 효율성을 향상시켰다. 또한 사용자로 하여금 관심있는 이벤트들을 등록할 수 있도록 하여 필터링의 효율을 높였으며 XML 기반 애플리케이션뿐만 아니라 다른 가상환경의 애플리케이션들 사이의 상호 작용을 가능하게 하는 이벤트 통지 시스템을 설계하였다.

  • PDF

Subtree Mining to extract Association rules from Tree Data (트리 데이터에서 연관규칙 추출을 위한 서브트리 마이닝)

  • Kang, Woo-Jun;Shin, Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.317-320
    • /
    • 2006
  • XML 트리 데이터들로부터 빈번 서브 트리들을 추출하는 기존 방법들은 복잡하고 다수의 입력데이터 스캐닝을 필요로 할 뿐만 아니라 빈번 서브 트리를 구하기 위해 에지 하나하나의 조인 작업을 필요로 하였다. 이는 결과적으로 많은 수행 시간을 요한다. 본 논문에서는 트리데이터를 레벨 별로 나누고 이를 마치 채로 거르듯이 필터링하여 특정 수치 이상의 출현 횟수를 가지는 노드들만을 남겨 빠르게 빈번한 서브 트리를 찾고, 이를 이용하여 XML 연관규칙들을 생성하는 방법을 제시한다. 제시된 방법을 위해서 PairSet 이라는 새로운 자료구조를 도입하였으며, 이를 이용하는 크로스필터링 알고리즘을 개발하여 제시하였다.

  • PDF