An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진

  • 임형준 (충남대학교 컴퓨터공학과) ;
  • 김재훈 (한국과학기술정보연구원) ;
  • 이규철 (충남대학교 컴퓨터공학과)
  • Received : 2010.09.27
  • Accepted : 2010.11.05
  • Published : 2010.11.30

Abstract

Recently, it is necessary to process real time sensor data, which is generated from ubiquitous environments. Data, which are written by XML, are small, but, large volumes of data. Therefore, weneed to use an efficient method for processing a large amount of it. An XQuery has two types for sensor data: one is to get sensor identification and value from sensor data; the other is restructuring for user's convenience. Existing XQuery engines don't have efficient method for batch processing of sensor data. This paper proposed the twig query processing over reverse path summary, and we developed and applied restructuring batch processing method for real time processing of a large amount of sensor data. Finally, we do performance evaluation using XMark and RFID EPC data, and comparison analysis with MonetDB/XQuery and Berkeley DB XML.

최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.

Keywords

References

  1. 유승화, "표준화논단 : RFID/USN 표준화 추진방향", TTA저널, 제94호, 2004, pp. 12-18.
  2. Albercht Schmidt, Florian Waas, Martin Kersten, Michael J. Carey, loana Monolescu and Ralph Busse, "XMark : A Benchmark for XML Data Management," Proceedings of the 28th international conference on Very Large Data Bases, 2002, pp. 974-985.
  3. Auto-ID Center, "PML Core Specification 1.0," Auto-ID Center Recommendation, 2003.
  4. Daniela Florescu and Donald Kossmann, "Storing and Querying XML Data using an RDBMS," Bulleting of the IEEE Computer Society Technical Committee on Data Engineering, 1999, pp. 27-34.
  5. FastDB 2.41, http://www.ispras.ru/~knizhnik/fastdb.html
  6. Michael Stonebraker and Ugur Cetintemel. "One Size Fits All : An Idea Whose Time has Come and Gone," In Proceedings of the International Conference on Data Engineering(ICDE), 2005, pp. 2-11.
  7. Ronald Bourret, "XML Database Products : Native XML Databases," http://www.rpbourret.com/xml/ProdsNative.htm, 2005.
  8. Scott Boag, Don Chamberlin, Mary F. Fernandez, Daniela Florescu, Jonathan Robie and Jerome Simeon, "XQuery 1.0 : An XML Query Language," Recommendation, W3C, http://www.w3.org/TR/xquery, 2007.
  9. Su-Cheng Haw and G. S. V. Radha Krishna Rao, "Path Query Processing in Large Scale XML Databases," Asian Network for Scientific Information, 2007, pp. 2736-2743.
  10. Igor Tatarinov, Stratis D. Viglas, Kevin Beyer, Jayavel Shanmugasundaram, Eugene Shekita and Chun Zhang, "Storing and Querying Ordered XML Using a Relational Database System," In Proceedings of ACM SIGMOD, 2002, pp. 204-215.
  11. XQilla, http://xqilla.sourceforge.net/HomePage
  12. Zografoula Vagena, Mirella M. Moro and Vassilis J. Tsotras, "Twig Query Processing over Graph-Structured XML Data," Proceedings of the 7th International Workshop on the Web and Databases, 2004, pp. 43-48.