• 제목/요약/키워드: Stream Query Processing

검색결과 124건 처리시간 0.024초

A Review of Window Query Processing for Data Streams

  • Kim, Hyeon Gyu;Kim, Myoung Ho
    • Journal of Computing Science and Engineering
    • /
    • 제7권4호
    • /
    • pp.220-230
    • /
    • 2013
  • In recent years, progress in hardware technology has resulted in the possibility of monitoring many events in real time. The volume of incoming data may be so large, that monitoring all individual data might be intractable. Revisiting any particular record can also be impossible in this environment. Therefore, many database schemes, such as aggregation, join, frequent pattern mining, and indexing, become more challenging in this context. This paper surveys the previous efforts to resolve these issues in processing data streams. The emphasis is on specifying and processing sliding window queries, which are supported in many stream processing engines. We also review the related work on stream query processing, including synopsis structures, plan sharing, operator scheduling, load shedding, and disorder control.

실시간 헬스케어 서비스를 위한 스트림 데이터 시스템 프레임워크의 설계 (The Framework of Stream Data Processing System for Realtime Health Care Service)

  • 오택군;이연;배해영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제44차 하계학술발표논문집 19권2호
    • /
    • pp.21-22
    • /
    • 2011
  • The growth of using smartphone and tablet pc has enabled variety kinds of realtime applications. In these applications, the data which we called data stream is multidimensional, continuous, rapid, and time-varying. However the traditional Database Management System (DBMS) suffers from processing the real time and complex application, in this paper we proposed the framework for CCR Data Stream Server's design and implementation that compiled with Data Stream Database Management System (DSMS) and DBMS in EMR system. The system enables users not only to query stored CCR information from DBMS, but also to execute continues query for the real-time CCR Data Stream.

  • PDF

유비쿼터스 환경을 위한 시공간 질의 처리 시스템 (Spatio-temporal Query Processing Systems for Ubiquitous Environments)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.145-152
    • /
    • 2010
  • 최근 유비쿼터스 컴퓨팅 기술의 발전과 함께 센서 및 RFID에 관련한 정보 인식, 위치 측위와 같은 다양한 유비쿼터스 영역에 대한 관심과 연구가 증대되고 있다. 특히, 시공간 데이터를 다루는 실시간 위치 추적 서비스 기술이 대두되고 있다. 이에, ISO/IEC에서는 실시간 위치 추적 서비스의 데이타 호환성과 상호 운용성을 위해 RTLS 표준 명세를 제시하였다. 본 논문에서는 이동 객체의 시공간 데이타 스트림에 대한 효율적인 관리와 검색을 지원하는 시공간 질의 처리 시스템을 설계 및 구현하였다. 시공간 질의 처리 시스템의 시공간 미들웨어는 끊임없이 연속으로 들어오는 시공간 데이타 스트림을 실시간으로 처리하고 시공간 DBMS간의 양방향 동기화를 지원한다. 웹 서버는 서버와 클라이언트간의 상호 운용성을 위하여 SOAP(Simple Object Access Protocol) 메시지를 사용하며, 클라이언트의 SOAP 메시지를 분석하여 시공간 미들웨어의 CQL(Continuous Query Language)로 변환하는 기능을 지원한다. 마지막으로, 본 논문에서는 실시간 위치 추적 서비스에 적용해 봄으로써 시공간 질의 처리 시스템의 효용성을 입증하였다.

슬라이딩 윈도에서의 데이터 스팀데이터 유사 질의 처리를 위한 다중질의 최적화 기법 (A Multi-Query Optimizing Method for Data Stream Similar Queries on Sliding Window)

  • 이양파;이연;신숭선;이동욱;정원일;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.413-416
    • /
    • 2008
  • In the presence of multiple continuous queries, multi-query optimizing is a new challenge to process multiple stream data in real-time. So, in this paper, we proposed an approach to optimize multi-query of sliding window on network traffic data streams and do some comparisons to traditional queries without optimizing. We also detail some method of scheduling on different data streams, while different scheduling made different results. We test the results on variety of multi-query processing schedule, and proofed the proposed method is effectively optimized the data stream similar multi-queries.

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

u-Health 시스템에서 슬라이딩 윈도우 기반 스트림 데이터 처리 (Stream Data Processing based on Sliding Window at u-Health System)

  • 김태연;송병호;배상현
    • 한국정보전자통신기술학회논문지
    • /
    • 제4권2호
    • /
    • pp.103-110
    • /
    • 2011
  • u-Health 시스템의 센서들로부터 측정된 데이터에 대한 정확하고 에너지 효율적인 관리가 필요하다. 센서네트워크에서 대용량의 입력 스트림 데이터 전체를 데이터베이스에 모두 저장하여 한꺼번에 처리하는 것은 효율적이지 못하다. 본 논문에서는 u-Health 시스템 내 센서 네트워크의 에너지 효율성과 정확성을 고려하여 여러 센서에서 지속적으로 들어오는 다차원 스트림 데이터의 처리 성능을 높이고자 한다. 효율적인 입력 스트림 처리를 위해서 슬라이딩 윈도우 기반으로 질의를 처리하고 Mjoin 방법으로 다중 질의 계획을 수립한 후 역전파 알고리즘을 통해 저장 데이터를 축소하는 효율적인 처리 기법을 제안한다. 14,324개의 데이터 집합을 사용하여 실험한 결과 실제 입력되는 데이터보다 저장 공간의 18.3%를 축소함으로써 효과적임을 보였다.

관계형 데이터 스트림에서 고급 키워드 검색을 위한 질의 최적화 (Query Optimization for an Advanced Keyword Search on Relational Data Stream)

  • 주진웅;김학수;황진호;손진현
    • 정보처리학회논문지D
    • /
    • 제16D권6호
    • /
    • pp.859-870
    • /
    • 2009
  • 관계형 데이터베이스 기반의 키워드 검색 기법에 대한 연구에서의 관심에도 불구하고 관계형 데이터 스트림 기반의 연구는 아직 미흡한 수준이다. 오늘날 스트리밍 데이터는 데이터 관리 측면에서 중요한 연구 토픽이기 때문에 관계형 데이터 스트림 기반의 키워드 검색 기법에 대한 연구는 매우 중요하다. 이러한 관점에서 본 논문은 관계형 데이터 스트림 기반의 키워드 검색 기법과 관련된 연구들을 먼저 분석하고 키워드 검색 질의를 처리하는 동안에 발생되는 조인 비용을 최소화하는 기법에 대해 초점을 둔다. 결과적으로 본 논문은 관계형 데이터 스트림에서 사용자를 위해 좀 더 의미 있는 질의 결과를 산출하기 위한 고급 키워드 검색 기법을 제안하고 효율적인 질의 처리를 위한 계층적 클러스터링을 사용한 질의 최적화 기법을 제안한다.

동적 XML 조각 스트림에 대한 메모리 효율적 질의 처리 (Memory Efficient Query Processing over Dynamic XML Fragment Stream)

  • 이상욱;김진;강현철
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.1-14
    • /
    • 2008
  • 본 논문은 메모리 용량이 제약되어 있는 이동 단말기에서의 XML 데이터에 대한 질의 처리 기술에 관한 것이다. 대량의 XML 데이터에 대한 질의를 메모리 용량이 크지 않은 단말기에서 처리하는 경우 XML 데이터를 XML 조각(fragment)으로 분할하여 스트림으로 전송하고 처리하는 기술이 필요하다. 이는 전체 XML 문서를 재구성하지 않고 XML 데이터에 대한 질의 처리를 가능하게 한다. XFrag[4], XFPro[5], XFLab[6] 등 기존에 제시된 기법들은 질의 처리를 위해 조각에 대한 정보를 저장하고 사용한 후 더 이상 불필요해진 것들을 식별하여 삭제하지 못하기 때문에 조각 정보가 메모리에 계속 누적되어 대용량의 XML 데이터에 대해 질의 처리를 수행하기에는 문서 크기에 따른 확장성(scalability)이 떨어진다. 특히, XML 조각이 동적으로 생성되어 무한정 스트리밍되는 경우에 한정된 메모리로는 질의 처리를 보장할 수 없다. 본 논문에서는 동적 XML 조각 스트림에 대한 질의 처리에 있어 문서 크기에 따른 확장성 있는 질의 처리를 수행하기 위하여 누적된 조각 정보 삭제 기법들을 제시하고 이들을 바탕으로 기존 기법의 확장을 제시한다. 구현 및 성능 실험 결과 본 논문에서 확장된 기법이 기존의 기법보다 메모리 효율성이 현저히 높고 문서 크기에 따른 확장성이 월등히 우수한 것으로 나타났다.

분산 공간 데이터 스트림 처리에서 질의 영역의 겹침을 고려한 공간 연산 배치 기법 (Spatial Operation Allocation Scheme over Common Query Regions for Distributed Spatial Data Stream Processing)

  • 정원일
    • 한국산학기술학회논문지
    • /
    • 제13권6호
    • /
    • pp.2713-2719
    • /
    • 2012
  • 위치를 기반으로 하는 서비스가 다양해짐에 따라 고가용성과 고확장성을 제공하기 위한 분산 데이터 스트림 처리 기법에 대한 연구가 널리 수행되고 있다. 기존 연구는 분산된 노드들에서 부하의 균형을 유지하기 위해 공간 데이터 스트림의 지리적인 특성을 고려하지 않고 있어 공간적으로 인접한 연산을 수행함에 있어 전체 시스템의 부하를 증가시키고 있다. 본 논문에서는 분산 환경의 공간 데이터 스트림을 처리하기 위해 공간 영역의 겹침을 고려한 연산배치 기법을 제안한다. 제안 기법에서는 인접한 공간 영역을 대상으로 하는 연산을 효율적으로 분리하기 위해 질의 영역이 겹치는 부분의 연산을 우선적으로 동일 노드에 분배하여 중복 영역에 대한 공유의 최대화를 보장한다.

데이터 스트림에서 다중 조인 연속질의의 효과적인 처리를 위한 전처리 기법 (Preprocessing Method for Handling Multi-Way Join Continuous Queries over Data Streams)

  • 서기언;이주일;이원석
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.93-105
    • /
    • 2012
  • 데이터 스트림이란 빠르게 연속적으로 무한히 발생하는 데이터 집합을 의미한다. 최근 다양한 산업의 발달로 인해 이러한 스트림 데이터의 효율적인 처리를 위한 요구 사항들이 늘어나고 있다. 특히 많은 연산 비용을 요구하는 조인 연산의 효율적인 처리는 데이터 스트림 관리 시스템의 성능 향상에 많은 영향을 미친다. 본 논문에서는 다중 조인 연속질의의 효율적인 처리를 위하여 최종 질의 결과에 포함되지 않는 불필요한 중간 조인 결과들을 사전에 제거함으로써 조인 연산의 비용을 감소시키는 방법을 제안한다. 이를 위해 스트림 데이터의 모니터링을 위한 매트릭스 기반의 구조체를 제안하고, 제안된 구조체를 이용한 매트릭스 연산을 통하여 최종 조인 결과의 투플 수를 예측함과 동시에 불필요한 중간 결과들을 만들어내는 투플들을 찾아낸다. 이를 통해 해당 투플을 이용한 조인 연산의 수행 여부를 결정하여 최종 조인 결과를 만들지 않는 투플을 조인 연산에서 배제함으로써 효율적으로 다중 조인 연속 질의를 처리한다.