• Title/Summary/Keyword: 데이터 필터링

Search Result 978, Processing Time 0.033 seconds

Esper-based Real-time Filtering System (Esper 기반 실시간 필터링 시스템)

  • Park, Sebin;Lee, Sanghun;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.552-555
    • /
    • 2016
  • 본 논문에서는 데이터 스트림 대상의 필터링 문제를 다룬다. 데이터 스트림은 지속적으로 생성되며, 크기 또한 거대해서 이를 실시간 처리하기 위해서는 분석에 불필요한 데이터를 충분히 필터링해야 한다. 하지만, 기존 필터링 알고리즘은 하나의 데이터 형식에만 사용이 가능하여 다양하고 복잡한 스트림 환경에서는 사용하기가 어렵다. 따라서, 본 논문에서는 이 같은 문제를 해결하기 위해 스트림 형식에 따라 필터링 알고리즘을 다양하게 선택할 수 있는 필터링 시스템을 제안한다. 그리고 실시간 필터링을 위해 대표적인 오픈소스 DSMS(data stream management system)인 에스퍼 기반으로 구현한다. 또한 웹 기반 클라이언트-서버 모델로 확장 구현하여 사용자가 언제 어디에서든 필터링 시스템을 사용할 수 있게 한다. 제안하는 에스퍼 기반 실시간 필터링 시스템은 데이터 스트림으로 실시간 데이터 스트림과 벌크 데이터 스트림을 지원한다. 그리고 필터링 알고리즘으로 질의 필터링, 블룸 필터링, 베이지안 필터링을 제공한다. 제안하는 필터링 시스템 구현 결과, 데이터 스트림 특성에 적합한 필터링 알고리즘을 선택적으로 제공함으로써, 사용자가 보다 정확하고 효율적으로 의미있는 데이터를 추출 가능하게 하였다.

Cooperative Data Stream Filtering for Sensor Tag (센서태그 통합 데이터 필터링에 관한 연구)

  • Ryu, Seung-Wan;Oh, Seul-Ki;Park, Sei-Kwon;Oh, Dong-Ok
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.36 no.8A
    • /
    • pp.683-690
    • /
    • 2011
  • The conventional sensor tag data filtering algorithm uses time window based data filtering for each tag data. However, this approach shows many performance problems such as low error and event detection rate and larger storage size requirement. In this paper, we propose a collaborative sensor tag data filtering algorithm to improve sensor data processing performance. simulation study shows that the proposed sensor tag filtering algorithm outperforms the conventional filtering algorithm in terms of the processing time, the size of required data storage memory and accuracy of error and event detection rate.

A method for high-speed event processing in the real-time RFID middleware systems (실시간 RFID 미들웨어에서의 태그 데이터 고속 필터링 방법)

  • Park, Mi Sun;Kim, Yong Jin;Ryu, Minsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.435-436
    • /
    • 2009
  • RFID 시스템의 미들웨어는 태그에서 생성된 방대한 양의 데이터를 리더를 통해 전달받는다. RFID 미들웨어는 이러한 데이터를 정제하여 응용 애플리케이션에 전달하는 기능을 담당한다. 하지만 태그 데이터 정제 과정에서 발생되는 지연 시간은 RFID 미들웨의 응답성을 저하시킨다. 본 논문은 EPCglobal 의 RFID 미들웨어 표준인 ALE 에 의거하여 태그 데이터에 대한 다수의 필터링 조건들이 주어진 RFID 미들웨어 환경에서 실시간으로 수집되는 대용량의 태그에 대한 고속 필터링 엔진을 설계한다. 이를 위하여 Intermediate node 들이 key 값을 저장하는 Binary Search Tree 형태를 구성하여 태그를 필터링하는 방법을 제안한다. 결과로써 기존의 순차적인 RFID 데이터 필터링에 비해 고속의 필터링 성능을 보이며 특히 필터의 수가 증가할수록 필터링의 효율이 높아짐을 보인다.

An Energy Saving Method using Hierarchical Filtering in Sensor Networks (센서 네트워크에서 계층적 필터링을 이용한 에너지 절약 방안)

  • Kim, Jin-Su
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.8 no.4
    • /
    • pp.768-774
    • /
    • 2007
  • This paper proposes how to reduce the amount of data transmitted in each sensor and cluster head in order to lengthen the lifetime of sensor network. This study proposes hierarchical filtering for reducing the sensor's energy dissipation. Hierarchical filtering is to divide sensor network by two tiers when filtering it. First tier performs filtering when transmitting the data from cluster member to cluster head, and second tier performs filtering when transmitting the data from cluster head to base station. This should increase the efficiency of filtering and decrease the inaccuracy of the data compared to the methods which enlarge the filter width to do more filtering.

  • PDF

Data Statical Analysis based Data Filtering Scheme for Monitoring System on Wireless Sensor Network (무선 센서 네트워크 모니터링 시스템을 위한 데이터 통계 분석 기반 데이터 필터링 기법)

  • Lee, Hyun-Jo;Choi, Young-Ho;Chang, Jae-Woo
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.3
    • /
    • pp.53-63
    • /
    • 2010
  • Recently, various monitoring systems are implemented actively by using wireless sensor networks(WSN). When implementing WSN-based monitoring system, there are three important issues to consider. At First, we need to consider a sensor node failure detection method to support the ongoing monitoring. Secondly, because sensor nodes use limited battery power, we need an efficient data filtering method to reduce energy consumption. At Last, a reducing processing overhead method is necessary. The existing Kalman filtering scheme has good performance on data filtering, but it causes too much processing overhead to estimate sensed data. To solve these problems, we, in this paper, propose a new data filtering scheme based on data statical analysis. First, the proposed scheme periodically aggregates node survival massages to support a node failure detection. Secondly, to reduce energy consumption, it sends the sample data with a node survival massage and do data filtering based on those messages. Finally, it analyzes the sample data to estimate filtering range in a server. As a result, each sensor node can use only simple compare operation for filtering data. In addition, we show from our performance analysis that the proposed scheme outperforms the Kalman filtering scheme in terms of the number of sending messages.

Relationship between Data Selection and Prediction Performance in Collaborative Filtering (개인화된 상품추천을 위한 협동적 필터링에서의 데이터 선정과 추천 성과간의 관계)

  • Lee, Hong-Ju;Kim, Jong-U;Park, Seong-Ju
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2004.05a
    • /
    • pp.347-350
    • /
    • 2004
  • 전자상거래와 고객관계관리에서 고객의 개인화를 위해 사용되는 협동적 필터링 방안은 고객이 상품에 대해 표시한 선호도에 기반을 두어 선호도가 유사한 사용자를 찾고, 유사한 사용자의 선호도를 활용하여 추천할 상품을 선정하는 방안이다. 고객간의 유사도 계산과 상품에 대한 선호도 계산을 위한 다양한 방안들의 계산식에 대해서는 명확하게 정의되어 있으나, 이에 활용되는 데이터의 선정에 대해서는 명확한 규정이나 가이드라인이 존재하지 않는다. 즉, 몇 번 이상의 선호도를 표시한 사용자를 대상으로 추천을 수행할 것인지, 혹은 몇 번 이상 선호도가 표시된 상품을 추천에 활용할 것인지와 같은 데이터 선정에 활용되는 계수와 협동적 필터링의 추천 성과간의 관계에 대한 연구는 아직 부족하다. 본 연구에서는 협동적 필터링의 연구에 많이 활용되는 EachMovie 데이터를 가지고 협동적 필터링의 계수와 추천 성과간의 관계에 대해 실험적으로 연구하였다. 첫 번째는 몇 번 이상 선호도를 표시한 사용자를 협동적 필터링에 활용하는 것이 추천 성과를 높일 수 있는지에 대해 연구하였으며, 두 번째는 몇 번 이상 선호도가 표시된 상품을 고객에게 추천하는 것이 협동적 필터링의 추천 성과를 높일 수 있는가에 대한 연구를 수행하였다. 계수와 추천 성과간의 관계에 대한 두 가지 실험에서 선호도 표시의 한계가치(marginal value)가 점진적으로 감소하는 것을 볼 수 있었다. 본 연구의 결과는 협동적 필터링의 수행을 위한 효과적인 데이터의 선정에 도움을 줄 수 있을 것이다.

  • PDF

Efficient Filtering Method for RFID Data Streams (RFID 데이터 스트림의 효율적인 필터링 기법)

  • Yun, Hong-Won
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.10
    • /
    • pp.27-35
    • /
    • 2007
  • Radio Frequency Identification(RFID) technology is set to play an essential role in object tracking or supply chain management systems. New challenges for RFID data management are needed in the RFID applications. RFID data are generated quickly and automatically, and can be used for object tracking, or for real-time monitoring. These applications are mostly associated with the timestamps when the events happen. In this paper, we propose a temporal RFID data model to maintain the history of events and state changes and to monitor the states of RFID objects. Also we propose data filtering method of non active data based on temporal RFID data model. This data model involves essential basic operations for RFID data. We show increased query performance through the data filtering method of non active data.

An Energy-Efficient Data Aggregation using Hierarchical Filtering in Sensor Network (센서 네트워크에서 계층적 필터링을 이용한 에너지 효율적인 데이터 집계연산)

  • Kim, Jin-Su;Park, Chan-Heum;Kim, Chong-Gun;Kang, Byung-Wook
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.1 s.45
    • /
    • pp.73-82
    • /
    • 2007
  • This paper proposes how to reduce the amount of data transmitted in each sensor and cluster head in order to lengthen the lifetime of sensor network by data aggregation of the continuous queries. The most important factor of refuting the sensor's energy dissipation is to reduce the amount of messages transmitted. The method proposed is basically to combine clustering, in-network data aggregation and hierarchical filtering. Hierarchical filtering is to divide sensor network by two tiers when filtering it. First tier performs filtering when transmitting the data from cluster member to cluster head, and second tier performs filtering when transmitting the data from cluster head to base station. This method is much more efficient and effective than the previous work. We show through various experiments that our scheme reduces the network traffic significantly and increases the network's lifetime than existing methods.

  • PDF

Error filtering technology using change rate of moving object data in real-time video (실시간 영상의 이동 객체 데이터 변화율을 이용한 에러 필터링 기술)

  • Yoon, Kyoung-Ho;Kim, Dhan-Hee;Lee, Won-Suk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.155-158
    • /
    • 2019
  • 최근 지능형 CCTV 관제 시스템에 대한 수요가 증가하고 있다. CCTV 영상 데이터의 양이 폭발적으로 증가하고 있어 이를 분석하기 위한 기술의 발전이 필요한 실정이다. 대부분의 지능형 CCTV 관제 시스템은 영상 속 객체를 찾고 이 객체의 메타데이터를 통해 지능형 관제 시스템을 수행한다. 하지만 영상 속 객체의 로그가 항상 정확하지 않다. 현재의 객체 인식 기술로는 CCTV 영상의 밝기, 해상도 조건에 따라 성능의 차이가 심하고, 영상의 프레임 대비 빠르게 움직인 CCTV 영상 속 모든 객체를 사람이 인식하는 정도로 인식하기 어렵다. 이러한 이동 객체의 크기, 위치를 분석한 메타데이터에는 에러가 포함되기 쉽다. 본 논문에서는 지능형 CCTV 관제 시스템에서 분석한 영상 속 객체의 프레임 메타데이터 에러를 학습기반 실시간 에러 필터링 알고리즘을 통해 개선하여 에러가 필터링된 데이터를 사용하는 지능형 관제 시스템의 정확도 향상에 기여 할 것을 기대한다.

  • PDF

WFilter (Weighted Filter) for XML filtering (XML 필터링을 위한 WFilter(Weighted Filter))

  • 최정필;최오훈;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.253-255
    • /
    • 2003
  • XML 문서를 비롯하여 인터넷을 통해 교환되는 문서의 비약적인 증가로 인하여, 불필요한 문서에 대한 필터링 및 문서 내의 데이터를 필터링하여 정보를 선택적으로 사용하고자 하는 사용자의 요구가 증대되었다. 기존 XML 필터링 방식은 질의 구조에 의존적이기 때문에, 질의 증가에 따른 필터링 인덱스 구성 및 유지의 문제점을 야기할 수 있다. 본 논문에서는 정보 추출 분야에서 널리 사용되는 단어 벡터의 개념을 사용하여 선택적으로 질의에 가중치를 주어 데이터를 효율적으로 추출할 수 있는 XML WFilter (Weighted Filtering) 기법을 제안한다.

  • PDF