• Title/Summary/Keyword: 데이터스트림

Search Result 917, Processing Time 0.024 seconds

Frequent Items Mining based on Regression Model in Data Streams (스트림 데이터에서 회귀분석에 기반한 빈발항목 예측)

  • Lee, Uk-Hyun
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.1
    • /
    • pp.147-158
    • /
    • 2009
  • Recently, the data model in stream data environment has massive, continuous, and infinity properties. However the stream data processing like query process or data analysis is conducted using a limited capacity of disk or memory. In these environment, the traditional frequent pattern discovery on transaction database can be performed because it is difficult to manage the information continuously whether a continuous stream data is the frequent item or not. In this paper, we propose the method which we are able to predict the frequent items using the regression model on continuous stream data environment. We can use as a prediction model on indefinite items by constructing the regression model on stream data. We will show that the proposed method is able to be efficiently used on stream data environment through a variety of experiments.

A Multi-dimensional Query Processing Scheme for Stream Data using Range Query Indexing (범위 질의 인덱싱을 이용한 스트림 데이터의 다중 질의처리 기법)

  • Lee, Dong-Un;Rhee, Yun-Seok
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.2
    • /
    • pp.69-77
    • /
    • 2009
  • Stream service environment demands real-time query processing for voluminous data which are ceaselessly delivered from tremendous sources. Typical R-tree based query processing technologies cannot efficiently handle such situations, which require repetitive and inefficient exploration from the tree root on every data event. However, many stream data including sensor readings show high locality, which we exploit to reduce the search space of queries to explore. In this paper, we propose a query processing scheme exploiting the locality of stream data. From the simulation, we conclude that the proposed scheme performs much better than the traditional ones in terms of scalability and exploration efficiency.

Technology of Distributed Stream Computing (분산 스트림 컴퓨팅 기술 동향)

  • Lee, M.Y.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.1
    • /
    • pp.80-88
    • /
    • 2011
  • 데이터의 효과적인 활용이 경쟁력 확보에 주요한 요인이나, 데이터 폭증은 유용한 정보를 얻는데 필요한 처리 시간의 지연을 야기하고 있다. 개인 맞춤형 서비스, 방범 방재 서비스 등 모니터링 & 대응 서비스를 위해 분석할 데이터의 양이 급증하고 있으며, 텍스트, 영상, 오디오 등 비정형 데이터에 대한 실시간 분석 필요성이 증대하고 있다. 대량의 폭증하는 데이터에 대한 실시간 분석 처리 환경을 제공하기 위해 분산 병렬 컴퓨팅 기술과 데이터 스트림 연속 처리 기술이 활용되고 있다. 본고에서는 폭증하는 데이터 스트림 처리를 위하여 확장성 및 유연한 처리 환경을 제공하는 분산 스트림 컴퓨팅 기술에 대해 소개한다.

  • PDF

Efficient Binary Join Processing for Large Data Streams (대용량 데이터 스트림을 처리하기 위한 효율적 이진 조인 처리 기법)

  • Park, Hong-Kyu;Lee, Won-Suk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2008.06a
    • /
    • pp.189-192
    • /
    • 2008
  • 최근에 제한된 데이터 셋보다 센서 데이터 처리, 웹 서버 로그나 전화 기록과 같은 다양한 트랜잭션 로그 분석등과 관련된 대용량 데이터 스트림을 실시간으로 처리하는 것에 많은 관심이 집중되고 있으며, 특히 데이터 스트림의 조인 처리에 대한 관심이 증가하고 있다. 본 논문에서는 조인 연산을 빠르게 처리하기 위한 효율적인 해시 구조와 조인 방법에 대해서 연구하고 다양한 환경에서 제안 방법을 검증한다.

  • PDF

Design and Implementation of Storage Manager for Real-Time Compressed Storing of Large Volume Datastream (대용량 데이터스트림 실시간 압축 저장을 위한 저장관리자 설계 및 구현)

  • Lee, Dong-Wook;Baek, Sung-Ha;Kim, Gyoung-Bae;Bae, Hae-Young
    • Journal of Korea Spatial Information System Society
    • /
    • v.11 no.3
    • /
    • pp.31-39
    • /
    • 2009
  • Requirement level regarding processing and managing real-time datastream in an ubiquitous environment is increased. Especially, due to the unbounded, high frequency and real-time characteristics of datastream, development of specialized stroge manager for DSMS is necessary to process such datastream. Existing DSMS, e.g. Coral8, can support datastream processing but it is not scalable and cannot perform well when handling large-volume real-time datastream, e.g. 100 thousand over per second. In the case of Oracle10g, which is generally used in related field, it supports storing and management processing. However, it does not support real-time datastream processing. In this paper, we propose specialized storage manager of DSMS for real-time compressed storing on semiconductor or LCD production facility of Samsung electronics, Hynix and HP. Hynix and HP. This paper describes the proposed system architecture and major components and show better performance of the proposed system compared with similar systems in the experiment section.

  • PDF

An Implementation of Digital TV Stream Analyzer (디지틸 TV 스트림 분석기 구현)

  • 정혜진;김용한
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2000.11b
    • /
    • pp.95-100
    • /
    • 2000
  • 본 논문에서는 디지털 TV 방송 스트림을 분석, 검증하기 위한 시스템을 PC 상에서 소프트웨어 기반으로 구현하였다. 저장되어 있는 MPEG-2 트란스포트 스트림(transport stream, TS) 파일을 입력으로 받으며 별도의 하드웨어 장치를 사용하지 않는다. 이 분석기는 PSI(program specific information), TS 섹션, TS 헤더 등 기본 내용뿐만 아니라, TS 패킷들을 오디오, 비디오, PCR(program clock reference), 부가 데이터, 널(null) 패킷 등으로 구분하여 그래픽 사용자 인터페이스 통하여 보여 준다. 또한, 현재 표시되고 있는 TS 패킷과 가장 가까운 I 프레임를 디스플레이 해줌으로써 비트스트림 상의 오류 부분과 실제 영상과 쉽게 매칭시킬 수 있도록 해 준다. 본 논문의 분석기는 MPEG-2 비트스트림 적합성 검사 기능도 제공하며, 데이터 방송을 위한 여러 가지 부가 데이터를 MPEG-2 기본 스트림에 삽입하는 기능도 갖고 있다. 본 논문의 분석기를 이용함으로써 저비용으로 방송 스트림을 분석, 검증할 수 있을 뿐만 아니라, 실험실 연구를 위한 데이터 방송용 비트스트림을 저비용으로 제작할 수 있다.

  • PDF

A Priority Assignment Method to Sensor Stream Data for QoS Support (서비스 품질(QoS) 지원을 위한 센서 스트림 데이터에 대한 우선순위 부여 방법)

  • Kim, Gi-Hong;Hong, Bong-Hee;Kwon, Joon-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.148-150
    • /
    • 2012
  • 최근 대용량 스트림 데이터에 대한 요구사항이 발생하고 있다. 이때 모든 대용량 스트림을 실시간으로 좋은 서비스를 제공하는 것은 실제적으로 불가능하다. 즉 대용량 스트림 데이터에 대한 QoS(Quality of Service: 서비스 품질)이 중요한 이슈가 되고 있다. 이러한 QoS를 정의하기 위해서는 센서 스트림 데이터에 대한 우선순위 부여방법이 가장 원천적으로 중요한 사항이 된다. 현재 센서 네트워크상에서의 서비스 품질은 연구되고 있지만 미들웨어 레이어에서의 우선순위 부여 방법에 대한 연구가 미비하다. 센서 스트림은 자체적으로는 우선순위를 가질 수 없으므로 사용자 질의 우선순위와 센서 스트림의 발생 시간등을 고려하여 대용량 센서 스트림에 대한 우선순위를 부여하는 방법을 제안한다.

Context Inference and Sensor Data Classification of Big Data Stream Environment (빅데이터 스트림 환경에서의 센서 데이터 분류와 상황추론)

  • Ryu, Chang-Kun
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.9 no.10
    • /
    • pp.1079-1085
    • /
    • 2014
  • The analysis of the variable continuous big data stram should reach the destination context awareness. This study presented a novel way of context inference of the variable data stream from sensor motes. For assessment of the sensor data, we calculated the difference of each measured value at the time window and determined the belief value of each focal element. It was beneficial that calculate and assessment of factor of situation for context inference with the Dempster-Shfer evidence theory.

Frequent Patten Tree based XML Stream Mining (빈발 패턴 트리 기반 XML 스트림 마이닝)

  • Hwang, Jeong-Hee
    • The KIPS Transactions:PartD
    • /
    • v.16D no.5
    • /
    • pp.673-682
    • /
    • 2009
  • XML data are widely used for data representation and exchange on the Web and the data type is an continuous stream in ubiquitous environment. Therefore there are some mining researches related to the extracting of frequent structures and the efficient query processing of XML stream data. In this paper, we propose a mining method to extract frequent structures of XML stream data in recent window based on the sliding window. XML stream data are modeled as a tree set, called XFP_tree and we quickly extract the frequent structures over recent XML data in the XFP_tree.

Adaptive Receiver-driven Layered Multicast Protocol (적응적 수신자 기반 계층 멀티캐스트 프로토콜)

  • 고민수;안종석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.191-195
    • /
    • 1998
  • 최근 인터넷상에서는 이형 네트워크 상황에서 효율적인 화상회의를 하기 위한 연구가 활발히 진행되고 있다. 이형 네트워크에서 화상회의를 효과적으로 수행하기 위해서는 각 수신자의 네트워크 상태에 알맞게 데이터를 보내주어야 한다. 이러한 문제를 해결하기 위해서 McCanne은 계층적 코딩 방식과 RLM(Receiver-driven Layered Multicast)방식을 결합하여 사용할 것을 제안하였다. 계층적 코딩 방식은 하나의 이미지 프레임을 여러 계층의 데이터 스트림으로 나누는 방식으로 수신자는 많은 계층의 스트림을 받아볼수록 선명한 영상을 볼 수 있다. RLM은 각 수신자의 네트워크 상태에 따라 몇 개의 데이터 스트림을 수신할 것인가를 결정하는 방식이다.. 본 논문에서는 기존 RLM방식의 효율을 향상시킬 수 있는 적응적 기법을 제안한다. 기존의 RLM방식은 무작위적으로 정한 시간에 수신하는 데이터 스트림의 개수를 증가시키고 또한 네트워크가 정체가 되면 수신하는 데이터 스트림의 개수를 감소시키는 방식을 사용한다. 본 논문에서는 데이터 스트림의 개수를 증가시키는 시간을 네트워크의 상태에 따라 적응적으로 결정하는 기법을 소개한다. 시뮬레이션 실험에 의하면 적응적 기법이 기존 RLM에 비해 네트워크 사용 효율을 10%-30%정도 향상시킨다.

  • PDF