• Title/Summary/Keyword: 데이터스트림

Search Result 917, Processing Time 0.031 seconds

A Method for Finding Accompany Group from Trajectory Stream Data (궤적 스트림 데이터로부터 동행 그룹 탐색 기법)

  • kang, Suhyun;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.363-366
    • /
    • 2019
  • 객체들의 움직임의 흐름을 나타내는 궤적 데이터에서 함께 움직이는 궤적을 찾아 움직임 패턴을 탐색하는 연구들이 많이 이루어져 왔다. 하지만, 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하는 연구는 많이 이루어지지 않았다. 그래서 본 논문은 시간의 흐름에 따라 흘러 들어오는 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하여 동행 그룹을 탐색하는 새로운 방법을 제안한다. 기존에도 궤적 스트림 데이터에서 궤적들이 주어졌을 때 궤적들의 이동 패턴을 찾는 연구들은 존재하였으나 발견된 궤적이 언제 생성되었고 언제 소멸되었는지에 대한 정보를 자동으로 출력해 주는 연구는 아직 이루어진 바가 없다. 본 논문에서는 서로 다른 시간에 나타나고 사라지는 모습을 가진 궤적 스트림 데이터에서 동일한 시간에 나타나는 궤적을 찾는 방법을 제안한다. 제안 방법은 객체들의 좌표를 점진적으로 클러스터링을 수행하여 사용자에게 입력받은 지속 시간 이상 클러스터를 유지한 동행 그룹의 객체들을 반환한다. 또한, 기존 연구와 달리 해당 객체들의 지속 시간인 시작과 끝 시간도 자동으로 출력해 준다.

Implement of Geosensor Stream Data Management System based on Smart City in Saemangum (새만금 Smart City 기반 Geosensor 스트림 데이터 관리 시스템 구현)

  • Mun, Young-Chae;Baek, Jeong-Ho;Gang, Pung-Seong;Lee, Hong-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1399-1401
    • /
    • 2010
  • 본 연구는 새만금과 새만금 주변에서 Geosensor 스트림 데이터 측정을 위해 대기관련 센서들로 3개의 클러스터를 구성하고, 수질관련 센서들로 하나의 클러스터를 구성하여 Geosensor 네트워크를 구축하였다. 각 클러스터로부터 5분 단위로 수집된 센서 스트림 데이터를 시스템에 전송하고, 시스템에서는 수신된 스트림 데이터를 분석 및 처리하여 DB에 저장한다. 본 연구에서는 Geosensor 데이터 가공 처리 및 저장, Geosensor 관리, 상황정보 관리, Geosensor 스트림 데이터와 GIS 연동 기능을 포함한 시스템을 개발하고자 한다.

A Method for Detecting Concept Drift in Data Stream by Using Exponential Histogram (데이터스트림에서 Exponential Histogram을 사용한 개념 변화 검출 기법)

  • Kim, Man-Soo;Lim, Hyo-Sang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.861-864
    • /
    • 2017
  • 본 논문은 Exponential histogram을 사용하여 데이터스트림에서 개념 변화를 검출 하는 기법을 제안한다. 스트림 데이터와 같이 빠르게 증가하는 데이터에 대한 개념 변화를 찾는 것은 중요 문제이다. 기존에 사용하던 슬라이딩 윈도우 기반의 방법들은 과거의 데이터를 버렸지만, 제안하는 방법은 과거의 데이터를 효율적으로 저장하며, 윈도우의 크기를 변경 할 수 있는 방법을 제안한다. 실험을 통해 제안하는 방법에 대한 효율성과 정확성을 보인다.

Analysis for Multimedia Stream Protocol (멀티미디어 스트림 프로토콜의 분석 기법)

  • 김인규;김형호;배두환;김민경;유병규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.466-468
    • /
    • 1998
  • 인터넷의 발달과 멀티미디어 서비스에 대한 요구 확대는 분산 환경에서의 멀티미디어 서비스를 증대시키고 있다. 분산 환경에서의 멀티미디어 서비스를 지원하기 위해서는 각 시스템 사이에서 멀티미디어 데이터의 전송을 지원해 주는 멀티미디어 스트림에 대한 프로토콜이 필요하다. 이러한 멀티미디어 스트림 프로토콜은 첫째, 재생을 위해 요구되는 데이터를 적절히 공급하고, 둘째, 처리할 수 있는 속도 이상으로 데이터가 전송되는 것을 막아 데이터가 손실되는 것을 방지하기 위해서는, 시간을 적절히 고려하며 동작하여야 한다. 이처럼 복잡한 행위는 갖는 멀티미디어 스트림 프로토콜은 오류의 가능성이 기존의 프로그램보다 크기 때문에, 오류를 개발 초기에 인식, 수정하는 것이 중요하다. 본 연구에서는 정형적 명세 및 분석 도구인 SPIN을 멀티미디어 스트림 프로토콜의 개발에 적용, 프로토콜에 대한 명세 기술과 이에 대한 분석 및 검증을 지원하였다. 이러한 정형적 명세 및 분석 기법은 멀티미디어 스트림 프로토콜 개발 초기에 오류 인식을 가능케하여 요구되는 개발 노력을 감소시킬 수 있을 것이다.

Message Latency-based Load Shedding Mechanism in Apache Kafka (아파치 카프카의 메시지 지연시간 기반 로드 쉐딩 메커니즘)

  • Kim, Hajin;Bang, Jiwon;Son, Siwoon;Choi, Mi-Jung;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.573-576
    • /
    • 2018
  • 아파치 카프카(Apache Kafka)는 데이터 스트림을 실시간 전달하는 분산 메시지 큐잉 플랫폼이다. 카프카는 대다수의 실시간 처리 응용에 사용되는데, 흔히 데이터 스트림의 발생지와 실시간 처리 시스템 사이(입력) 또는 실시간 처리 시스템과 처리 결과의 목적지 사이(출력)에 배치된다. 분산 기술을 도입한 카프카는 다른 메시지 큐잉 기술에 비해 대용량 데이터 스트림을 더욱 빠르게 전달 할 수 있다는 장점을 갖는다. 하지만, 카프카에 적재되는 데이터 스트림의 양과 실시간 처리 응용의 수가 증가할수록 메시지 지연시간은 매우 높아질 수 밖에 없다. 본 논문은 이러한 카프카의 메시지 지연 문제를 해결하고자 카프카의 로드 쉐딩 엔진을 제안한다. 로드 쉐딩의 세 가지 필수적인 결정에 따라, 제안하는 로드 쉐딩 엔진은 카프카의 프로뷰서에서 지연시간이 기준치를 초과할 경우 일부 메시지 전송을 제한하여 지연시간을 줄인다. 실제 실시간 처리 응용으로 실험한 결과, 단일/다중 데이터 스트리 모두 로드 쉐딩이 바르게 작동하여 지연시간이 지속적으로 증가하지 않고 오르내림이 반복되는 추세를 보였다. 본 연구는 데이터 스트림의 입출력을 카프카로 관리하는 실시간 처리 응용에 로드 쉐딩 기법을 적용한 첫 번째 시도로서, 앞으로 데이터 스트림 처리에 사용될 의미 있는 연구라 사료된다.

WT-Heuristics: An Efficient Filter Operator Ordering Technology in Stream Data Environments (WT-Heuristics: 스트림 데이터 환경에서의 효율적인 필터 연산자 순서화 기법)

  • Min, Jun-Ki
    • The KIPS Transactions:PartD
    • /
    • v.15D no.2
    • /
    • pp.163-170
    • /
    • 2008
  • Due to the proliferation of the Internet and intranet, a new application domain called stream data processing has emerged. Stream data is real-timely and continuously generated. In this paper, we focus on the processing of stream data whose characteristics vary unpredictably by over time. Particularly, we suggest a method which generates an efficient operator execution order called WT-Heuristics. WT-Heuristics efficiently determines the operator execution order since it considers only two adjacent operators in the operator execution order. Also, our method changes the execution order with respect to the change of data characteristics with minimum overheads.

A PCA-based Data Stream Reduction Scheme for Sensor Networks (센서 네트워크를 위한 PCA 기반의 데이터 스트림 감소 기법)

  • Fedoseev, Alexander;Choi, Young-Hwan;Hwang, Een-Jun
    • Journal of Internet Computing and Services
    • /
    • v.10 no.4
    • /
    • pp.35-44
    • /
    • 2009
  • The emerging notion of data stream has brought many new challenges to the research communities as a consequence of its conceptual difference with conventional concepts of just data. One typical example is data stream processing in sensor networks. The range of data processing considerations in a sensor network is very wide, from physical resource restrictions such as bandwidth, energy, and memory to the peculiarities of query processing including continuous and specific types of queries. In this paper, as one of the physical constraints in data stream processing, we consider the problem of limited memory and propose a new scheme for data stream reduction based on the Principal Component Analysis (PCA) technique. PCA can transform a number of (possibly) correlated variables into a (smaller) number of uncorrelated variables. We adapt PCA for the data stream of a sensor network assuming the cooperation of a query engine (or application) with a network base station. Our method exploits the spatio-temporal correlation among multiple measurements from different sensors. Finally, we present a new framework for data processing and describe a number of experiments under this framework. We compare our scheme with the wavelet transform and observe the effect of time stamps on the compression ratio. We report on some of the results.

  • PDF

Design and Implementation of a Real -Time Analytics System for Network Packet Trend Analysis (네트워크 패킷 트랜드 분석을 위한 실시간 스트림 데이터 분석 시스템 설계 및 구현)

  • Park, Seoeun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.72-75
    • /
    • 2016
  • 스마트폰, 센서, 소셜미디어, 웹 서비스 등으로부터 발생되는 데이터의 폭증으로 인하여 빅데이터의 분석 및 활용에 대한 요구가 커져가고 있다. 특히 스마트 기기의 발달과 사용자 이용 패턴의 변화로 인하여 스트림 데이터는 끊임없이 발생되고 있지만, 기존의 하둡을 이용한 분석 시스템은 응답시간이 지연되어 빠르게 결과를 조회할 수 없는 단점으로 인하여 데이터를 실시간으로 분석하여 바로 활용할 수 있는 시스템에 대한 요구가 점점 더 증가하면서 람다 아키텍쳐가 등장하였다. 람다 아키텍쳐는 데이터 처리 과정을 배치 레이어와 스피트 레이어로 나누고, 스피드 레이어에서는 배치 결과가 나오기 전까지 스트림으로 유입되는 데이터를 실시간으로 분석하여 가장 최근의 데이터를 빠르게 조회 할 수 있도록 결과를 제공한다. 본 논문에서는 람다 아키텍쳐를 활용하여 연속적으로 유입되는 대용량의 스트림 데이터를 효과적으로 처리하여 실시간 분석과 동시에 배치 분석을 제공하는 데이터 처리 시스템을 설계하고 구현한다.

A High-Speed Data Processing Algorithm for RFID Input Data Stream Using Multi-Buffer (RFID 입력 테이터 스트림에 대한 다중 버퍼 기반의 고속 데이터 처리 알고리즘)

  • Han, Soo;Shin, Seung-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10b
    • /
    • pp.302-307
    • /
    • 2007
  • RFID를 기반으로 유비쿼터스 환경의 응용 서비스를 지원하는 미들웨어는 지속적으로 끊임없이 입력되는 데이터를 정확하게 실시간으로 처리하고 응용 서비스에서 질의하는 결과를 획득해서 전달하여야 한다. 이와 같은 지속적으로 입력되는 대량의 데이터 스트림을 처리하기 위해서 데이터 스트림 관리 시스템(Data Stream Management System: DSMS)을 개발하기 위한 연구가 진행되고 있다. 기존에 연구되는 데이터 스트림에 대한 알고리즘은 대부분 연속 질의 결과들 사이의 평균 오차를 줄이고, 부하 발생 시 데이터의 우선순위에 따라 버리는 것에 초점이 맞추어져 있다. 본 논문에서는 RFID EPC 라는 데이터 특성에 맞추어 다중버퍼를 이용함으로써 고속의 데이터 처리 능력을 얻고, 각 버퍼마다 일정한 규칙을 통해 질의에 있어서도 빠른 대응을 할 수 있는 알고리즘을 제안한다. 본 논문은 현재 DSMS의 관련 연구와 고속 데이터 처리의 필요성을 말하고, 제안하는 알고리즘 설명과 시뮬레이션을 통해 단일버퍼와 다중버퍼일 경우 데이터 처리 속도 성능 평가와 제안한 알고리즘에 맞도록 버퍼가 생성 되는지 테스트하는 것으로 구성된다.

  • PDF

Monitoring and adaptive prediction of the dynamically changed information (동적으로 변화하는 정보에 대한 모니터링 및 적응적 변화 예측)

  • Park, Dae Wook;Lee, Won Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.230-232
    • /
    • 2007
  • 최근의 온라인 응용 환경에서는 다양한 종류의 데이터 스트림을 다루고 있으며 이러한 데이터 스트림은 빠른 속도로 무한히 생성되고 실시간의 빠른 처리를 필요로 한다. 따라서 데이터 스트림 실시간 처리 및 분석 작업에서는 데이터 스트림을 지속적으로 모니터링하여 앞으로의 변화와 이에 따른 부하를 예측하고 성능을 조절하는 일이 필요하다. 본 논문에서는 끊임없이 발생하는 데이터를 관찰하여 데이터가 발생하는 패턴을 찾아내고, 찾아낸 패턴을 기반으로 미래의 특정 시점에서 발생할 데이터 값을 미리 예측하는 효율적인 기법을 제안한다. 무한한 양의 데이터를 제한된 크기의 메모리 내에서 처리하여 현재부터 과거 특정시점까지 발생한 데이터의 패턴을 가장 정확히 일반화할 수 있는 함수를 찾아내고 그 함수를 기반으로 미래에 발생할 데이터의 값을 예측한다.

  • PDF