• 제목/요약/키워드: Skewed Data Streams

검색결과 4건 처리시간 0.025초

Predictive Memory Allocation over Skewed Streams

  • Yun, Hong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제7권2호
    • /
    • pp.199-202
    • /
    • 2009
  • Adaptive memory management is a serious issue in data stream management. Data stream differ from the traditional stored relational model in several aspect such as the stream arrives online, high volume in size, skewed data distributions. Data skew is a common property of massive data streams. We propose the predicted allocation strategy, which uses predictive processing to cope with time varying data skew. This processing includes memory usage estimation and indexing with timestamp. Our experimental study shows that the predictive strategy reduces both required memory space and latency time for skewed data over varying time.

실시간 공간 빅데이터 스트림 분산 처리를 위한 부하 균형화 방법 (Load Balancing for Distributed Processing of Real-time Spatial Big Data Stream)

  • 윤수식;이재길
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1209-1218
    • /
    • 2017
  • 최근 스마트 자동차, 스마트폰과 같은 다양한 소스로부터 공간 빅데이터 스트림을 수집하는 것이 매우 용이해졌다. 공간 데이터 스트림은 편중되고 동적으로 변화하는 분포를 지니기 때문에 전체 부하가 분산 클러스터 내의 작업자들에게 효율적으로 분배되지 않을 경우 전체 시스템의 성능이 저하된다. 본 연구에서는 공간 데이터 스트림에 특화된 부하 균형화 알고리즘인 적응적 공간 키 그룹핑(ASKG)을 제안한다. ASKG의 핵심 아이디어는 공간 데이터 스트림의 최근 분포를 학습하고 이를 기반으로 향후 유입되는 데이터 스트림이 각 작업자에게 고르게 분배되도록 하는 새로운 그룹핑 스키마를 제안하는 것이다. 이를 공간 분포의 변화에 맞춰 주기적으로 반복함으로서 적응적으로 부하 불균형을 해결할 수 있다. 실제 데이터셋에 대해 작업자의 수, 입력 속도, 공간 질의 처리 시간을 변화시키며 성능을 평가한 결과, 대안 알고리즘 대비 제안 방법이 부하 불균형, 처리량, 지연 시간에서 높은 개선효과를 보였다.

Performance Analysis of Multimedia File System

  • Park, Jinyoun;Youjip Won;Jaideep Srivastava
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.100-102
    • /
    • 2001
  • Intensive I/O bandwidth demand of the multimedia streaming service puts significant burden on file system. Different from the legacy text based or image data, the semantics of the data in multimedia format can be significantly affected if the data block is not delivered by the predefined deadline. The legacy file system used in Unix or Unix like environment is designed to efficiently handle the files who sizes range from few hundreds of byte to several tens of gigabytes. This fundamental design philosophy results in the file system based on multi level skewed tree structure. Multi level i-node structure has significant drawback when the application performs sequential read operation. In this article, we present the result of the performance study of the file system which is specifically designed for handling multimedia streams. We implemented the file system on Linux Operating System environment and examines the performance behavior of the file system under streaming I/O workload. The result of the study shows that the proposed file system performs much more efficiently than the ext2 file system of Linux does.

사행하천에서 오염물질의 2차원 거동특성 해석 (Analysis of Two-Dimensional Pollutant Transport in Meandering Streams)

  • 오정선;서일원;김영한
    • 한국수자원학회논문집
    • /
    • 제37권12호
    • /
    • pp.979-991
    • /
    • 2004
  • 본 연구에서는 사행하는 자연하천에 유입된 오염물질의 2차원 확산 특성을 모의하기 위하여 2차원 수심적분 모형인 RMA2와 RMA4를 사용하였다. 먼저 2차원 동수역학적인 모형인 RMA2를 사용하여 흐름장을 모의한 후 이 결과를 2차원 수질모형인 RMA4에 입력하여 농도장을 모의하였다. 수치모형을 S자형 사행수로에서 측정한 흐름 및 추적자 농도자료를 이용하여 검증한 결과, RMA4 모형은 최대유속선이 만곡의 내측에 치우쳐 나타나는 현상을 잘 모의하고 있었으며, RMA4 모형은 오염운의 전반적인 확산 특성과 분리 현상을 적절하게 모의하고 있었다. 수치모형을 실제 하천에 적용하여 현장 실험 결과를 비교한 결과, RMA2 모형은 전체적인 흐름 특성 및 만곡의 외측 제방으로 치우치는 최대유속선의 경향 등을 잘 모의하였으며, RMA4모형은 오염운이 최대유속선을 따라 이동하는 경향 등을 적절하게 재현하는 것으로 밝혀졌다. 본 연구에서 분산계수는 실측 농도분포로부터 계산한 값을 미세 조정하여 사용하였으며, 이는 기존의 추정식에 의한 추정치와도 잘 부합하는 것으로 밝혀졌다.