• 제목/요약/키워드: Data processing

검색결과 16,488건 처리시간 0.047초

Scalable Big Data Pipeline for Video Stream Analytics Over Commodity Hardware

  • Ayub, Umer;Ahsan, Syed M.;Qureshi, Shavez M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1146-1165
    • /
    • 2022
  • A huge amount of data in the form of videos and images is being produced owning to advancements in sensor technology. Use of low performance commodity hardware coupled with resource heavy image processing and analyzing approaches to infer and extract actionable insights from this data poses a bottleneck for timely decision making. Current approach of GPU assisted and cloud-based architecture video analysis techniques give significant performance gain, but its usage is constrained by financial considerations and extremely complex architecture level details. In this paper we propose a data pipeline system that uses open-source tools such as Apache Spark, Kafka and OpenCV running over commodity hardware for video stream processing and image processing in a distributed environment. Experimental results show that our proposed approach eliminates the need of GPU based hardware and cloud computing infrastructure to achieve efficient video steam processing for face detection with increased throughput, scalability and better performance.

프로세싱 인 메모리 시스템에서의 PolyBench 구동에 대한 동작 성능 및 특성 분석과 고찰 (Performance Analysis and Identifying Characteristics of Processing-in-Memory System with Polyhedral Benchmark Suite)

  • 김정근
    • 반도체디스플레이기술학회지
    • /
    • 제22권3호
    • /
    • pp.142-148
    • /
    • 2023
  • In this paper, we identify performance issues in executing compute kernels from PolyBench, which includes compute kernels that are the core computational units of various data-intensive workloads, such as deep learning and data-intensive applications, on Processing-in-Memory (PIM) devices. Therefore, using our in-house simulator, we measured and compared the various performance metrics of workloads based on traditional out-of-order and in-order processors with Processing-in-Memory-based systems. As a result, the PIM-based system improves performance compared to other computing models due to the short-term data reuse characteristic of computational kernels from PolyBench. However, some kernels perform poorly in PIM-based systems without a multi-layer cache hierarchy due to some kernel's long-term data reuse characteristics. Hence, our evaluation and analysis results suggest that further research should consider dynamic and workload pattern adaptive approaches to overcome performance degradation from computational kernels with long-term data reuse characteristics and hidden data locality.

  • PDF

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

Future Trends of IoT, 5G Mobile Networks, and AI: Challenges, Opportunities, and Solutions

  • Park, Ji Su;Park, Jong Hyuk
    • Journal of Information Processing Systems
    • /
    • 제16권4호
    • /
    • pp.743-749
    • /
    • 2020
  • Internet of Things (IoT) is a growing technology along with artificial intelligence (AI) technology. Recently, increasing cases of developing knowledge services using information collected from sensor data have been reported. Communication is required to connect the IoT and AI, and 5G mobile networks have been widely spread recently. IoT, AI services, and 5G mobile networks can be configured and used as sensor-mobile edge-server. The sensor does not send data directly to the server. Instead, the sensor sends data to the mobile edge for quick processing. Subsequently, mobile edge enables the immediate processing of data based on AI technology or by sending data to the server for processing. 5G mobile network technology is used for this data transmission. Therefore, this study examines the challenges, opportunities, and solutions used in each type of technology. To this end, this study addresses clustering, Hyperledger Fabric, data, security, machine vision, convolutional neural network, IoT technology, and resource management of 5G mobile networks.

Cycle-accurate NPU 시뮬레이터 및 데이터 접근 방식에 따른 NPU 성능평가 (Cycle-accurate NPU Simulator and Performance Evaluation According to Data Access Strategies)

  • 권구윤;박상우;서태원
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.217-228
    • /
    • 2022
  • Currently, there are increasing demands for applying deep neural networks (DNNs) in the embedded domain such as classification and object detection. The DNN processing in embedded domain often requires custom hardware such as NPU for acceleration due to the constraints in power, performance, and area. Processing DNN models requires a large amount of data, and its seamless transfer to NPU is crucial for performance. In this paper, we developed a cycle-accurate NPU simulator to evaluate diverse NPU microarchitectures. In addition, we propose a novel technique for reducing the number of memory accesses when processing convolutional layers in convolutional neural networks (CNNs) on the NPU. The main idea is to reuse data with memory interleaving, which recycles the overlapping data between previous and current input windows. Data memory interleaving makes it possible to quickly read consecutive data in unaligned locations. We implemented the proposed technique to the cycle-accurate NPU simulator and measured the performance with LeNet-5, VGGNet-16, and ResNet-50. The experiment shows up to 2.08x speedup in processing one convolutional layer, compared to the baseline.

트랙터의 포장성능평가(圃場性能評價)를 위한 자료수집처리(資料蒐集處理) 시스템의 개발(開發) (Data Acquisition and Processing System for Tractors Field Performance)

  • 류관희;류영선;강은;박보순;장세권
    • Journal of Biosystems Engineering
    • /
    • 제10권2호
    • /
    • pp.19-26
    • /
    • 1985
  • This study was carried out to develop a versatile data acquisition/processing system for overall tractor performance utilizing a NEC PC-8001 microcomputer. The data acquisition system measures drawbar pull and power, wheel torque and axle power, ground speed, wheel slip, fuel flow, and engine speed. The system stores hexadecimal data for these variables in memory. Upon completion of each test run, all hexadecimal data stored in memory are recorded on floppy disc. The data processing system reads in the data collected on floppy disc and interprete them using several graphical and statistical techniques. The system uses the same microcomputer and a dot-matrix printer. The data acquisition system has been installed on a GOLDSTAR 500 tractor (2WD, 50 ps). A field study has shown that tractor performance data can be quickly and easily collected. It also appeared that the data processing system can be used to efficiently analyze the collected data. The data acquisition system has some troublesome in mounting and handling on tractor since it uses a general-purpose computer consisting of several components.

  • PDF

공간 연속질의 처리에서 영역 기반의 저장 구조를 이용한 효율적인 디스크 접근 방법 (Efficient Disk Access Method Using Region Storage Structure in Spatial Continuous Query Processing)

  • 정원일
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2383-2389
    • /
    • 2011
  • 유비쿼터스 응용은 실시간으로 입력되는 데이터 스트림과 저장된 공간 데이터를 동시에 처리하는 이중적인 공간 연속 질의 처리 기술이 요구된다. 이러한 공간 연속 질의 처리에서는 대용량 공간 데이터에 대한 디스크 접근 비용을 최소화가 요구되나 기존 공간색인 기법은 논리적 인접성을 공간 데이터의 물리적인 인접성을 보장할 수 없으므로 공간 데이터 탐색에 있어 비용이 증가한다. 또한 데이터 인접성 보장을 위한 공간 순서화 기법의 경우에도 빈번하게 접근되는 질의 공간 영역에 대한 클러스터링을 고려하지 않고 있다. 본 논문에서는 이중적인 공간 연속질의 처리에서 공간 데이터의 효율적인 접근을 위한 영역 기반 저장 구조를 제안한다. 제안 기법에서는 영역을 기반으로 데이터를 인접하게 저장하고 사용자 질의를 영역 기반으로 그룹 처리함으로써 질의 처리 비용을 감소시킬 수 있다.

PowerPC 및 VxWorks를 이용한 예인선배열센서 데이터처리 플랫폼 구현에 관한 연구 (A Study on Implementation of Line Array Sensor Data Processing Platform Using PowerPC and Vxworks)

  • 임병선;김영길
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1603-1609
    • /
    • 2010
  • 본 논문은 해군 호위함급에 장착/운용되는 LAS(Line Array Sensor, 예인선배열센서)로부터 A, B, C그룹 수중음향 신호의 시리얼 데이터를 입력 받아 약속된 Protocol로 Packing하여, 고속 데이터통신과 Optic-fiber채널 장거리 전송이 가능한 SFM(Serial FPDP Module)을 통해 신호처리단으로 실시간 전송하는 센서데이터 입출력처리보드의 설계/제작 및 시험에 관해 언급한다. VME(Versa Module Eurocard) 6U크기의 한정된 보드 공간을 고려하여 Freescale사의 PowerPC계열인 MPC8265 CPU와, 기존 외장 FIFO등의 외부디바이스를 줄이고 자체 시뮬레이션 데이터생성 등을 위해 Altera사의 CycloneIII 계열 FPGA등을 사용하여 설계하고, 실시간 데이터 전송을 보장하며 각종 Device Driver, Peripheral Controller등의 Library를 제공하는 RTOS인 VxWorks를 Porting하여 소프트웨어를 개발하였다.

인터넷 GPS 자료처리 시스템에 관한 연구 (A Study on the Internet GPS Data Processing System)

  • 윤희천;최병길;이용욱
    • 한국측량학회지
    • /
    • 제22권2호
    • /
    • pp.145-150
    • /
    • 2004
  • 웹 기반 GPS 자료처리 시스템의 프로토콜을 개발하였다. 다양한 사용자가 획득한 GPS 자료를 웹을 통하여 전송하고 또한 결과를 전송 받을 수 있도록 하였으며, 특히 이기종(different operating system)의 클라이언트를 보유하는 다수의 사용자들의 GPS 자료를 수신 받아 사용자가 원하는 자료 처리 컴포넌트로 자료를 처리하여 결과를 사용자에게 전송하는 전형적인 ASP(Application Service Provider) 시스템으로 구성되었다. 또한 새로운 알고리즘의 업그레이드가 용이하도록 하였으며, 비동기 방식의 자료 처리로 인하여 효과적인 다중 접속의 운용과 높은 사용자의 유연성을 구현하였다. 효율적인 GPS 자료의 관리 및 운용을 위한 데이터베이스 컴포넌트도 함께 개발되어 향후 상시관측소등의 자료를 활용할 수 있도록 하였다. 현재 자료처리 모듈은 코드를 이용한 절대 및 상대측위가 완성되었으며, 향후 사용자 자료의 질적 조정, 반송파를 이용한 자료 처리 등의 다양한 자료처리 모듈이 포함될 예정이다.

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.