DOI QR코드

DOI QR Code

Apriori Based Big Data Processing System for Improve Sensor Data Throughput in IoT Environments

IoT 환경에서 센서 데이터 처리율 향상을 위한 Apriori 기반 빅데이터 처리 시스템

  • Received : 2021.06.23
  • Accepted : 2021.08.09
  • Published : 2021.10.31

Abstract

Recently, the smart home environment is expected to be a platform that collects, integrates, and utilizes various data through convergence with wireless information and communication technology. In fact, the number of smart devices with various sensors is increasing inside smart homes. The amount of data that needs to be processed by the increased number of smart devices is also increasing, and big data processing systems are actively being introduced to handle it effectively. However, traditional big data processing systems have all requests directed to cluster drivers before they are allocated to distributed nodes, leading to reduced cluster-wide performance sharing as cluster drivers managing segmentation tasks become bottlenecks. In particular, there is a greater delay rate on smart home devices that constantly request small data processing. Thus, in this paper, we design a Apriori-based big data system for effective data processing in smart home environments where frequent requests occur at the same time. According to the performance evaluation results of the proposed system, the data processing time was reduced by up to 38.6% from at least 19.2% compared to the existing system. The reason for this result is related to the type of data being measured. Because the amount of data collected in a smart home environment is large, the use of cache servers plays a major role in data processing, and association analysis with Apriori algorithms stores highly relevant sensor data in the cache.

최근 스마트 홈 환경은 무선 정보통신 기술과 융합을 통해서 다양한 데이터를 수집·통합·활용하는 플랫폼이 될 것으로 전망되고 있으며 실제로 스마트 홈 내부에는 다양한 센서를 탑재한 스마트 디바이스 수가 점점 증가하고 있다. 증가된 스마트 디바이스 수만큼 처리해야하는 데이터의 양도 증가하고 있으며 이를 효과적으로 처리하기 위해 빅데이터 처리 시스템이 활발하게 도입되고 있다. 그러나 기존 빅데이터 처리 시스템은 분산 노드에 할당되기 전 모든 요청이 클러스터 드라이버로 향하기 때문에 동시에 많은 요청이 발생하는 경우 분할 작업을 관리하는 클러스터 드라이버에 병목현상이 발생하고, 이는 네트워크를 공유하는 클러스터 전체의 성능감소로 이어진다. 특히 작은 데이터 처리를 지속해서 요청하는 스마트 홈 디바이스에서 지연율이 더 크게 나타난다. 이에 본 논문에서는 동시에 다수의 센서에서 요청이 발생하는 스마트 홈 환경에서 효과적인 데이터 처리를 위한 Apriori 기반 빅데이터 시스템을 설계하였다. 제안하는 시스템의 성능평가 결과에 따르면, 데이터 처리 시간은 기존 시스템에 비해 최소 19.2%에서 최대 38.6% 단축됐다. 이러한 결과가 발생한 이유는 측정되는 데이터의 형태와 관련이 있다. 스마트 홈 환경은 수집되는 데이터의 양은 방대하나 각 데이터의 용량은 작기 때문에 캐시 서버의 사용이 데이터 처리에 큰 역할을 하며, Apriori 알고리즘을 통한 연관도 분석으로 사용자의 행동 습관과 연관도가 높은 센서 데이터를 캐시에 저장하기 때문에 캐시 서버의 활용률이 매우 높다.

Keywords

Acknowledgement

이 논문은 2017년도 정부(과학기술정보통신부)의 재원으로 정보통신기술진흥센터의 지원을 받아 수행된 연구임(No. 2017-0-00724, 셀룰러 기반 산업 자동화 시스템 구축을 위한 5G 성능 한계 극복 저지연, 고신뢰, 초연결 통합 핵심기술 개발).

References

  1. M. R. Alam, M. B. I. Reaz, and M. A. M. Ali, "A review of smart homes-past, present, and future," in IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), Vol.42, No.6, pp.1190-1203, Nov. 2012, doi: 10.1109/TSMCC.2012.2189204.
  2. H. Lee, Y.-W. Kim, and K.-Y. Kim, "Study of in-memory based hybrid big data processing scheme for improve the big data processing rate," Journal of Korea Institute of Information, Electronics, and Communication Technology, Vol.12, No.2, pp.127-134, Apr. 2019. https://doi.org/10.17661/JKIIECT.2019.12.2.127
  3. K. Ji and Y. Kwon, "Performance comparison of python and scala APIs in spark distribured cluster computing system," Korea Multimedia Society, Vol.23, No.2, pp.241-246, Feb. 2020.
  4. H. C. Park and K. H. Cho, "Waste database analysis joined with local information using association rules," Journal of The Korean Data Analysis Society, Vol.7, No.3, pp.763-772, 2005.
  5. J. M. Choi, D. W. Jeoung, J. S. Yoon, and S. J. Lee, "Digital forensics investigation of redisdatabase," KIPS Transactions on Computer and Communication Systems, Vol.5, No.5, pp.117-126, May 2016. https://doi.org/10.3745/KTCCS.2016.5.5.117
  6. B. M. Seo, B. S. Jang, H. S. Oh, and H. J. Park, "Restful, redis based API thin server platform design for automatic API generation and data processing performance," The Journal of Korean Institute of Communications and Information Sciences, Vol.44, No.5, pp.895-903. 2019. https://doi.org/10.7840/kics.2019.44.5.895
  7. G. Chimamiwa, M. Alirezaie, F. Pecora, and A. Loutfi, "Multi-sensor dataset of human activities in a smart home environment," Data in Brief, Vol.34, pp.106632, 2021, https://doi.org/10.1016/j.dib
  8. G. Chimamiwa, M. Alirezaie, F. Pecora, and A. Loutfi, "Multi-sensor dataset of human activities in a smart home environment," Mendeley Data, V1, 2020, doi: 10.17632/t9n68ykfk3.1