• 제목/요약/키워드: Big data analysis system

검색결과 1,028건 처리시간 0.029초

육상 양식장 빅데이터 분석 시스템 개발을 위한 데이터 시각화 도구 개발 (Development of Data Visualization Tools for Land-Based Fish Farm Big Data Analysis System)

  • 예성빈;박정선;정희택;한순희
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.763-770
    • /
    • 2024
  • 현재 해수를 이용하는 육상 양식장에서는 실시간 수질 모니터링 및 시설 자동화 시스템, 용존산소 자동 공급장치 등 다양한 장비를 도입하여 사용하고 있다. 또한 양식장의 다양한 장비에서 수집되는 데이터는 수질 환경, 시설 운영, 작업장 영상정보 등 정형, 비정형 형태의 빅데이터를 생산한다. 양식장 운영 환경에서 생산되는 빅데이터는 운영 및 생산 효율 개선을 목표로 다양한 방법을 개발하고 적용을 시도하고 있다. 본 연구에서는 육상 양식장에서 생산되는 빅데이터를 효과적으로 분석하고 시각화하기 위한 시스템을 개발하는 것을 목표로, 양식장 빅데이터 분석 시스템에서 활용이 가능한 데이터 시각화 프로세스를 제시하고 빅데이터 시각화 도구를 개발하고 결과를 비교한다. 그리고 시계열 특성을 가지는 빅데이터의 비교 및 탐색이 직관적인 시각화 모델을 제시한다.

A Container Orchestration System for Process Workloads

  • Jong-Sub Lee;Seok-Jae Moon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권4호
    • /
    • pp.270-278
    • /
    • 2023
  • We propose a container orchestration system for process workloads that combines the potential of big data and machine learning technologies to integrate enterprise process-centric workloads. This proposed system analyzes big data generated from industrial automation to identify hidden patterns and build a machine learning prediction model. For each machine learning case, training data is loaded into a data store and preprocessed for model training. In the next step, you can use the training data to select and apply an appropriate model. Then evaluate the model using the following test data: This step is called model construction and can be performed in a deployment framework. Additionally, a visual hierarchy is constructed to display prediction results and facilitate big data analysis. In order to implement parallel computing of PCA in the proposed system, several virtual systems were implemented to build the cluster required for the big data cluster. The implementation for evaluation and analysis built the necessary clusters by creating multiple virtual machines in a big data cluster to implement parallel computation of PCA. The proposed system is modeled as layers of individual components that can be connected together. The advantage of a system is that components can be added, replaced, or reused without affecting the rest of the system.

Comparison of Sentiment Analysis from Large Twitter Datasets by Naïve Bayes and Natural Language Processing Methods

  • Back, Bong-Hyun;Ha, Il-Kyu
    • Journal of information and communication convergence engineering
    • /
    • 제17권4호
    • /
    • pp.239-245
    • /
    • 2019
  • Recently, effort to obtain various information from the vast amount of social network services (SNS) big data generated in daily life has expanded. SNS big data comprise sentences classified as unstructured data, which complicates data processing. As the amount of processing increases, a rapid processing technique is required to extract valuable information from SNS big data. We herein propose a system that can extract human sentiment information from vast amounts of SNS unstructured big data using the naïve Bayes algorithm and natural language processing (NLP). Furthermore, we analyze the effectiveness of the proposed method through various experiments. Based on sentiment accuracy analysis, experimental results showed that the machine learning method using the naïve Bayes algorithm afforded a 63.5% accuracy, which was lower than that yielded by the NLP method. However, based on data processing speed analysis, the machine learning method by the naïve Bayes algorithm demonstrated a processing performance that was approximately 5.4 times higher than that by the NLP method.

A Study on Efficient Building Energy Management System Based on Big Data

  • Chang, Young-Hyun;Ko, Chang-Bae
    • International journal of advanced smart convergence
    • /
    • 제8권1호
    • /
    • pp.82-86
    • /
    • 2019
  • We aim to use public data different from the remote BEMS energy diagnostics technology and already established and then switch the conventional operation environment to a big-data-based integrated management environment to operate and build a building energy management environment of maximized efficiency. In Step 1, various network management environments of the system integrated with a big data platform and the BEMS management system are used to collect logs created in various types of data by means of the big data platform. In Step 2, the collected data are stored in the HDFS (Hadoop Distributed File System) to manage the data in real time about internal and external changes on the basis of integration analysis, for example, relations and interrelation for automatic efficient management.

실내 환경 모니터링을 위한 빅데이터 클러스터 설계 및 구현 (Design and Implementation of Big Data Cluster for Indoor Environment Monitering)

  • 전병찬;고민구
    • 디지털산업정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.77-85
    • /
    • 2017
  • Due to the expansion of accommodation space caused by increase of population along with lifestyle changes, most of people spend their time indoor except for the travel time. Because of this, environmental change of indoor is very important, and it affects people's health and economy in resources. But, most of people don't acknowledge the importance of indoor environment. Thus, monitoring system for sustaining and managing indoor environment systematically is needed, and big data clusters should be used in order to save and manage numerous sensor data collected from many spaces. In this paper, we design a big data cluster for the indoor environment monitoring in order to store the sensor data and monitor unit of the huge building Implementation design big data cluster-based system for the analysis, and a distributed file system and building a Hadoop, HBase for big data processing. Also, various sensor data is saved for collection, and effective indoor environment management and health enhancement through monitoring is expected.

Big data platform for health monitoring systems of multiple bridges

  • Wang, Manya;Ding, Youliang;Wan, Chunfeng;Zhao, Hanwei
    • Structural Monitoring and Maintenance
    • /
    • 제7권4호
    • /
    • pp.345-365
    • /
    • 2020
  • At present, many machine leaning and data mining methods are used for analyzing and predicting structural response characteristics. However, the platform that combines big data analysis methods with online and offline analysis modules has not been used in actual projects. This work is dedicated to developing a multifunctional Hadoop-Spark big data platform for bridges to monitor and evaluate the serviceability based on structural health monitoring system. It realizes rapid processing, analysis and storage of collected health monitoring data. The platform contains offline computing and online analysis modules, using Hadoop-Spark environment. Hadoop provides the overall framework and storage subsystem for big data platform, while Spark is used for online computing. Finally, the big data Hadoop-Spark platform computational performance is verified through several actual analysis tasks. Experiments show the Hadoop-Spark big data platform has good fault tolerance, scalability and online analysis performance. It can meet the daily analysis requirements of 5s/time for one bridge and 40s/time for 100 bridges.

한국에서 빅데이터를 활용한 범죄예방시스템 구축을 위한 연구 (A Study on Construction of Crime Prevention System using Big Data in Korea)

  • 김성준
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.217-221
    • /
    • 2017
  • 범죄는 사전적 예방이 중요하다. 과거 범죄는 사후적으로 대처하고 이를 처벌하는데 집중하였다. 그러나 빅데이터 기술을 적용하면 범죄는 사전적으로 예방될 수 있다. 빅데이터는 범죄자 또는 잠재적 범죄자의 행동을 예측할 수 있기 때문이다. 이 글은 범죄예방을 위해 빅데이터 시스템을 어떻게 구축할지에 대해 논의한다. 구체적으로는 빅데이터의 비정형 데이터와 기본의 정형데이터를 결합하는 방식을 다루고 그 결과로서 범죄예방시스템을 설계한다. 이 연구를 통해 범죄 예방을 위해 빅데이터가 활용되는 가능성을 지문을 통해 기술하였고 이를 기초로 향후 범죄예방프로그램 및 연구에 도움을 줄 것으로 기대된다.

도서관 빅데이터 플랫폼을 활용한 공공도서관 빅데이터 분석 연구: 대전한밭도서관을 중심으로 (Big Data Analysis for Public Libraries Utilizing Big Data Platform: A Case Study of Daejeon Hanbat Library)

  • 온정미;박성희
    • 정보관리학회지
    • /
    • 제37권3호
    • /
    • pp.25-50
    • /
    • 2020
  • 2016년 1월 1일부터 공공도서관 빅데이터 플랫폼이 서비스되기 시작하여 도서관 빅데이터가 공공도서관 업무 개선에 활용되고 있다. 본 논문은 도서관 빅데이터 플랫폼 활용사례들을 살펴보고 도서관 빅데이터 플랫폼의 활용효과를 높일 수 있는 개선방안을 도출하고자 한다. 이를 위해 먼저, 도서관 빅데이터 플랫폼을 활용한 사례들에서 활용한 빅데이터와 활용유형분석 및 도출된 서비스/시행정책을 살펴본다. 다음으로, 현재 공공도서관에서 사용하는 통합도서관리시스템(ILUS)과 도서관 빅데이터 플랫폼 각각의 자료분석 방식을 비교함으로써 도서관 빅데이터 플랫폼의 한계점과 이점을 살펴본다. 사례분석 결과, 프로그램 기획 및 수행, 장서, 수서, 기타의 유형으로 빅데이터를 활용하였고 서비스/시행정책은 이용자 맞춤형 테마서가 및 독서진흥프로그램 진행, 장서활용도 증대, 특화주제에 기반한 수서 및 대출현황 데이터 공개로 요약되었다. 비교분석결과, ILUS는 자관의 자료실현황분석에 특화되어 있으며, 빅데이터 플랫폼은 다양한 속성(연령, 성별, 지역, 대출시기 등)에 따른 선택적 분석이 가능하여 분석시간단축과 유연한 분석이 가능하다. 마지막으로 사례분석과 비교분석에서 밝혀진 특징 및 한계점을 정리하고 개선방안을 제시한다.

공공 빅데이터 기반의 식품 가격 정보 분석 시스템의 설계 및 구현 (Design and Implementation of a Food Price Information Analysis System Based on Public Big Data)

  • 임종태;이현병;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.10-17
    • /
    • 2022
  • 최근 4차 산업혁명이 이슈가 되며 빅데이터를 이용한 많은 서비스들이 개발됐다. 이에 따라 빅데이터 중에서도 가장 가치 있는 데이터로 여겨지는 공공 데이터를 활용하기 위한 연구들이 진행되고 있다. 본 논문에서는 공공 빅데이터 기반의 식품 가격 정보 분석 시스템을 설계하고 구현한다. 제안하는 시스템은 다양한 출처로부터 다양한 형태로 수집되는 식품 가격 관련 데이터를 분석하여 특징에 따라 분류한다. 또한 제안하는 시스템은 빅데이터 분석 기법을 통해 식품의 가격에 영향을 미치는 요인을 분석하여 가까운 미래의 식품 가격을 예측하기 위한 자료로 활용한다. 마지막으로 제안하는 시스템은 데이터 시각화를 통해 분석된 결과를 사용자에게 제공한다.

비즈니스 인텔리전스와 빅데이터 분석의 비즈니스 응용 (A Business Application of the Business Intelligence and the Big Data Analytics)

  • 이기광;김태환
    • 산업경영시스템학회지
    • /
    • 제42권4호
    • /
    • pp.84-90
    • /
    • 2019
  • Lately, there have been tremendous shifts in the business technology landscape. Advances in cloud technology and mobile applications have enabled businesses and IT users to interact in entirely new ways. One of the most rapidly growing technologies in this sphere is business intelligence, and associated concepts such as big data and data mining. BI is the collection of systems and products that have been implemented in various business practices, but not the information derived from the systems and products. On the other hand, big data has come to mean various things to different people. When comparing big data vs business intelligence, some people use the term big data when referring to the size of data, while others use the term in reference to specific approaches to analytics. As the volume of data grows, businesses will also ask more questions to better understand the data analytics process. As a result, the analysis team will have to keep up with the rising demands on the infrastructure that supports analytics applications brought by these additional requirements. It's also a good way to ascertain if we have built a valuable analysis system. Thus, Business Intelligence and Big Data technology can be adapted to the business' changing requirements, if they prove to be highly valuable to business environment.