• 제목/요약/키워드: Big data Era

검색결과 361건 처리시간 0.024초

Performance Evaluation and Analysis of Multiple Scenarios of Big Data Stream Computing on Storm Platform

  • Sun, Dawei;Yan, Hongbin;Gao, Shang;Zhou, Zhangbing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권7호
    • /
    • pp.2977-2997
    • /
    • 2018
  • In big data era, fresh data grows rapidly every day. More than 30,000 gigabytes of data are created every second and the rate is accelerating. Many organizations rely heavily on real time streaming, while big data stream computing helps them spot opportunities and risks from real time big data. Storm, one of the most common online stream computing platforms, has been used for big data stream computing, with response time ranging from milliseconds to sub-seconds. The performance of Storm plays a crucial role in different application scenarios, however, few studies were conducted to evaluate the performance of Storm. In this paper, we investigate the performance of Storm under different application scenarios. Our experimental results show that throughput and latency of Storm are greatly affected by the number of instances of each vertex in task topology, and the number of available resources in data center. The fault-tolerant mechanism of Storm works well in most big data stream computing environments. As a result, it is suggested that a dynamic topology, an elastic scheduling framework, and a memory based fault-tolerant mechanism are necessary for providing high throughput and low latency services on Storm platform.

빅데이터, 비즈니스 애널리틱스, IoT: 경영의 새로운 도전과 기회 (Big Data, Business Analytics, and IoT: The Opportunities and Challenges for Business)

  • 장영재
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제24권4호
    • /
    • pp.139-152
    • /
    • 2015
  • With the advancement of the Internet/IT technologies and the increased computation power, massive data can be collected, stored, and processed these days. The availability of large databases has brought forth a new era in which companies are hard pressed to find innovative ways to utilize immense amounts of data at their disposal. Indeed, data has opened a new age of business operations and management. There are already many cases of innovative businesses reaping success thanks to scientific decisions based on data analysis and mathematical algorithms. Big Data is a new paradigm in itself. In this article, Big Data is viewed as a new perspective rather than a new technology. This value centric definition of Big Data provides a new insight and opportunities. Moreover, the Business Analytics, which is the framework of creating tangible results in management, is introduced. Then the Internet of Things (IoT), another innovative concept of data collection and networking, is presented and how this new concept can be interpreted with Big Data in terms of the value centric perspective. The challenges and opportunities with these new concepts are also discussed.

Efficient K-Anonymization Implementation with Apache Spark

  • Kim, Tae-Su;Kim, Jong Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권11호
    • /
    • pp.17-24
    • /
    • 2018
  • Today, we are living in the era of data and information. With the advent of Internet of Things (IoT), the popularity of social networking sites, and the development of mobile devices, a large amount of data is being produced in diverse areas. The collection of such data generated in various area is called big data. As the importance of big data grows, there has been a growing need to share big data containing information regarding an individual entity. As big data contains sensitive information about individuals, directly releasing it for public use may violate existing privacy requirements. Thus, privacy-preserving data publishing (PPDP) has been actively studied to share big data containing personal information for public use, while preserving the privacy of the individual. K-anonymity, which is the most popular method in the area of PPDP, transforms each record in a table such that at least k records have the same values for the given quasi-identifier attributes, and thus each record is indistinguishable from other records in the same class. As the size of big data continuously getting larger, there is a growing demand for the method which can efficiently anonymize vast amount of dta. Thus, in this paper, we develop an efficient k-anonymity method by using Spark distributed framework. Experimental results show that, through the developed method, significant gains in processing time can be achieved.

자율주행시대에 통근시간 만족도에 영향을 미치는 요인분석 (Analysis of Factors Affecting Satisfaction with Commuting Time in the Era of Autonomous Driving)

  • 장재민;천승훈;이숭봉
    • 한국ITS학회 논문지
    • /
    • 제20권5호
    • /
    • pp.172-185
    • /
    • 2021
  • 자율주행시대가 우리 삶에 다가오면서 삶의 변화에 많은 영향을 미칠 것으로 예상된다. 자율주행자동차가 등장하면 운전자의 부담을 줄임으로 차내에서 생산적 가치가 확장되는 만큼 이를 평가할 수 있는 지표개발이 필요하다. 이번 연구는 경기도 직장인 중 승용차를 이용하는 통근자를 대상으로 자율주행 자동차가 통근시간 및 통근시간 만족도에 어떠한 영향을 미치는지 분석하였다. 통근시간 및 통근시간 만족도는 비선형 관계(V)가 도출되었다. 여기서, 자율주행시대에 영향받을 가능성이 높은 비선형 구간인 통근시간 70분 이상영역을 중심으로 이항로지스틱 모형을 통해 분석하였다. 분석결과 자율주행시대의 영향변수로는 건강도, 수면시간, 근무시간, 여가시간 등이 도출되었다. 자율주행자동차의 등장은 이러한 변수를 개선시킬 가능성이 높으므로 장거리 통근자의 통근시간 만족도는 개선될 가능성이 높다.

빅 데이터를 이용한 소셜 미디어 분석 기법의 활용 (Utilization of Social Media Analysis using Big Data)

  • 이병엽;임종태;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제13권2호
    • /
    • pp.211-219
    • /
    • 2013
  • 빅 데이터를 활용한 분석 방법은 빅 데이터를 처리 할 수 있는 기술 기반으로 발전되어 오고 있다. 많은 IT 리서치 기관들이 빅 데이터를 통한 새로운 분석의 패러다임을 예견하고 있고, 또한 IT 벤더들을 중심으로 빅 데이터 처리를 위한 표준 기술들을 제시하고 있다. 빅 데이터는 IT 기기 및 환경의 발달과도 상호연관적이고 소셜 미디어를 주측으로 기존에 예측하지 못하는 비정형화된 데이터들을 정형화 하여, 이에 따른 다양한 분석, 예측 및 최적화에 초점이 맞추어 발달 하고 있다. 과거의 분석 기법은 정형화된 데이터를 기반으로 데이터 마이닝, OLAP, 통계 분석등을 통한 의사결정 도구로서 사용되어 왔다. 하지만 최근 빅데이터를 이용한 새로운 분석의 패러다임을 통해 분석기법의 다양화, 비정형 데이터 분석 등 새로운 형태의 기반 기술발전과 다양한 형태의 데이터를 통한 새로운 분석을 통해 통찰력을 높일 수 있다. 더욱이 고성능의 컴퓨팅 환경들의 발달과 표준화된 대용량 데이터 처리 기술 발달이 향후 조금 더 다양한 형태의 분석패턴을 만들어 갈 것이다. 따라서 본 논문은 빅 데이터를 통해 분석 가능한 다양한 기법을 알아보고, 기존의 데이터 마이닝 분석 기법을 통한 소셜 미디어의 분석 형태에 대한 활용 및 분석방안을 제시 하였다.

빅데이터를 활용한 언택트 시대의 1인 콘텐츠 유통 사례 분석 (A Case Study on the Distribution of Cultural Contents in the Untact Era Using Big Data)

  • 왕덕원;김정현;손혜지;전민준;최훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.301-302
    • /
    • 2021
  • 코로나19 사태 이후, '사회적 거리두기'가 시행되면서 기존의 '대중문화'나 예능 프로그램들이 양방향 커뮤니케이션을 하지 못하게 되며 쇠퇴하게 되었다. 이후 생겨난 '언택트 콘텐츠'는 BTS의 '방방콘'과 같은 언택트 공연이나 글로벌한 OTT(온라인 동영상 서비스)인 넷플릭스의 급성장 등으로 성장 가능성을 보여주고 있다. 또한 글로벌하고 언택트한 콘텐츠들은 대부분 온라인과 디지털에서 이루어지며 이는 엄청난 양의 빅데이터를 쏟아내게 된다는 것을 의미한다. 따라서 언택트 콘텐츠의 유통과정에서 쏟아지는 빅데이터를 분석하는 것은 소비자의 니즈를 파악하는 것에 많은 도움이 되며, 이에 따른 성장 기대치 또한 높을 것이다. 그래서 우리는 해당 연구주제와 관련해 기존 연구에서 진행되었던 연구 사례들을 찾아보고, 이를 통해 빅데이터가 언택트 시대의 콘텐츠 유통에 어떤 영향을 미칠 수 있을 것인지에 대해 분석하고자 한다.

  • PDF

농업·농촌 디지털 전환을 위한 빅데이터 활성화 방안 연구 (Big Data Activation Plan for Digital Transformation of Agriculture and Rural)

  • 이원석;손경자;전대호;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권8호
    • /
    • pp.235-242
    • /
    • 2020
  • 4차 산업혁명 시대를 맞아 우리 농업·농촌의 디지털 전환을 추진하고 다가오는 인공지능 시대를 대비하기 위하여, 필요한 양질의 데이터를 수집하고 분석해서 활용할 수 있는 체계와 시스템 구축이 필요하다. 이를 위해 농업인이나 농정담당자 등 다양한 이해 관계자들이 느끼는 문제점이나 이슈들을 조사·분석하여, 공동 활용을 위한 빅데이터 플랫폼 확충, 지속 가능한 빅데이터 거버넌스 구축 그리고 수요자 기반의 빅데이터 활용 기반 활성화 등 우리 농업·농촌의 디지털 전환을 추진하기 위해서 반드시 선결되어야 할 빅데이터 활성화를 위한 전략적 방안들을 제시하고자 한다.

Analysis of the Status of Artificial Medical Intelligence Technology Based on Big Data

  • KIM, Kyung-A;CHUNG, Myung-Ae
    • 한국인공지능학회지
    • /
    • 제10권2호
    • /
    • pp.13-18
    • /
    • 2022
  • The role of artificial medical intelligence through medical big data has been focused on data-based medical device business and medical service technology development in the field of diagnostic examination of the patient's current condition, clinical decision support, and patient monitoring and management. Recently, with the 4th Industrial Revolution, the medical field changed the medical treatment paradigm from the method of treatment based on the knowledge and experience of doctors in the past to the form of receiving the help of high-precision medical intelligence based on medical data. In addition, due to the spread of non-face-to-face treatment due to the COVID-19 pandemic, it is expected that the era of telemedicine, in which patients will be treated by doctors at home rather than hospitals, will soon come. It can be said that artificial medical intelligence plays a big role at the center of this paradigm shift in prevention-centered treatment rather than treatment. Based on big data, this paper analyzes the current status of artificial intelligence technology for chronic disease patients, market trends, and domestic and foreign company trends to predict the expected effect and future development direction of artificial intelligence technology for chronic disease patients. In addition, it is intended to present the necessity of developing digital therapeutics that can provide various medical services to chronically ill patients and serve as medical support to clinicians.

빅데이터 도입 효과 분석을 통한 빅데이터 성공요인에 관한 연구 (A study on the success factors of Big Data through an analysis of introduction effect of Big Data)

  • 정영기;석명건;김창재
    • 디지털융복합연구
    • /
    • 제12권11호
    • /
    • pp.241-248
    • /
    • 2014
  • 정보기술의 발달과 기반하드웨어 기술의 비약적인 발전은 데이터 사용의 폭을 넓혀주었고 이로 인해서 빅데이터 시대라는 새로운 패러다임을 제시하였다. 빅데이터 기술과 그 활용성과는 점차 늘어나는 추세이며 이에 기업들은 데이터의 중요성을 깨닫고 이를 활용하려는 움직임이 활발해지고 있다. 본 연구는 기업에서 빅데이터를 활용함에 있어 빅데이터 기술의 적극적 도입 및 활용을 위한 요인들을 선별해내고 이를 통한 중요도를 검증하고자 수행되었다. 연구모형에 포함된 빅데이터의 특성 요인으로는 예측성, 관리성, 지원성, 경쟁성을 선정하였다. 빅데이터에 대한 경험을 보유한 기업의 실무자를 대상으로 한 설문과 통계를 바탕으로 검증한 결과 관리성 측면이 가장 중요한 성공요인으로 채택되었으며, 본 연구의 결과는 기업에서의 빅데이터 도입 시에 빅데이터의 특성에 대한 좀더 객관적인 이해와 이를 통한 고려사항을 통해 좀더 효율성 있는 사용을 가능하게 정보를 제공하는 것이 가능할 것이다.

Big Numeric Data Classification Using Grid-based Bayesian Inference in the MapReduce Framework

  • Kim, Young Joon;Lee, Keon Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제14권4호
    • /
    • pp.313-321
    • /
    • 2014
  • In the current era of data-intensive services, the handling of big data is a crucial issue that affects almost every discipline and industry. In this study, we propose a classification method for large volumes of numeric data, which is implemented in a distributed programming framework, i.e., MapReduce. The proposed method partitions the data space into a grid structure and it then models the probability distributions of classes for grid cells by collecting sufficient statistics using distributed MapReduce tasks. The class labeling of new data is achieved by k-nearest neighbor classification based on Bayesian inference.