• 제목/요약/키워드: Big-Data Platform

검색결과 506건 처리시간 0.029초

빅데이터 유통 생태계에 기반한 단계별 빅데이터 유통 모델 개발에 관한 연구 (A Study on the Development of Phased Big Data Distribution Model Based on Big Data Distribution Ecology)

  • 김신곤;이석준;김정곤
    • 디지털융복합연구
    • /
    • 제14권5호
    • /
    • pp.95-106
    • /
    • 2016
  • 본 연구는 빅데이터 유통 생태계에 기반한 단계별 빅데이터 유통 모델 개발 방안을 제안한다. 제안하는 빅데이터 유통모델의 개발은 데이터 중개 및 거래 플랫폼 구축, 거래지원 시스템 구축, 데이터 유통 포털 및 빅데이터 거래소 연결망 구축과 같이 3단계로 구성된다. 데이터 중개 및 거래 플랫폼 구축 단계에서는 데이터 유통 및 거래 플랫폼이 구축되며, 총괄시스템과 등록 및 거래관리 시스템으로 구성되며, 거래지원 시스템 구축 단계에서는 원활한 데이터 거래를 위한 거래지원 시스템이 추가적으로 구축된다. 마지막 데이터 유통 포털 및 빅데이터 거래소 연결망 구축 단계에서는 여러 거래소들의 통합에 필요한 유통 관리 시스템이 구축된다. 새로운 기술, 프로세스, 데이터 과학 등을 이용하여 과거의 데이터 관리 시스템을 빠르게 대체해 나가고 있는 현대의 데이터 시장에서 데이터 유통시장 모델은 계속 진화하고 있으며, 비즈니스 업계에서 수용되고 있다. 따라서 제안하는 빅데이터 유통 모델은 멀지 않은 장래에 데이터를 관리하고 접근하기 위한 산업표준 확립 시 고려될 수 있다고 사료된다.

하둡 기반 대규모 작업 배치 및 처리 기술 설계 (Design of a Large-scale Task Dispatching & Processing System based on Hadoop)

  • 김직수;구엔 카오;김서영;황순욱
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.613-620
    • /
    • 2016
  • 본 논문에서는 대규모의 작업을 고성능으로 처리하기 위한 Many-Task Computing(MTC) 기술을 기존의 빅데이터 처리 플랫폼인 Hadoop에 적용하기 위한 MOHA(Many-Task Computing on Hadoop) 프레임워크에 대해 기술한다. 세부적으로는 MOHA의 기본 개념과 개발 동기, 분산 작업 큐에 기반한 PoC(Proof-of-Concept) 수행 결과를 제시하고 향후 연구 방향에 대해서 논의하고자 한다. MTC 응용은 각각의 태스크들이 요구하는 I/O 처리량은 상대적으로 많지 않지만, 동시에 대량의 태스크들을 고성능으로 처리해야하고 이들이 파일을 통해서 통신한다는 특징을 가지고 있다. 따라서 기존의 상대적으로 큰 데이터 블록 사이즈에 기반한 Hadoop 응용과는 또 다른 패턴의 데이터 집약형 워크로드라고 할 수 있다. 이러한 MTC 기술과 빅데이터 기술의 융합을 통해 멀티 응용 플랫폼으로 진화하고 있는 Hadoop 생태계에 신규 프레임워크로서 대규모 계산과학 응용을 실행할 수 있는 MOHA를 추가하여 기여할 수 있을 것이다.

기업의 현용기록 축적과 이용 방안 연구: 빅데이터 플랫폼으로서의 기업기록관리 (A Study on the Accumulation and Use of Corporate Records: Corporate Records Management as a Big Data Platform)

  • 김성우;이해영
    • 한국기록관리학회지
    • /
    • 제20권3호
    • /
    • pp.99-118
    • /
    • 2020
  • 기업의 기록관리를 통한 가치창출과 편익제고는 공공기관의 기록관리와 견주어도 부족함이 없는데 우리나라의 기업기록관리에 대해서는 아직까지 가이드라인도 제정되어 있지 않다. 글로벌 기업들은 업무과정의 산출물인 기록을 정보자산으로 축적하고 이용하여 업무의 시행착오를 줄이며 경쟁력을 강화해 나가고 있다. 우리나라 기업들도 기록관리에 대한 필요성은 공감하면서도 현용기록관리보다는 사사편찬이나 사료관리 등 비현용기록관리가 대부분인 실정이다. 따라서 이 연구에서는 우리나라에서 성공적으로 기록관리를 하고 있는 K사의 사례연구를 통하여 기업의 현용기록 축적과 이용을 통한 가치와 편익을 찾아보고, 기업기록관리를 활성화할 수 있는 방안을 제안하고자 했다. 이와 함께 4차 산업혁명시대의 중요한 자원인 데이터를 축적하고 이용하는 빅데이터 플랫폼으로서의 기업기록관리를 조명하며 기업기록관리의 활성화 방안을 제시하였다.

RHadoop을 이용한 보건의료 빅데이터 분석의 유효성 (Usefulness of RHadoop in Case of Healthcare Big Data Analysis)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.115-117
    • /
    • 2017
  • R은 강력한 분석과 가시화 기능을 제공함에 따라 빅데이터 시대에서의 기본 분석 플랫폼으로 각광받고 있음에도 불구하고 규모 확장성 미비에 따른 성능 제약이라는 단점을 가지고 있다. 이를 해결하기 위한 방법으로 RHadoop 패키지가 공개되어 있으며 이를 통해 R로 개발된 프로그램이 하둡을 통해 병렬 분산 처리가 가능한 특징이 있다. 본 논문에서는 공공데이터의 개방에 따라 인터넷을 통해 공개된 각종 보건의료 빅데이터의 분석에서 RHadoop 패키지의 활용이 얼마나 유효한 지를 검증하고자 하였다. 이를 위해 국민건강보험공단에서 제공한 2015년 진료내역정보를 이용하여 R과 RHadoop의 분석 성능을 비교 검증한 결과 RHadoop이 효과적으로 분석 성능을 개선시킬 수 있음을 입증하였다.

  • PDF

A Study on the Development of E-Commerce Shipping Platform in China

  • Ying, Lou;Lee, Su-Ho;Shou, Jian-Min
    • 한국항해항만학회지
    • /
    • 제40권2호
    • /
    • pp.73-82
    • /
    • 2016
  • With the advent of Internet era, e-commerce has become the focus of human's life. It leads a new direction of social development. As the representative of traditional industry, shipping industry is confronted with a series of difficulties, which have to break through the traditional and existing model to make their business for survival. With the increasing pricking up of market competition, shipping industry is now facing development bottle neck, but e-commerce provides a new way to solve the problem. This paper firstly describes the existing forms of the e-commerce shipping platform. Secondly analyzes the data for the situation of shipping industry in China, the data for expected functions of an e-commerce shipping platform and the data for how to choose a specific e-commerce shipping platform. Thirdly analyzes the potential risks of establishing e-commerce shipping platform in China. Based on the above researched, the paper provides a suggested model of the shipping e-commerce shipping platform in China.

Leveraging Big Data for Spark Deep Learning to Predict Rating

  • Mishra, Monika;Kang, Mingoo;Woo, Jongwook
    • 인터넷정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.33-39
    • /
    • 2020
  • The paper is to build recommendation systems leveraging Deep Learning and Big Data platform, Spark to predict item ratings of the Amazon e-commerce site. Recommendation system in e-commerce has become extremely popular in recent years and it is very important for both customers and sellers in daily life. It means providing the users with products and services they are interested in. Therecommendation systems need users' previous shopping activities and digital footprints to make best recommendation purpose for next item shopping. We developed the recommendation models in Amazon AWS Cloud services to predict the users' ratings for the items with the massive data set of Amazon customer reviews. We also present Big Data architecture to afford the large scale data set for storing and computation. And, we adopted deep learning for machine learning community as it is known that it has higher accuracy for the massive data set. In the end, a comparative conclusion in terms of the accuracy as well as the performance is illustrated with the Deep Learning architecture with Spark ML and the traditional Big Data architecture, Spark ML alone.

A study on the analysis of virtual reality platform API for virtual reality (VR) development

  • Lee, Byong-Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.23-30
    • /
    • 2020
  • 4차 산업혁명이 대두되면서 IoT, AI, Big Data, AR/VR/XR등 최신 기술이 나오고 있다. 하지만, 가상현실(VR) 기술 플랫폼 서비스 분야는 표준화 및 체계적인 지원이 없는 상태이다. 또한, 가상현실 관련 다양한 플랫폼 기술이 제시되어 개발에 선택해야 하는 API 선정에서 어려움을 겪고 있다. 본 연구에서는 가상현실 개발을 위한 방법과 사용자 서비스되고 있는 가상현실(VR) 기술에 대하여 분석했다. 또한, 개발플랫폼별 장점 및 단점을 제시해 개발자가 효율적인 플랫폼을 선정할 수 있도록 기준점을 제시하고자 한다. 또한, 가상현실에 사용되는 각종 HMD 기기에 대한 장점 및 단점을 비교에서 개발자 관점에서 효과적인 장비와 소프트웨어 플랫폼을 선정할 수 있도록 도와줄 것이다. 가상현실(VR) 개발환경시험은 Oculus 사의 제품을 사용했으며, 소프트웨어 개발환경으로 WebBased VR과 HMD 임베디드형의 두 가지 유형으로 시험을 했다.

빅데이터를 활용한 메타패션 의미구조 분석에 관한 연구: '메타버스' + '패션디자인' 키워드를 중심으로 (Analysis of Meta Fashion Meaning Structure using Big Data: Focusing on the keywords 'Metaverse' + 'Fashion design')

  • 김지연;이신영
    • 한국의류산업학회지
    • /
    • 제25권5호
    • /
    • pp.549-559
    • /
    • 2023
  • Along with the transition to the fourth industrial revolution, the possibility of metaverse-based innovation in the fashion field has been confirmed, and various applications are being sought. Therefore, this study performs meaning structure analysis and discusses the prospects of meta fashion using big data. From 2020 to 2022, data including the keyword "metaverse + fashion design" were collected from portal sites (Naver, Daum, and Google), and the results of keyword frequency, N-gram, and TF-IDF analyses were derived using text mining. Furthermore, network visualization and CONCOR analysis were performed using Ucinet 6 to understand the interconnected structure between keywords and their essential meanings. The results were as follows: The main keywords appeared in the following order: fashion, metaverse, design, 3D, platform, apparel, and virtual. In the N-gram analysis, the density between fashion and metaverse words was high, and in the TF-IDF analysis results, the importance of content- and technology-related words such as 3D, apparel, platform, NFT, education, AI, avatar, MCM, and meta-fashion was confirmed. Through network visualization and CONCOR analysis using Ucinet 6, three cluster results were derived from the top emerging words: "metaverse fashion design and industry," "metaverse fashion design and education," and "metaverse fashion design platform." CONCOR analysis was also used to derive differentiated analysis results for middle and lower words. The results of this study provide useful information to strengthen competitiveness in the field of metaverse fashion design.

수집된 경로데이터를 사용하는 내비게이션을 위한 대용량 경로조합 방법 (A Big-Data Trajectory Combination Method for Navigations using Collected Trajectory Data)

  • 구광민;이태호;박희민
    • 한국멀티미디어학회논문지
    • /
    • 제19권2호
    • /
    • pp.386-395
    • /
    • 2016
  • In trajectory-based navigation systems, a huge amount of trajectory data is needed for efficient route explorations. However, it would be very hard to collect trajectories from all the possible start and destination combinations. To provide a practical solution to this problem, we suggest a method combining collected GPS trajectories data into additional generated trajectories with new start and destination combinations without road information. We present a trajectory combination algorithm and its implementation with Scala programming language on Spark platform for big data processing. The experimental results proved that the proposed method can effectively populate the collected trajectories into valid trajectory paths more than three hundred times.

Predictive Analysis of Financial Fraud Detection using Azure and Spark ML

  • Priyanka Purushu;Niklas Melcher;Bhagyashree Bhagwat;Jongwook Woo
    • Asia pacific journal of information systems
    • /
    • 제28권4호
    • /
    • pp.308-319
    • /
    • 2018
  • This paper aims at providing valuable insights on Financial Fraud Detection on a mobile money transactional activity. We have predicted and classified the transaction as normal or fraud with a small sample and massive data set using Azure and Spark ML, which are traditional systems and Big Data respectively. Experimenting with sample dataset in Azure, we found that the Decision Forest model is the most accurate to proceed in terms of the recall value. For the massive data set using Spark ML, it is found that the Random Forest classifier algorithm of the classification model proves to be the best algorithm. It is presented that the Spark cluster gets much faster to build and evaluate models as adding more servers to the cluster with the same accuracy, which proves that the large scale data set can be predictable using Big Data platform. Finally, we reached a recall score with 0.73, which implies a satisfying prediction quality in predicting fraudulent transactions.