• 제목/요약/키워드: 빅데이터 분석 플랫폼

검색결과 339건 처리시간 0.025초

빅데이터 수집 처리를 위한 분산 하둡 풀스택 플랫폼의 설계 (Design of Distributed Hadoop Full Stack Platform for Big Data Collection and Processing)

  • 이명호
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.45-51
    • /
    • 2021
  • 급속한 비대면 환경과 모바일 우선 전략에 따라 해마다 많은 정형/비정형 데이터의 폭발적인 증가와 생성은 모든 분야에서 빅데이터를 활용한 새로운 의사 결정과 서비스를 요구하고 있다. 그러나 매년 급속히 증가하는 빅데이터를 활용하여 실무 환경에서 적용 가능한 표준 플랫폼으로 빅데이터를 수집하여 적재한 후, 정재한 빅데이터를 관계형 데이터베이스에 저장하고 처리하는 하둡 에코시스템 활용의 참조 사례들은 거의 없었다. 따라서 본 연구에서는 스프링 프레임워크 환경에서 3대의 가상 머신 서버를 통하여 하둡 2.0을 기반으로 쇼셜 네트워크 서비스에서 키워드로 검색한 비정형 데이터를 수집한 후, 수집된 비정형 데이터를 하둡 분산 파일 시스템과 HBase에 적재하고, 적재된 비정형 데이터를 기반으로 형태소 분석기를 이용하여 정형화된 빅데이터를 관계형 데이터베이스에 저장할 수 있게 설계하고 구현하였다. 향후에는 데이터 심화 분석을 위한 하이브나 머하웃을 이용하여 머신 러닝을 이용한 클러스터링과 분류 및 분석 작업 연구가 지속되어야 할 것이다.

블록체인 네트워크를 이용한 소규모 분산전력 거래플랫폼의 정산소요시간에 관한 연구 (A Study on the Accounts Balancing Time of Small Distributed Power Trading Platform Using Block Chain Network)

  • 김영곤;허걸;최중인;위재우
    • 에너지공학
    • /
    • 제27권4호
    • /
    • pp.86-91
    • /
    • 2018
  • 이 논문은 블록체인[1] 기술을 활용한 소규모 분산전력자원 거래 플랫폼에서의 정산소요시간에 대한 고찰이다. 먼저 연구에 적용한 "AMI 인프라를 활용한 국민 VPP 에너지 관리 시스템 (AI 기반의 에너지 거래 플랫폼)"을 소개한 후, 테스트베드 환경 내 IoT 전력 빅데이터[2] 분석으로 인증된 프로슈머의 발전(감축)량에 근거하여 지급되는 블록체인 암호화폐 코인의 정산과정 그리고 소요시간에 대하여 알아본다. 더불어 기존 람다 아키텍처에 MapD[3]를 적용한 GPU Fast 빅데이터 전력 빅데이터 분석 시스템 구성을 제시 한다.

빅데이터 분석 서비스 운영 관리를 위한 빅데이터 서비스 브로커 설계 및 개발 (Development of bigdata service brokers for bigdata analysis service operation and management)

  • 김바울;김상규;김수빈;구원본
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.125-127
    • /
    • 2021
  • 본 논문에서는 기존의 산업 및 서비스 변화에 따라 발생하는 빅데이터 분석 서비스 처리를 위한 빅데이터 분석 서비스 브로커 시스템을 제안한다. 기존의 빅데이터 분석 시스템은 분석하는 시간 동안 지속적으로 자원을 점유하고 있어야 하며, 이러한 서비스를 이용하기 위해 내부에 대규모의 시스템을 구축하고 지속적으로 운영해야하는 단점이 존재한다. 본 논문에서는 빅데이터 분석에 필요한 자원을 효과적으로 사용하기 위해 클라우드 기반의 자원 관리와 연계하고 서비스 이용을 용이하게 하기 위해 단일 엔드포인트 기반의 빅데이터 분석 서비스 호출 구조를 설계하였다. 이를 통해 빅데이터 서비스 분석에 소요되는 자원 점유에 따라 동적으로 자원을 생성 관리하여 자원을 보다 효과적으로 이용할 수 있는지 테스트베드를 구축하여 서비스 이용 및 자원 사용을 효과적으로 하는지 확인하였다. 또한, 이를 통해 대규모 자원을 지속적으로 점유해야하는 빅데이터 분석 플랫폼의 자원사용에 대한 한계를 일부 해소하여 자원을 효과적으로 이용할 수 있는 것을 확인하였다.

지식베이스를 이용한 플랜트 엔지니어링 분석 플랫폼 개발 (Development of Plant Engineering Analysis Platform using Knowledge Base)

  • 고영동;김현수
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.139-152
    • /
    • 2022
  • 플랜트를 대상으로 하는 엔지니어링의 업무영역은 플랜트의 기획, 설계, 시공, 운영 및 폐기에 이르는 생애주기에 걸친 생산성과 성능 및 품질에 직접적인 영향을 미치는 복합적인 기술분야이다. 이때 발생하는 다양한 유형의 데이터를 활용하여 의사결정을 활용하는 것은 후속 과정뿐만 아니라 생애주기 관점에서도 중요한 영향을 미치고 있다. 하지만 이러한 데이터를 통합적으로 관리하고 분석할 수 있는 시스템은 부족하다. 본 논문에서는 플랜트 생애주기에서 발생하는 데이터를 관리하고 활용할 수 있는 지식베이스 기반 플랜트 엔지니어링 분석 플랫폼을 개발하였다. 플랫폼에서는 기수집된 엔지니어링 데이터를 전처리한 지식베이스를 제공하고, 이를 레퍼런스 데이터로 AI 모델에 활용하도록 분석 기능과 시각화를 제공한다. 사용자는 플랫폼을 통한 선행기술과 축적된 지식의 활용을 통해 데이터 분석을 진행하고 시각화를 의사결정에 활용해 경험에만 의존하던 공사를 합리적이고 체계적으로 관리할 수 있다.

빅데이터 기반의 도시정보·접대중교통근성 분석 플랫폼 구축 방안에 관한 연구 -광주광역시를 중심으로- (A study on the Construction of a Big Data-based Urban Information and Public Transportation Accessibility Analysis Platforms- Focused on Gwangju Metropolitan City -)

  • 이상근;유승민;이준;김대일
    • 스마트미디어저널
    • /
    • 제11권11호
    • /
    • pp.49-62
    • /
    • 2022
  • 최근 전 세계적으로 빅데이터, AI, IoT, 자율주행, 디지털트윈 등 스마트시티 솔루션이 발달하면서 다양한 스마트기기와 SNS가 확산하고 사람들이 도처에 남긴 행적이 기록되면서 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 '빅데이터' 환경을 활용한 스마트시티 구축이 활발하게 진행 중이다. 본 연구의 목적은 4차 산업혁명에 따른 지속가능한 스마트시티의 도시정보·대중교통 접근성에 있어 시민의 교통 편의성 향상 및 효율적인 정책수립을 위해 빅데이터 기반의 객관적이고 체계적인 분석 모델을 개발하고, 지속가능한 도시의 공공·민간 DB를 활용한 빅데이터 기반 대중교통 접근성 및 정책관리 플랫폼 구축의 방법론을 도출하는데 있다. 이를 위해 광주광역시를 대상으로 상세생활권을 구분하고 기초 생활편의시설 접근성 및 빅데이터 기반 대중교통 시스템을 분석하였다. 그 결과, 1) 대중교통 네트워크 평가를 위한 빅데이터 활용, 2) 빅데이터 기반의 교통 수단/서비스 의사결정지원, 3) 도심 교통 네트워크 모니터링 서비스 제공, 4) 주차수요 발생원 분석 및 개선방안 제공과 같은 빅데이터 기반 도시정보·대중교통 접근성 플랫폼 구축을 제안하였다.

빅데이터 기반의 실시간 네트워크 트래픽 분석 플랫폼 설계 (On the Design of a Big Data based Real-Time Network Traffic Analysis Platform)

  • 이동환;박정찬;유찬곤;윤호상
    • 정보보호학회논문지
    • /
    • 제23권4호
    • /
    • pp.721-728
    • /
    • 2013
  • 빅데이터는 오늘날 가장 각광받고 있는 데이터 수집 및 분석기술의 경향으로, 대량의 비정형 데이터 분석을 요구하는 다양한 분야에 접목되어 효용성을 인정받고 있다. 네트워크 트래픽 분석 역시 대량의 비정형 데이터를 다루는 분야로, 빅데이터 접목시 그 효과가 극대화될 수 있다. 따라서 본 논문에서는 고도의 보안이 요구되는 군 C4I망과 같은 내부망 환경의 침해사고 및 이상행위를 실시간으로 탐지하기 위한 빅데이터 기반의 네트워크 트래픽 분석 플랫폼(RENTAP)을 소개한다. 빅데이터 분석 지원을 위해 최근 각광받고 있는 오픈소스 솔루션들을 대상으로 비교 분석을 수행하였으며, 선정된 솔루션을 기반으로 고안된 최종 설계에 대해서 설명한다.

블록체인 기반 탈중앙화 사물인터넷 플랫폼 연구

  • 최종석;박종규;김명길;김호원
    • 정보보호학회지
    • /
    • 제27권6호
    • /
    • pp.5-14
    • /
    • 2017
  • 사물인터넷은 응용서비스, 플랫폼, 네트워크, 디바이스의 4계층으로 이루어진다. 사물인터넷의 전체적인 구조도를 보면, 다양한 디바이스가 사물인터넷 플랫폼에 센싱 빅데이터를 전송하고, 사물인터넷 플랫폼에서 수집된 데이터를 이용하여 응용서비스에 정형화된 데이터 서비스를 제공할 수 있다. 그러나 현재의 사물인터넷 플랫폼의 구조는 수백만개의 디바이스에서 생성되는 데이터를 관리하여 플랫폼에 높은 트래픽과 계산부하가 야기될 수 있는 구조이며 이로 인해 해당 플랫폼과 연동된 모든 응용서비스의 가용성이 낮아지고 단일장애지점(Single point of failure)의 원인을 제공한다. 본 논문에서는 단일장애지점에 대한 문제점을 해결하기 위해서 중앙화 된 사물인터넷 플랫폼 대신에 탈중앙화 된 사물인터넷 구조를 위한 방법을 제안하고자 한다. 특히 사물인터넷 플랫폼의 요구사항을 분석하여 탈중앙화 된 사물인터넷 플랫폼에서의 요구사항을 도출한다. 더 나아가 블록체인기반의 탈중앙화 된 사물인터넷 플랫폼을 통해서 기존의 4계층 사물인터넷 구조에서 3계층 사물인터넷 구조로 나아가는 방법을 제시한다.

Design and Implementation of a Big Data Analytics Framework based on Cargo DTG Data for Crackdown on Overloaded Trucks

  • Kim, Bum-Soo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권12호
    • /
    • pp.67-74
    • /
    • 2019
  • 본 논문에서는 과적 화물차량 단속을 위한 대용량 화물 DTG 데이터 분석 플랫폼을 설계 및 구현한다. DTG(digital tachograph)는 차량운행기록을 실시간으로 저장하는 장치로서, 차량의 GPS, 속도, RPM, 제동유무, 이동거리 등 차량운행 관련 데이터가 1초 단위로 기록된다. 차량 운행 패턴 및 분석을 하기 위해서는 DTG 데이터의 빠른 처리가 필수적이며, 특히 대용량 DTG 데이터를 가공 및 변환하기 위해서는 빅데이터 분석 플랫폼이 필요하다. 본 논문에서는 오픈소스 기반의 빅데이터 프레임워크인 스파크(Spark)를 이용하여 과적차량 단속을 위한 대용량 화물 DTG 데이터의 분석 플랫폼을 구현하였다. 구현 결과, 실제 대용량 화물 DTG 데이터를 GIS 데이터로 변환하여 지도상에 표현하고 단속 추천 지점을 보여준다.

기계학습을 고려한 원전 빅데이터 시스템 (A Practice of Nuclear Bigdata System for Machine Learning)

  • 박재관;김택규;장귀숙;성승환;구서룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.515-517
    • /
    • 2021
  • 원전 빅데이터를 효율적으로 분석하고 수집된 데이터를 인공지능 서비스에 활용할 수 있도록 제공하기 위해서는 원전 데이터에 특화된 빅데이터 플랫폼이 필요하다. 단순히 시간 순으로 나열된 원시(Raw) 데이터는 의미있는 단위로 논리적으로 구분되어 관리될 필요가 있고, 사건/사고의 발생에 따른 분류가 필요하다. 뿐만 아니라, 다수의 데이터들을 분석하여 수천 개의 계측신호들 중에서 원하는 목적에 적합한 신호가 어떠한 것들인지를 찾아낼 수 있는 데이터 분석이 지원될 필요가 있다. 이는 기계학습 애플리케이션을 개발할 때 필수적인 고품질의 데이터 제공에 크게 기여할 수 있다. 본 연구에서는 원전 데이터를 효과적으로 처리하고 분석하기 위한 원전 데이터 전처리 및 분석 기술을 고안하고 이를 빅데이터 저장 인프라와 통합한 원전 빅데이터 처리 체계를 소개한다. 본 연구의 결과물은 본격적인 원전 빅데이터 시스템 구축 사업에 활용될 것으로 기대된다.

서울시 통합물관리를 위한 물정보 데이터 플랫폼 구축방안 (Development of a Water Information Data Platform for Integrated Water Resources Management in Seoul)

  • 윤선권;최현석;조재필;장석환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.76-76
    • /
    • 2020
  • 국가 물관리일원화 이후, 지방하천 관리에 대한 지자체 역할과 권한이 커지고 있으며, 중앙정부의 물관리 수준에 부합하는 데이터관리 체계구축 및 지속적인 품질관리(Quality Control, QC)와 표준화(Standardization) 기술개발이 요구되고 있다. 지자체의 경우 기존의 행정구역별로 분산 관리해오던 물관리 시스템을 유역단위로 전환할 필요가 있으며, 국가하천 구간과 연계한 종합적인 관리가 필요한 실정이다. 서울시의 물관리 시스템은 자치구별로 산재해 있으며, 관리 주체 및 해당 변수에 따라 제공되는 정보가 다르고 하천유역 단위로 분류되어 있지 않다. 따라서, 서울시와 자치구, 중앙정부 및 관련 기관과의 연계성 있는 정보제공을 위한 데이터 플랫폼 구축 기술개발이 필요한 실정이다. 본 연구에서는, 빅데이터, AI 기술을 활용한 물정보의 품질관리 자동화 기술개발과 지속적인 유지관리 및 표준화 정보제공 시스템 구축 기능을 포함하는 서울시 통합물관리 데이터 플랫폼 구축 목표 모델을 제시하였으며, 서울시 물관리 체계와 관련하여 SWAT 분석을 통한 단계별 사업추진 로드맵을 도출하였다. 분석결과, 서울시 통합물관리 플랫폼 구축을 위해서는 유역별 수량-수질 통합 모니터링 및 모델링 기술개발, 빅데이터 기반 물 정보화 플랫폼 구축 기술개발, 지방하천 유역 거버넌스 구축 및 법제도 정비 방안 마련이 요구되며, 관련하여 주요 이슈(3대 핵심전략, 10개 단위과제)를 도출하여 관련 연구과제를 제안하였다. 마지막으로, 서울시 통합물관리 정책 실현을 위해서는 법제도 마련이 시급하며, 서울시 '통합물관리 기본조례' 제정을 통한 기반을 조성할 필요가 있음을 시사하였다. 또한, 다양한 분야 이해관계자 협의체인 '서울시 통합물관리위원회(가칭)'의 거버넌스를 구성하여 운영하는 것이 현실적이며, 한강유역관리 및 지방하천 관리와 관련한 중추적인 역할 수행과 쟁점 논의 등 합리적 합의가 가능할 것으로 기대한다.

  • PDF