• 제목/요약/키워드: Big Data Environment

검색결과 959건 처리시간 0.036초

도로 주행환경 분석을 위한 빅데이터 플랫폼 구축 정보기술 인프라 개발 (Development of Information Technology Infrastructures through Construction of Big Data Platform for Road Driving Environment Analysis)

  • 정인택;정규수
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.669-678
    • /
    • 2018
  • 본 연구는 차량센싱데이터, 공공데이터 등 다종의 빅데이터를 활용하여 주행환경 분석 플랫폼 구축을 위한 정보기술 인프라를 개발하였다. 정보기술 인프라는 H/W 기술과 S/W 기술로 구분할 수 있다. 먼저, H/W 기술은 빅데이터 분산 처리를 위한 병렬처리 구조의 소형 플랫폼 서버를 개발하였다. 해당 서버는 1대의 마스터 노드와 9대의 슬래이브 노드로 구성하였으며, H/W 결함에 따른 데이터 유실을 막기 위하여 클러스터 기반 H/W 구성으로 설계하였다. 다음으로 S/W 기술은 빅데이터 수집 및 저장, 가공 및 분석, 정보시각화를 위한 각각의 프로그램을 개발하였다. 수집 S/W의 경우, 실시간 데이터는 카프카와 플럼으로 비실시간 데이터는 스쿱을 이용하여 수집 인터페이스를 개발하였다. 저장 S/W는 데이터의 활용 용도에 따라 하둡 분산파일시스템과 카산드라 DB로 구분하여 저장하는 인터페이스를 개발하였다. 가공 S/W는 그리드 인덱스 기법을 적용하여 수집데이터의 공간 단위 매칭과 시간간격 보간 및 집계를 위한 프로그램을 개발하였다. 분석 S/W는 개발 알고리즘의 탐재 및 평가, 장래 주행환경 예측모형 개발을 위하여 제플린 노트북 기반의 분석 도구를 개발하였다. 마지막으로 정보시각화 S/W는 다양한 주행환경 정보제공 및 시각화를 위하여 지오서버 기반의 웹 GIS 엔진 프로그램을 개발하였다. 성능평가는 개발서버의 메모리 용량과 코어개수에 따른 연산 테스트를 수행하였으며, 타 기관의 클라우드 컴퓨팅과도 연산성능을 비교하였다. 그 결과, 개발 서버에 대한 최적의 익스큐터 개수, 메모리 용량과 코어 개수를 도출하였으며, 개발 서버는 타 시스템 보다 연산성능이 우수한 것으로 나타났다.

빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구 (Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment)

  • 심장섭;이강욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1085-1089
    • /
    • 2015
  • 과거의 텍스트마이닝기법은 텍스트 자체의 복잡성과 텍스트 내에 산재한 변수의 자유도 때문에 분석 알고리즘을 구현하는데 어려움이 있었다. 의미 있는 정보를 얻기 위하여 어렵게 알고리즘을 구현했다고 하더라도, 기계적으로 텍스트 분석에 소요되는 시간이 텍스트를 사람이 직접 읽어 분석 하는 것보다 많은 시간이 요구 되었다. 그러나 최근 하드웨어와 분석 알고리즘의 발전과 함께 빅데이터라는 기술이 등장하였으며, 앞에서 설명한 제약사항을 극복할 수 있게 되었고, 텍스트마이닝을 통한 분석이 현실세계에서 그 가치를 충분히 인정받고 있다. 만약, 텍스트의 탐색 수준에서 벗어나 마이닝을 통하여 분석이 가능하다면 텍스트 분석에 소비되는 인적, 물적 자원의 비용을 절감할 수 있기 때문에 공공분야에서 절실히 요구되는 창조적인 일에 더 많은 자원을 효과적으로 활용할 수 있을 것이다. 이에 본 논문에서는 인적 자원이 수작업으로 하는 공공분야 문서 분류의 결과값과 빅데이터 환경에서 텍스트마이닝기반의 문서내 단어 빈도수(TF-IDF)와 문서간 코사인 유사도(Cosine Similarity)를 활용한 공공분야 문서분류의 결과값을 비교하여 평가한다.

  • PDF

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

차량에서 배출되는 대기 오염 물질의 빅 데이터에 대한 병렬 데이터 처리 모델의 강화 및 성능 최적화에 관한 연구 (A study on the enhancement and performance optimization of parallel data processing model for Big Data on Emissions of Air Pollutants Emitted from Vehicles)

  • 강성인;조성윤;김지환;김현정
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-6
    • /
    • 2020
  • 도로이동 오염원 대기환경 빅데이터는 상시 교통량 조사장비인 AVC, VDS, WIM, DTG를 활용한 차종, 속도, 하중 등 실시간 교통류 데이터와 GIS를 활용한 도로형상(오르막, 내리막, 회전구간) 데이터를 연계한 교통류 데이터로 구성되어 있다. 또한, 일반적인 데이터와 달리 단위시간 당 데이터가 많이 발생하고, 다양한 포맷을 가지고 있다. 특히, 이들 상세 교통류 정보로 수집되는 대용량의 실시간 데이터들은 약 총 740만 건/시간 이상이 수집되어 저장 및 가공되기 때문에 효율적으로 데이터를 처리할 수 있는 시스템이 필요하다. 따라서 본 연구에서는 도로이동 오염뭔 대기환경 빅데이터 시각화를 위한 오픈소스 기반의 데이터 병렬처리 성능 최적화 연구를 수행한다.

스리랑카 농촌 지역의 에너지 자립화 모델 개발 (Developing an Energy Self-Reliance Model in a Sri Lankan Rural Area)

  • 오동건;강용혁;김보영;윤창열;오명찬;김현구
    • 신재생에너지
    • /
    • 제20권1호
    • /
    • pp.88-94
    • /
    • 2024
  • This study explored the potential and implementation of renewable energy sources in Sri Lanka, focusing on the theoretical potential of solar and wind energy to develop self-reliant energy models. Using advanced climate data from the European Centre for Medium-Range Weather Forecasts and Global Solar/Wind Atlas provided by the World Bank, we assessed the renewable energy potential across Sri Lanka. This study proposes off-grid and minigrid systems as viable solutions for addressing energy poverty in rural regions. Rural villages were classified based on solar and wind resources, via which we proposed four distinct energy self-reliance models: Renewable-Dominant, Solar-Dominant, Wind-Dominant, and Diesel-Dominant. This study evaluates the economic viability of these models considering Sri Lanka's current energy market and technological environment. The outcomes highlight the necessity for employing diversified energy strategies to enhance the efficiency of the national power supply system and maximize the utilization of renewable resources, contributing to Sri Lanka's sustainable development and energy security.

비대면 교육 문제점 파악을 위한 빅데이터 텍스트 마이닝 분석 (Big data text mining analysis to identify non-face-to-face education problems)

  • 박성재;황욱선
    • 한국교육논총
    • /
    • 제43권1호
    • /
    • pp.1-27
    • /
    • 2022
  • 세계적으로 코로나19 바이러스가 만연해짐에 따라 다양한 분야에서 비대면화를 시행하게 되었고, 교육 시스템 또한 급격한 비대면화로 인해 많은 관심이 집중되기 시작하였다. 본 연구의 목적은 현재까지 계속적으로 변화하고 있는 교육환경에 맞추어 비대면 교육이 나아가야 하는 방향성에 대해서 분석하는 것이다. 본 연구에서는 다양한 의견들이 존재하는 소셜네트워크 빅데이터를 수집하기 위하여 텍스톰(Textom), 유씨넷6(Ucinet6) 분석 도구 프로그램을 사용하여 데이터를 시각화하였다. 연구 결과 '코로나'와 관련된 키워드가 주를 이루었으며 '기사', '뉴스'등의 높은 빈도의 키워드들이 존재했다. 분석 결과 네트워크 장애 및 보안 문제와 같은 비대면 교육에 관련한 다양한 이슈들을 확인해 볼 수 있었고, 분석 이후 교육 시장의 성장과 교육 환경의 변화에 따른 비대면 교육 시스템의 방향성에 관하여 연구하였다. 또한 빅데이터를 이용하여 분석한 비대면 교육시의 보안 강화 필요성과 수업 방식에 대한 피드백의 필요성이 존재한다.

빅데이터 스트림 환경에서의 센서 데이터 분류와 상황추론 (Context Inference and Sensor Data Classification of Big Data Stream Environment)

  • 유창근
    • 한국전자통신학회논문지
    • /
    • 제9권10호
    • /
    • pp.1079-1085
    • /
    • 2014
  • 변화하는 연속적인 데이터가 대량으로 유입되는 스트림 형태의 센서 데이터에 대한 분석은 궁극적으로 상황인식에 도달할 수 있어야 한다. 본 연구에서 가변적이며 연속적으로 입수되는 센서 데이터 스트림을 분석하여 상황을 추론하는 방안을 제안한다. 연속적인 스트림 형태를 가지는 센서 데이터를 분류하기 위하여 센서로 부터 보내온 각 센서 데이터에 내포된 값들을 평가하고, 시간에 따른 변화를 토대로 신뢰도를 계산하였다. 각 데이터들이 구성하는 상황요인을 설정하였고 각 요인들의 변화를 추정할 수 있도록 함으로써 상황 추론이 가능함을 보였다.

대용량 데이터 분석을 위한 맵리듀스 기반의 이상치 탐지 (Outlier Detection Based on MapReduce for Analyzing Big Data)

  • 홍예진;나은희;정용환;김양우
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.27-35
    • /
    • 2017
  • 가까운 미래에는 빅데이터의 많은 부분을 IoT 데이터가 차지할 것이라는 전망이 나오고 있다. 그에 따라, IoT 데이터의 많은 부분을 차치하는 센서 데이터에 관한 관심과 연구 또한 활발하게 진행되고 있다. 여러 분야에서 활용되고 있는 센서 데이터는 분석할 때 실제와는 다른 값인 이상치를 포함하게 되면 정확한 분석이 어려우며, 왜곡된 결과가 도출되어 활용할 수 없는 경우가 생긴다. 따라서 본 논문에서는 정확한 결과를 도출하기 위해 수집된 원자료를 분석하기 전에 이상치 탐지 및 제거를 하였다. 또한, 점점 늘어나고 있는 대용량의 데이터를 빠르게 처리하기 위해 메모리 접근방식인 스파크를 사용한 분산처리환경에서 처리하였다. 맵리듀스 기반의 이상치 탐지 및 제거는 총 4단계로 나누어 구현하였으며, 각 단계를 매퍼와 리듀스로 구현하였다. 제안한 기법의 평가를 위해서 3가지 환경에서 비교하였으며, 그 결과 이상치 탐지 및 제거를 하고자 하는 데이터의 용량이 커질수록 스파크를 이용한 분산처리환경에서의 처리가 가장 빠르다는 결과를 얻었다.

소셜 커뮤니케이션에 기반한 빅데이터의 시각화(Big Data Visualization) 전략에 관한 연구:빅데이터 시각화 유형에 따른 사용자 경험(UX)을 중심으로 (A Study on Big Data Visualization Strategy Based on Social Communication:Focusing on User Experience (UX) based on Big Data Visualization Types)

  • 추진기
    • 한국콘텐츠학회논문지
    • /
    • 제20권1호
    • /
    • pp.142-151
    • /
    • 2020
  • 우리는 이제 초연결사회(Hyper-Connectivity)에 살고 있다. 오늘날 대중이 소셜 커뮤니케이션을 적극적으로 활용하게 된 이유는 필요한 정보가 웹(Web) 공간을 통해서 소셜 빅데이터(Social Big Data)라는 이름으로 수집되고 분류되어 정보의 생태계인 빅데이터 시대를 만들어 가고 있기 때문이다. 빅데이터 정보가 대중에게 꼭 필요한 정보로 이용되기 위해서는 알기 쉽고 명확하게 전달할 수 있는 빅데이터 시각화작업이 필요하다. 본 연구는 소셜 빅데이터의 정보에 따른 시각화 유형을 분류하였고, 경험 평가대상으로 실제 빅데이터 시각화를 직접 활용하고 연구해야 하는 관련 전공생들과 일반인을 포함한 체험자를 대상으로 하였다. 체험자들의 경험을 분석한 결과, 데이터를 관리·분석·활용할 수 있는 시각화 전달방법에 대한 중요한 시사점이 도출되었다. 이에 따른 빅데이터 시각화 전략은 SNS상의 데이터 환경과 사용자의 눈높이에 맞는 방식으로 표현되어야 한다는 것이다. 앞으로 사용자를 위한 빅데이터 시각화가 상품서비스나 사회적 트렌드에 적용하여 활용된다면 개인의 상품 구매, 취향, 문화 등 그 역할과 적용 범위가 넓어지고 적용 대상이 많아질 것이라는 측면에서 중요한 자료가 될 것으로 생각한다.

빅데이터 품질이 기업의 경영성과에 미치는 영향에 관한 연구 (A study on the Effect of Big Data Quality on Corporate Management Performance)

  • 이충형;김영준
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.245-256
    • /
    • 2021
  • 4차산업혁명시대에 정보통신기술의 비약적인 발전, 고객구매 성향의 다양함, 복잡함은 산업 전체적으로 데이터의 양적 중가를 가져와 '빅데이터' 시대를 맞이하게 되었다. 빅데이터 시대는 데이터를 분석, 활용하여 기업의 전략적 의사결정에 활용하는 것이 기업의 핵심 역량으로 자리 잡게 되었다. 하지만 현재 빅데이터 연구들은 기술적 이슈와 미래 잠재 가치 중심이었다. 반면 기업이 보유한 내.외부 고객 빅데이터의 품질 및 활용 수준관리에 대한 연구와 논의는 부족하였다. 본 연구에서는 기업의 내.외부 빅데이터 품질관리 정보시스템 측면와 품질경영 측면으로 인식하여 영향요인을 도출하였다. 또한 빅데이터 품질관리, 빅데이터 활용 및 수준관리가 기업의 업무 효율화와 기업 경영성과에 유의한 영향을 미치는지 204명의 임직원 설문을 통해 조사하였고, 가설을 설정하여 검증하였다. 연구결과 경영층의 지원, 개인 혁신성, 경영환경변화, 빅데이터 품질활용 지표관리, 빅데이터 거버넌스 체계 마련이 기업 경영성과에 유의한 영향을 미쳤다.