• 제목/요약/키워드: 빅데이터시각화

검색결과 232건 처리시간 0.027초

텍스트 마이닝을 활용한 대선 관련 SNS 분석 (SNS Analysis Related to Presidential Election Using Text Mining)

  • 권영우;정덕길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.361-363
    • /
    • 2017
  • 최근 소셜 미디어의 이용률이 폭발적으로 증가함에 따라, 방대한 데이터가 네트워크로 쏟아져 나오고 있다. 이들 데이터는 기존의 정형 데이터뿐만 아니라 이미지, 동영상 등의 비정형 데이터가 있으며, 이들을 포괄하여 빅데이터라고 불린다. 이러한 빅데이터는 오피니언 마이닝, 테스트 마이닝 등의 기술적인 분석 기법과 빅데이터 요약 및 효과적인 표현방법에 대한 시각화 기법에 대하여 활발한 연구가 이루어지고 있다. 이 논문은 인기 있는 사회연결망 서비스인 Twitter의 트윗을 수집하고, 빅데이터 분석 기법인 텍스트 마이닝을 활용하여 2017년 대선에 대하여 분석하였다. 또한 분석된 자료의 효과적인 전달을 위해 워드 클라우드 진행하였다. 이 논문을 위하여 인기 있는 SNS인 Twitter의 최근 7일간 트윗(tweet)을 수집하고 분석하였다.

  • PDF

경영분석 업무에 종사하는 비 기술기반 전공자를 위한 빅데이터 분석 및 시각화 기법 교육과정 제안 (Proposal of Big Data Analysis and Visualization Technique Curriculum for Non-Technical Majors in Business Management Analysis)

  • 홍필태;우종필
    • 실천공학교육논문지
    • /
    • 제12권1호
    • /
    • pp.31-39
    • /
    • 2020
  • 빅데이터 분석은 경영 및 산업현장에서 다양하게 분석되고 사용되고 있으며, 경영의사결정에서 중요한 역할을 한다. 경영분석 업무에 종사하는 빅데이터 분석 직무자의 직무능력은 반드시 미시적인 IT 기술 습득이 요구되는 것이 아니라, Data Scientist로서 다양한 경험과 인문학적 지식과 분석력이 요구되어진다. 그러나, 국가직무능력표준(NCS: National Competency Standards)을 기반으로 하는 국공립 교육기관 및 직무교육기관의 빅데이터 교육은 소프트웨어 공학적 측면에서 진행되고 있으며, 이러한 교육 방법론은 비 기술기반 전공자에게는 어렵고, 비효율적인 결과를 초래하기도 한다. 따라서, 우리는 현재의 빅데이터 플렛폼과 그와 관련된 기술을 분석하여, 그 중에서 현장 직무자에게 반드시 필요한 직무능력 요구수준이 무엇인지를 정의하였다. 그리고, 이를 바탕으로 비 기술기반 전공자를 위한 빅데이터 분석 및 시각화 기법 교육과정을 구성하였다. 특화된 본 교육과정을 경영현장에서 경영분석에 종사하는 금융기관 실무자를 중심으로 Pilot test를 실시한 결과 좀 더 개선된 교육효과를 얻을 수 있었다. 이에 본 연구에서 제시되는 교육방법은 산업전반에서 효율적으로 빅데이터 직무 수행과, 비 기술기반 전공 직무자를 대상으로 빅데이터 분석 및 시각화 교육이 활성화되는 계기가 될 것이다.

빅데이터 분석 도구 R 언어를 이용한 비정형 데이터 시각화 (Visualizing Unstructured Data using a Big Data Analytical Tool R Language)

  • 남수태;진금회;신성윤;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.151-154
    • /
    • 2021
  • 빅데이터 분석은 데이터 저장소에 저장된 대용량 데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 또한 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 그리고 빅데이터 분석 도구인 R언어를 이용하여 전-처리된 텍스트 데이터를 이용하여 다양한 시각화 함수를 통해 분석결과를 표현할 수 있다. 본 연구에서 사용된 데이터는 한국정보통신학회 학회지 논문 중에서 2021년 3월호 논문 21편을 대상으로 분석을 하였다. 최종 분석결과는 가장 많이 언급된 키워드는 "데이터"가 305회로 1위를 차지하였다. 따라서 이러한 분석결과를 바탕으로 연구의 한계와 이론적 실무적 시사점을 제시하고자 한다.

  • PDF

비정형 텍스트 테이터 분석을 위한 워드클라우드 기법에 관한 연구 (A Study on Word Cloud Techniques for Analysis of Unstructured Text Data)

  • 이원조
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.715-720
    • /
    • 2020
  • 빅데이터 분석에서 텍스트 데이터는 대부분 비정형이고 대용량으로 분석 기법이 정립되지 않아 분석에 어려움이 많았다. 따라서 텍스트 데이터 분석 기법의 하나인 빅데이터 워드클라우드 기법의 실무 적용시 문제점과 유용성 검증을 통한 상용화 가능성을 위해 본 연구를 수행하였다. 본 논문에서는 R 프로그램 워드클라우드 기법을 이용하여 "대통령 UN연설문"을 시각화 분석을 하고 이 기법의 한계와 문제점을 도출한다. 그리고 이를 해결하기 위한 개선된 모델을 제안하여 워드클라우드 기법의 실무 적용에 대한 효율적인 방안을 제시한다.

R-CDM 기반의 빅데이터 시각화 및 관리 시스템 구축 (Construction of Big Data Visualization and Management System Based on R-CDM)

  • 김승진;정창원;김태훈;이충섭;노시형;김지언;이고은;윤권하
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.38-39
    • /
    • 2019
  • 본 논문은 R-CDM 의료영상정보를 기반으로 ELK Stack 기술을 적용하여 획득한 데이터의 분석 결과를 시각화하기 위한 시스템에 대해 기술한다. 제안한 시스템은 의료 빅데이터의 검색, 수집 그리고 분석 결과를 모니터링 할 수 있으며, 특히 대량의 데이터의 변화와 데이터간의 차이를 확인할 수 있다. 본 연구에서 제안한 시스템은 수집된 의료영상 빅데이터에 대해 적용하여 현황과 처리결과 그리고 실시간 분석결과에 대한 모니터링을 통해 관리의 효율성을 높여 실시간 검색 및 분석 서비스 분야에 기여할 것으로 기대된다.

PyCUDA 프레임워크에서 볼륨 렌더링을 구현하기 위한 새로운 커널 디자인 (Novel Kernel Design for Implementing Volume Rendering in the PyCUDA Framework)

  • 이수호;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.349-351
    • /
    • 2022
  • 본 논문에서는 계산양이 큰 볼륨 렌더링을 구현할 수 있는 파이썬 기반의 CUDA(Computed Unified Device Architecture) 커널(Kernel) 디자인에 대해서 소개한다. 최근에 파이썬은 인공지능뿐만 아니라 서버, 보안, GUI, 데이터 시각화, 빅 데이터 처리 등 다양한 분야에서 활용이 되고 있기 때문에 인터페이스만을 위한 언어라는 색을 탈피한지 오래이다. 본 논문에서는 대용량 병렬처리 기법인 NVIDIA의 CUDA를 이용하여 파이썬 환경에서 커널을 디자인하고, 계산양이 큰 볼륨 렌더링이 빠르게 계산되는 결과를 보여준다. 결과적으로 C언어 기반의 CUDA뿐만 아니라, 상대적으로 개발이 효율적인 파이썬 환경에서도 GPU(Graphic Processing Unit)기반 애플리케이션 개발이 가능하다는 것을 볼륨 렌더링을 통해 보여준다.

  • PDF

하둡 기반 빅데이터 수집 및 처리를 위한 플랫폼 설계 및 구현 (Design and Implementation of Hadoop-based Platform "Textom" for Processing Big-data)

  • 손기준;조인호;김찬우;전채남
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.297-298
    • /
    • 2015
  • 빅데이터 처리를 위한 소프트웨어 시스템을 구축하기 위하여 필요한 대표적인 기술 중 하나가 데이터의 수집 및 분석이다. 데이터 수집은 서비스를 제공하기 위한 분석의 기초 작업으로 분석 인프라를 구축하는 작업에 매우 중요하다. 본 논문은 한국어 기반 빅데이터 처리를 위하여 웹과 SNS상의 데이터 수집 어플리케이션 및 저장과 분석을 위한 플랫폼을 제공한다. 해당 플랫폼은 하둡(Hadoop) 기반으로 동작을 하며 비동기적으로 데이터를 수집하고, 수집된 데이터를 하둡에 저장하게 되며, 저장된 데이터를 분석한 후 분석결과에 대한 시각화 결과를 제공한다. 구현된 빅데이터 플랫폼 텍스톰은 데이터 수집 및 분석가를 위한 유용한 시스템이 될 것으로 기대가 된다. 특히 본 논문에서는 모든 구현을 오픈소스 소프트웨어에 기반하여 수행했으며, 웹 환경에서 데이터 수집 및 분석이 가능하도록 구현하였다.

  • PDF

빅데이터를 활용한 해양 쓰레기의 종류 분석 및 시각화에 대한 연구 (A Study on the Analysis and Visualization of Marine Waste Using Big Data)

  • 이소영;홍석민;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.386-388
    • /
    • 2023
  • 전 세계적으로 해양 쓰레기 문제는 계속해서 심각해 지고 있으며 이에 대해 각국에서는 여러 해결 방안을 통해 문제를 해결하고 있다. 해양 쓰레기 문제를 해결하기 위해 많은 양, 여러 종류의 해양 쓰레기 데이터가 존재하지만 대부분의 수치자료가 막대그래프로 되어있어 한계가 있음을 확인하여 데이터를 다양하게 시각화하고, 이를 통해 해양 쓰레기 문제를 해결하는데 도움이 되고자 한다.

자유학기제 운영계획서에 대한 텍스트 빅데이터 분석 및 요약 (Text Big Data Analysis and Summary for Free Semester Operational Plan Document)

  • 이수안;박범준;김민규;신혜숙;김진호
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.135-146
    • /
    • 2019
  • 사회 각 분야에서 관련 주제에 대한 보다 직접적인 정보를 수집하고 분석하기 위하여 빅데이터 분석이 활발하게 활용되고 있다. 우리나라에서 사회적 관심과 파급 효과가 큰 교육 분야에서도 빅데이터 분석 기술을 활용하여 교육이나 정책의 효과를 파악하고 정책 수립에 활용하는 것에 관심이 높아지고 있다. 본 논문에서는 교육 분야에서 빅데이터 분석 기술을 활용하는 방안을 소개하고자 한다. 현재 핵심 교육정책 중의 하나인 자유학기제에 초점을 두고, 각 학교가 작성한 운영계획서에 대해 텍스트 분석과 시각화를 통하여 주요 관심 사항과 차이점에 대해 살펴보았다. 특히 서울과 강원도 지역의 중학교 자유학기제 운영계획서를 대상으로 지역적으로 주요 특성과 관심 사항이 서로 다르다는 것을 비교하였다. 본 연구는 빅데이터 분석 기술을 교육 분야의 필요와 요구에 따라 적용하고 활용하였다는 것에 큰 의의가 있다.