• 제목/요약/키워드: 빅 데이터 패턴 분석

검색결과 197건 처리시간 0.097초

빅데이터 분석을 통한 소방관의 경험법칙 검증 및 화재예방 활용 (Verification of firefighters' heuristics through big data analysis)

  • 박소현;박정훈;;신동일
    • 한국가스학회지
    • /
    • 제24권2호
    • /
    • pp.50-55
    • /
    • 2020
  • 소방관들의 현장 활동에서 활용도가 높은 축적된 경험법칙을 경기도내 화재발생 빅데이터와의 비교분석을 통해 신뢰성을 검토하고, 시기별, 요일별, 대상별로 보다 적절하게 화재 예방 활동에 활용될 수 있도록 개선된 정량적 모델화를 연구하였다. 소방관들의 직접 면담을 통해 공감도가 높은 경험법칙을 수집하였으며, 그 중 화재 모니터링 및 발생시점의 예측 관점에서 가장 중요하다 판단된 "금요일이 가장 화재 발생률이 높다"는 경험법칙을 대상으로, 경기도에서 2018년에 발생한 화재건수, 피해내역 등 빅데이터 비교분석을 실시하였다. 더 나아가 지역별, 시간대별, 건물유형별 요일과의 화재발생 패턴을 도출하였다. 연구를 통해 실효성이 확인된 경험법칙에 대해, 화재발생 빅데이터를 반영한, 지자체와 시기별 인자가 포함된 개선된 정량적 예측모델화 및 경험법칙의 구체화를 통해, 상대적으로 경험이 적은 소방관들도 의사결정에 효과적으로 활용할 수 있는 방안을 제시하였다.

부산지역 교통관련 기사를 이용한 비정형 빅데이터의 정형화와 시각적 해석 (Structuring of unstructured big data and visual interpretation)

  • 이경준;노윤환;윤상경;조영석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1431-1438
    • /
    • 2014
  • 2013년 1월 1일부터 2013년 12월 31일까지의 부산지역지인 국제신문과 부산일보의 기사들 중 제목에 '부산'과 '교통'을 동시에 포함한 2889건의 기사 내용의 관계 또는 관련 있는 데이터에 내재되어 있는 의미 있는 패턴을 찾아내고자한다. 데이터마이닝 (datamining)의 일부인 텍스트마이닝(textmining)의 기법을 이용하여 사회네트워크분석 (SNA; social network analysis)을 실시하였다. 비정형 데이터의 정형화를 위해 빅데이터의 저장, 처리 및 분석을 위해 자바 기반의 오픈소스 프레임워크인 하둡 생태계 (Hadoop ecosystem)의 HDFS와 맵리듀스 (MapReduce)를 Linux (Ubuntu-12.04LTS) 환경에서 이용하였고, 기존의 R패키지에서 제공되는 사회 네트워크 분석보다 효율적인 시각화를 위해 각 노드 및 선에 비율에 따른 가중치를 주어 색상과 굵기로 해석할 수 있도록 새로운 알고리즘을 구현하였다.

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

빅데이터 분석을 이용한 문단 내의 감정 예측 (Emotion Prediction of Paragraph using Big Data Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.267-273
    • /
    • 2016
  • 모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.

빅데이터 분석을 통한 중력식 항만시설 수정프로젝트 레벨의 상태변화 특성 분석 (A Study on Condition Analysis of Revised Project Level of Gravity Port facility using Big Data)

  • 나용현;박미연;장신우
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.254-265
    • /
    • 2021
  • 연구목적: 국내 항만시설의 진단을 통한 성능 및 안전에 대한 점검과 진단을 20년 넘게 진행되었지만 그 진단 이력과 결과를 활용한 중장기적인 시설개선과 성능개선을 위한 발전전략이나 방향이 현실적으로 작동하지 않고 있다. 특히, 사용년수가 오래된 항만구조물의 경우, 선박의 대형화와 사용빈도 증가, 기후변화로 인한 자연재해의 영향 등으로 안전성능과 기능적 면에서 상당히 많은 문제점을 내포하고 있다. 연구방법: 본 연구에서는 중력식 안벽에 대한 부재수준의 유지관리 이력 데이터를 수집하여 이를 빅데이터로써 정의하고 해당 데이터를 바탕으로 프로젝트 수준의 시설물의 노후화 패턴 및 열화를 추정하기 위한 예측근사모델을 도출하였다. 특히 GP 및 SGP 기법의 머신러닝 알고리즘을 통하여 생성된 상태기반 노후도 패턴 및 열화 근사모델에 대한 유효성 검토를 통해 빅데이터 활용에 적합한 모델을 상호비교하고 제안하였다. 연구결과: 제안된 기법의 적합성을 검토한 결과 GP기법은 RMSE 및 R2는 0.9854와 0.0721, SGP기법은 0.7246과 0.2518로 GP기법을 적용한 예측모델이 적합한 것으로 검토 되었다. 결론: 머신러닝 기법을 통해 이러한 연구는 향후 항만시설 데이터취합이 지속적으로 이루어진다면 향후 항만시설 투자의사결정에 중요한 역할을 할 것으로 기대한다.

빅데이터를 활용한 전자무역시스템에 대한 연구 (A Study for Electronic Trading Business System Using Big Data)

  • 이철웅;조성우;조세홍;황대훈
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권4호
    • /
    • pp.573-580
    • /
    • 2013
  • 정보기술과 기기의 발달은 정보화 사회를 가속화 시켰으며 이에 따라 정보의 생산과 확산, 그리고 소비가 훨씬 빠르고 편리해졌다. 사람들이 이제 언제 어디서든 무선통신과 스마트기기를 활용하여 정보를 창조, 공유, 소비할 수 있게 되었다. 또한, 기술의 발달은 기존의 텍스트가 주를 이루던 사용자의 데이터 소비패턴을 이미지, 음성, 영상의 대용량 데이터를 확산과 공유를 가능하게 되었으며 이를 통하여 개인이 소비하는 데이터의 양도 기하급수적으로 늘어나게 되었다. 과거와는 다르게 빠르게 생성되고 소비되는 방대한 데이터 정보 속에서 유용한 데이터를 찾아서 찾고 원하는 방향으로 알맞게 분석하는지가 더욱 중요한 부분이 되었다. 본 연구에서는 빅데이터에 대하여 살펴보고 전자무역 분야에서의 활용 방법을 보여준다.

서비스 비즈니스의 빅데이터 모집단 산정방식 오류에 관한 사례연구 (Case Study on Big Data Sampling Population Collection Method Errors in Service Business)

  • 안진호;이정선
    • 서비스연구
    • /
    • 제10권2호
    • /
    • pp.1-15
    • /
    • 2020
  • 최근 빅데이터가 사회, 경제적으로 중요해지면서, 무분별한 적용으로 인해 많은 문제가 발생하고 있다. 빅데이터의 활용가치는 데이터 안에 숨어있는 가치 있는 정보의 의미를 알아내는 것이 중요하다. 특히 고객의 행동패턴이나 경험 등을 예측하기 위하여, 기업내의 CRM (Customer Relationship Management)에서 추출한 정형데이터나 SNS(Social Network Service) 등에서 추출한 비정형데이터를 모집단으로 규정하고, 해석하는 과정 등에서 수많은 오류가 발생할 수 있지만, 대부분 이를 간과하고 있는 것이 현실이다. 이는, 데이터 분석기술 외에 고려해야 할 사항이 유의미한 패턴으로 나타나야 할 데이터들이 모집단 안에 빠져있음을 나타내는 것이기도 한다. 이에 본 연구에서는 그 모집단 설정의 오류 발생의 원인이 사람과 사람, 사람과 사물간의 관계와 상호작용이 강한 경우에 발생하는 데이터의 측정과 해석은 그 강도가 강한 경우에는 User eXerience(UX)와 ethnography(민속지학) 관점으로 수집된 데이터를 모집단에 포함하는 것이 중요하다는 것을 Big data 적용의 다양한 사례를 비교하여 도출하였다. 그리고 도출된 의미를 파악하여 최적의 방향을 제안하였다.

빅 데이터 기반의 식습관 분석 및 관련 상품 추천 온라인 몰 API (Big Data based Diet Analysis and Relevant Product Recommendation Online-mall API)

  • 장소은;김문현;나지현;홍장의
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1129-1132
    • /
    • 2019
  • 최근 현대인들은 식습관이 불규칙하고 서구화되면서, 건강상의 많은 문제를 겪고 있다. 이와 더불어 1인 가구의 증가와 간단한 구매 방법 등으로 인해 온라인 몰 사용자가 늘어나고 있다. 본 프로젝트는 이러한 추세를 바탕으로, 사용자가 자주 사용하는 온라인 몰에 축적된 데이터를 기반으로 사용자의 식습관을 분석한다. 뿐만 아니라, 이를 바탕으로 구매 패턴을 분석하여 사용자의 영양 상태를 개선시킬 수 있는 상품 추천 서비스를 제공한다. 사용자는 자주 사용하는 온라인 쇼핑몰에서 상품 구매를 함과 동시에 구매한 상품에 대해 시각화된 영양소 분석 결과와 구매 패턴 분석 결과를 제공받을 수 있다. 본 논문에서는 개발한 API를 통해 사용자는 부족한 영양소를 쉽게 파악하여 효율적으로 건강관리를 할 수 있게 된다. 더 나아가, 자신의 구매 패턴을 파악할 수 있게 되어 현명한 소비 습관을 만드는 데에 기여할 수 있다.

관세 정형 빅데이터를 활용한 우범공급망 거래패턴 선별 (Transaction Pattern Discrimination of Malicious Supply Chain using Tariff-Structured Big Data)

  • 김성찬;송사광;조민희;신수현
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.121-129
    • /
    • 2021
  • 본 연구에서는 데이터마이닝(Data Mining) 기법 중 하나인 연관관계분석(Association Rule Mining)을 적용하여 위험화물 선별모델을 구축함으로써 관세위험을 최소화하고자 한다. 이를 위해 관세청 수입신고서 빅데이터를 활용하여 연관관계분석 알고리즘인 어프라이어리 알고리즘(Apriori Algorithm)을 적용하고 공급망 간의 위험정도를 계산한다. 대규모의 수입신고 데이터로부터 해외공급자와 수입업체 간의 세율관련(과세가격, 품목, 중수량 등), 원산지표시 위반 등에 관련한 적발결과 관한 규칙셋(Rule Set)과 이 규칙들의 신뢰도(Confidence)을 확보하여 우범공급망 간의 거래패턴을 예측할 수 있는 선별모델을 구축한다. 총 2년 6개월 치의 수입신고 데이터를 활용하여 5-겹 교차검증(5-fold cross validation)을 수행한 결과 16.6%의 Precision과 33.8%의 Recall을 보였다. 이는 빈도기반 방법보다 Precision 기준 약 3.4배 Recall 기준 약 1.5배 높은 결과이다. 이로써 논문에서 제안하고 있는 방법이 관세위험을 줄일 수 있는 효과적인 방법임을 확인하였다.

인공지능 기반 수요예측 기법의 리뷰 (A review of artificial intelligence based demand forecasting techniques)

  • 정혜린;임창원
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.795-835
    • /
    • 2019
  • 최근 다양한 분야에서 '빅데이터'가 생성되었다. 많은 기업들은 인공지능(AI)을 기반으로 빅데이터 분석이 가능한 시스템을 구축하여 이익 창출을 시도하고 있다. 인공지능 기술을 접목함으로써 방대한 양의 데이터를 효율적으로 분석하고 효과적으로 활용하는 것은 점점 더 중요해지고 있다. 특히 재무, 조달, 생산 및 마케팅과 같은 다양한 분야에서 국가 및 기업 경영 관리에있어 최소의 오차와 최대의 정확도를 갖춘 수요예측은 절대적으로 중요한 요소이다. 이때 각 분야의 수요패턴을 고려한 적절한 모델을 적용하는 것이 중요하다. 전통적으로 쓰이는 시계열모델이나 회귀모델로도 비대해진 실제 데이터의 복잡한 비선형적인 패턴을 분석할 수 있다. 그러나 다양한 비선형 모델들 중에서 적절한 모델을 선택하는 것은 사전 지식 없이는 어려운 일이다. 최근에는 인공지능 기반의 기법들인 머신러닝이나 딥러닝 기법을 중심으로 이루어진 연구들이 이를 극복할 수 있음을 증명하고 있다. 뿐만 아니라 정형데이터와 이미지나 텍스트의 비정형 데이터 분석을 통한 수요예측도 높은 정확도를 갖춘 결과를 보이고 있다. 따라서 본 연구에서는 수요예측이 비교적 활발하게 일어나는 중요한 분야들을 나누어 설명하였다. 그리고 각 분야별로 갖는 특징적인 성격을 고려한 인공지능 기반의 수요예측 기법에 대해 머신러닝과 딥러닝 기법으로 나누어 소개하였다.