• 제목/요약/키워드: Prediction by bigdata

검색결과 56건 처리시간 0.03초

정형 및 비정형 데이터를 이용한 농산물 구매량 예측: 파프리카를 중심으로 (Prediction of Agricultural Purchases Using Structured and Unstructured Data: Focusing on Paprika)

  • ;이경희;라형철;최은선;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.169-179
    • /
    • 2021
  • 소비자의 식품소비행동은 소비자 패널 데이터와 같은 정형 데이터 뿐 아니라 매스미디어와 소셜미디어(SNS) 등 비정형 데이터로부터 영향을 받을 가능성이 높아지고 있다. 본 연구에서는 식품소비 관련된 정형 데이터와 비정형 데이터를 연계한 융합데이터 셋에 대하여 딥러닝 기반의 소비예측 모델을 생성하고 이를 검증한다. 연구의 결과는 정형 데이터와 비정형 데이터를 결합할 때 모델 정확도가 향상되었음을 보여주었다. 또한 비정형 데이터가 모델 예측 가능성을 향상시키는 것으로 나타났다. 변수들의 중요도를 식별하기 위해 SHAP 기법을 사용한 결과 블로그 및 비디오 데이터 관련 변수가 상위 목록에 있었고, 파프리카 구매 금액과 양의 상관관계가 있음을 알 수 있었다. 또한 실험 결과에 따르면 머신러닝 모델이 딥러닝 모델보다 높은 정확도를 보였고, 기존의 시계열 분석 모델링에 대한 효율적인 대안이 될 수 있음을 확인하였다.

실외공기측정기 자료를 이용한 도심 기상 예측 기계학습 모형 비교 (Comparison of Machine Learning Techniques in Urban Weather Prediction using Air Quality Sensor Data)

  • 박종찬;박헌진
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.39-49
    • /
    • 2021
  • 최근 국가 관측망, 기업 공기 측정기 등을 통해 많고 다양한 기상 데이터가 수집되고 있다. 기계학습 기법을 통해 기상 예측하려는 노력이 곳곳에서 이루어지고 있으며, 국내 미세먼지는 농도가 증가해오고 사람들의 관심이 높아 가장 관심있는 예측 대상 중 하나이다. 본 연구에서는 서울시 전역에 설치된 840여 개실외공기측정기 데이터를 사용하여 PM10·PM2.5 예측 모형을 비교하고자 한다. 5분 뒤 미세먼지 농도 예측을 통해 실시간으로 정보를 제공할 수 있으며, 이는 10분·30분·1시간 뒤 예측 모형 개발에 기반이 될 수 있다. 잡음 제거, 결측치 대체 등의 데이터 전처리를 진행하였고, 시·공간 변수를 고려할 수 있는 파생 변수를 생성하였다. 모형의 매개변수는 반응 표면 방법을 통해 선택하였다. XGBoost, 랜덤포레스트, 딥러닝(Multilayer Perceptron)을 예측 모형으로 사용하여, 미세먼지 농도와 예측값의 차이를 확인하고, 모형 간 성능을 비교하고자 한다.

Identification Systems of Fake News Contents on Artificial Intelligence & Bigdata

  • KANG, Jangmook;LEE, Sangwon
    • International journal of advanced smart convergence
    • /
    • 제10권3호
    • /
    • pp.122-130
    • /
    • 2021
  • This study is about an Artificial Intelligence-based fake news identification system and its methods to determine the authenticity of content distributed over the Internet. Among the news we encounter is news that an individual or organization intentionally writes something that is not true to achieve a particular purpose, so-called fake news. In this study, we intend to design a system that uses Artificial Intelligence techniques to identify fake content that exists within the news. The proposed identification model will propose a method of extracting multiple unit factors from the target content. Through this, attempts will be made to classify unit factors into different types. In addition, the design of the preprocessing process will be carried out to parse only the necessary information by analyzing the unit factor. Based on these results, we will design the part where the unit fact is analyzed using the deep learning prediction model as a predetermined unit. The model will also include a design for a database that determines the degree of fake news in the target content and stores the information in the identified unit factor through the analyzed unit factor.

Development of a Model to Predict the Volatility of Housing Prices Using Artificial Intelligence

  • Jeonghyun LEE;Sangwon LEE
    • International journal of advanced smart convergence
    • /
    • 제12권4호
    • /
    • pp.75-87
    • /
    • 2023
  • We designed to employ an Artificial Intelligence learning model to predict real estate prices and determine the reasons behind their changes, with the goal of using the results as a guide for policy. Numerous studies have already been conducted in an effort to develop a real estate price prediction model. The price prediction power of conventional time series analysis techniques (such as the widely-used ARIMA and VAR models for univariate time series analysis) and the more recently-discussed LSTM techniques is compared and analyzed in this study in order to forecast real estate prices. There is currently a period of rising volatility in the real estate market as a result of both internal and external factors. Predicting the movement of real estate values during times of heightened volatility is more challenging than it is during times of persistent general trends. According to the real estate market cycle, this study focuses on the three times of extreme volatility. It was established that the LSTM, VAR, and ARIMA models have strong predictive capacity by successfully forecasting the trading price index during a period of unusually high volatility. We explores potential synergies between the hybrid artificial intelligence learning model and the conventional statistical prediction model.

디지털 농업 데이터 활용 및 서비스 제공을 위한 농산업 데이터 공유 플랫폼 설계 (Designing an Agricultural Data Sharing Platform for Digital Agriculture Data Utilization and Service Delivery)

  • 김승재;이명훈;고진광
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.1-10
    • /
    • 2023
  • 본 논문은 국내 농업 산업이 직면한 주요 과제를 해결하기 위한 농업 데이터 공유 플랫폼의 설계 과정을 제시한다. 사용자의 편의성을 위해 사용자 요구사항을 우선적으로 고려한 인터페이스로 설계되었으며 다양한 분석 기술을 제공하여 현장에서의 환경, 생육, 경영 및 제어 데이터에 대한 분석 결과를 시각화하여 제공하는 플랫폼을 설계하였다. 또한 플랫폼은 File to DB 및 DB to DB 연결 방식을 지원하여 플랫폼과 농가 간의 원활한 연결을 보장한다. UI 디자인 프로세스는 HTML/CSS 기반 언어, JavaScript, React를 활용하여 플랫폼 로그인부터 데이터 업로드, 데이터 분석, 시각화 기능까지 포괄적인 서비스를 제공하도록 설계되었다. 본 연구를 통해 한국형 스마트팜 모델 개발에 기여하고 농업 현장 및 연구자들에게 신뢰할 수 있는 데이터를 제공할 수 있을 것으로 기대된다.

정신건강 위험 예측 및 관리를 위한 멘탈 헬스케어 디지털 트윈 기술 연구 (Mental Healthcare Digital Twin Technology for Risk Prediction and Management)

  • 양세모;이강윤
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.29-36
    • /
    • 2022
  • 감정 노동 및 서비스업 종사자의 급격한 증가에 따른 감정노동자의 스트레스 및 우울증 유병률이 증가하고 있다. 하지만, 현재 감정노동자의 정신건강 관리는 스트레스 상황 당시의 정서반응을 고려하기 어렵고 개인의 기저 상태가 반영되지 않아 기존 정신건강 관리의 한계가 존재한다. 본 연구에서는 개인 맞춤형 스트레스 위험 관리 솔루션인 멘탈 헬스케어 디지털 트윈 솔루션 기술을 제시한다. 감정노동으로 인한 정신건강 위험 관리를 위해, 정서/신체반응 및 환경 등의 개인별 스트레스 위험요인을 다양한 모달리티로 추출하고 가상 공간에서 동적 객체의 동기화/모델링을 통하여 스트레스 위험도를 정밀 예측하는 솔루션 탐색 시뮬레이션을 수행한다. 사용자에게 맞는 인터벤션을 제공하여, 감정노동자의 환경에 맞게 모달리티와 객체의 구성이 가능하고 사용자의 피드백에 따라 개선 가능한 개인 맞춤형 정신건강 위험 예측을 위한 멘탈 헬스케어 디지털 트윈 솔루션을 제공한다.

리조트 교차판매 예측모형 개발 및 SHAP을 이용한 해석 (Development of a Resort's Cross-selling Prediction Model and Its Interpretation using SHAP)

  • 강보람;안현철
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.195-204
    • /
    • 2022
  • 관광산업은 최근 코로나19 유행으로 인해 위기에 봉착해 있으며, 이를 극복하기 위해 무엇보다 수익성 개선이 매우 중요한 상황이다. 이 때 여행 수요 자체가 축소된 코로나19와 같은 상황에서는 수익 증대를 위해 객실 점유율을 높이기 위한 공격적인 영업전략보다 어려운 여건 속에서도 찾아온 고객에게 객실 외 추가상품을 판매하여 객단가를 높이는 방향이 더 효율적일 것이다. 국내 관광 연구 분야에서 머신러닝 기법은 수요예측을 중심으로 연구된 바 있으나 교차판매 예측에 대해서는 연구된 바가 거의 없다. 또한 넓은 의미로는 호텔과 같은 숙박업종 이지만 회원제 중심으로 운영하며 숙박과 취사에 적합한 시설을 갖추고 있는 리조트 업종에 특화된 연구는 더욱이 전무한 실정이다. 이에 본 연구에서는 실제 리조트 회사의 투숙 데이터로 다양한 머신러닝 기법을 활용하여 교차판매 예측 모형을 제안하고자 한다. 또한 설명가능한 인공지능(eXplainable AI) 기법을 적용해 교차판매에 영향을 미치는 요인이 무엇인지 해석하고 어떻게 영향을 미치는지 실증 분석을 통해 확인해 보고자 한다.

기업 리뷰 정보를 활용한 주가 방향 예측 모델 비교 분석 (A Comparative Analysis of the Prediction Models for the Direction of Stock Price Using the Online Company Reviews)

  • 임용택;임희석
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.165-171
    • /
    • 2020
  • 텍스트 마이닝을 활용한 주가 방향 예측 연구에서는 대부분 뉴스, SNS 데이터를 사용하고 있다. 하지만 뉴스, SNS 데이터로부터 기업에 대한 솔직하고 생생한 정보는 얻기 어렵다는 약점이 존재한다. 본 논문에서는 실제 근무 경험이 있는 내부 직원의 기업 리뷰를 반영하여, 종업원 만족도를 활용한 주가의 방향성을 예측하는 문제를 다룬다. 머신러닝 모델별 성능평가를 통해 예측 정확도를 비교, 분석한 결과 종업원의 기업 리뷰 데이터를 추가로 이용한 주가 방향 예측 모델은 그렇지 않은 모델 대비 뛰어난 분류 성과를 보였다. 본 연구는 금융 공학에 자연어처리기술을 활용한 융합 연구로서 주가 예측 분야에서 종업원 만족도를 활용한 기존에 없던 새로운 방법론을 추구하였다. 실무적으로 주가 방향 예측 분야에 유용한 정보를 제공할 것으로 기대된다.

인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구 (A Study on the Win-Loss Prediction Analysis of Korean Professional Baseball by Artificial Intelligence Model)

  • 김태훈;임성원;고진광;이재학
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.77-84
    • /
    • 2020
  • 본 연구에서는 인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구를 했다. 승리할 팀과 해당 팀의 최종 리그 순위를 예측했고, 사용자의 편의를 위해 웹사이트도 구축했다. 각 1·3·5이닝 별로 가장 정확도가 높으면서도 오차가 적은 모델을 최적 모델로 선정해 승·패 결과를 예측했고, 이를 토대로 순위표를 작성했다. 결과표는 2020년 개막인 5월 5일부터 8월 30일까지의 예측 결과를 바탕으로 작성했다. 기아타이거즈가 아닌 다른 구단끼리의 경기는 실제 결과를 사용했다. 머신러닝 모델은 KNN과 AdaBoost가 최적 모델로 선정되었으며, 실제 순위와 비교해 본 결과, 경기가 진행될수록, 예측 결과의 순위 오차가 점점 작아지는 것을 확인했다. 딥러닝 모델은 89%의 정확도를 기록했고, 머신러닝 모델과 마찬가지로 경기를 진행할수록 예측 결과 순위 오차가 작아지는 것을 확인했다. 실험 결과는 한국 프로야구 승·패 결과 예측뿐 아니라 다양한 분야에서 사용할 수 있을 것으로 사료된다. 방송국에서 야구 경기를 중계하는 중 이닝별로 인공지능 알고리즘이 예상한 승·패 여부를 중계화면에 띄울 수 있다. 시청자들에게 새로운 흥미를 일으킬 수 있을 것이고, 나아가 구단의 감독들이 이닝마다 데이터를 분석해 경기 중 유동적으로 승리하기 위한 전략을 세울 수 있을 것으로 기대된다.

기상환경데이터와 머신러닝을 활용한 미세먼지농도 예측 모델 (An Estimation Model of Fine Dust Concentration Using Meteorological Environment Data and Machine Learning)

  • 임준묵
    • 한국IT서비스학회지
    • /
    • 제18권1호
    • /
    • pp.173-186
    • /
    • 2019
  • Recently, as the amount of fine dust has risen rapidly, our interest is increasing day by day. It is virtually impossible to remove fine dust. However, it is best to predict the concentration of fine dust and minimize exposure to it. In this study, we developed a mathematical model that can predict the concentration of fine dust using various information related to the weather and air quality, which is provided in real time in 'Air Korea (http://www.airkorea.or.kr/)' and 'Weather Data Open Portal (https://data.kma.go.kr/).' In the mathematical model, various domestic seasonal variables and atmospheric state variables are extracted by multiple regression analysis. The parameters that have significant influence on the fine dust concentration are extracted, and using ANN (Artificial Neural Network) and SVM (Support Vector Machine), which are machine learning techniques, we proposed a prediction model. The proposed model can verify its effectiveness by using past dust and weather big data.