• 제목/요약/키워드: Prediction by bigdata

검색결과 52건 처리시간 0.018초

Prediction Model of Real Estate Transaction Price with the LSTM Model based on AI and Bigdata

  • Lee, Jeong-hyun;Kim, Hoo-bin;Shim, Gyo-eon
    • International Journal of Advanced Culture Technology
    • /
    • 제10권1호
    • /
    • pp.274-283
    • /
    • 2022
  • Korea is facing a number difficulties arising from rising housing prices. As 'housing' takes the lion's share in personal assets, many difficulties are expected to arise from fluctuating housing prices. The purpose of this study is creating housing price prediction model to prevent such risks and induce reasonable real estate purchases. This study made many attempts for understanding real estate instability and creating appropriate housing price prediction model. This study predicted and validated housing prices by using the LSTM technique - a type of Artificial Intelligence deep learning technology. LSTM is a network in which cell state and hidden state are recursively calculated in a structure which added cell state, which is conveyor belt role, to the existing RNN's hidden state. The real sale prices of apartments in autonomous districts ranging from January 2006 to December 2019 were collected through the Ministry of Land, Infrastructure, and Transport's real sale price open system and basic apartment and commercial district information were collected through the Public Data Portal and the Seoul Metropolitan City Data. The collected real sale price data were scaled based on monthly average sale price and a total of 168 data were organized by preprocessing respective data based on address. In order to predict prices, the LSTM implementation process was conducted by setting training period as 29 months (April 2015 to August 2017), validation period as 13 months (September 2017 to September 2018), and test period as 13 months (December 2018 to December 2019) according to time series data set. As a result of this study for predicting 'prices', there have been the following results. Firstly, this study obtained 76 percent of prediction similarity. We tried to design a prediction model of real estate transaction price with the LSTM Model based on AI and Bigdata. The final prediction model was created by collecting time series data, which identified the fact that 76 percent model can be made. This validated that predicting rate of return through the LSTM method can gain reliability.

소셜 빅데이터 분석과 기계학습을 이용한 영화흥행예측 기법의 실험적 평가 (An Experimental Evaluation of Box office Revenue Prediction through Social Bigdata Analysis and Machine Learning)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.167-173
    • /
    • 2017
  • 인공지능으로 대표되는 4차 산업혁명에 대한 관심이 증가함에 따라 사회 전반에 빅데이터 및 머신러닝 활용하려는 움직임이 활발해지고 있다. 이러한 움직임은 다양한 분야에서의 예측 시스템 개발로 현실화되고 있다. 특히 영화 산업에서는 투자, 마케팅 등에 활용을 위해 흥행 여부를 사전에 예측하고자하는 여러 가지 시도가 있어왔다. 예전에는 영화에 대한 정적 데이터만을 고려한 예측이 주류를 이뤘으나, 최근에는 실시간으로 생성되는 소셜 데이터를 활용하여 예측하고자하는 노력이 진행되고 있다. 본 논문에서는 영화의 정적 데이터와 더불어 기사, 블로그, 영화평 등 다양한 피드백 정보를 활용한 예측 기법을 제안한다. 또한 제안한 기법을 활용하여 상대적으로 흥행에 성공한 영화만을 대상으로 이들의 흥행정도를 정량적으로 추정할 수 있는지의 여부를 실험적으로 평가하였다.

시민 데이터과학자를 위한 빅데이터 예측 지원 서비스 (Bigdata Prediction Support Service for Citizen Data Scientists)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.151-159
    • /
    • 2019
  • 4차 산업의 근간이 되는 빅데이터 시대가 도래하면서 대부분의 관련 업계에서는 데이터에 대한 저장, 통계분석 및 시각화 기술 중심으로 관련 솔루션들이 개발되고 있다. 하지만 빅데이터 기술의 근본적인 발전을 위해서는 인공지능을 이용한 예측 분석기술의 발전이 필요하다. 하지만 이러한 고급기술은 현재 데이터과학자라고 불리는 일부 전문가에 의해서만 가능한 수준이다. 이를 극복하기 위해서는 데이터에 대한 통찰력을 지닌 비전문가(시민 데이터과학자)가 빅데이터 분석 과정을 저비용으로 쉽게 접근할 수 있는 기반이 마련되어야한다. 본 논문에서는 고수준의 데이터과학 지식 없이 사용하기 쉬운 빅데이터 도구 및 기술의 도움으로 데이터를 분석하기 위한 서비스 과정을 제안한다. 이를 위해 필요한 예측 분석 시스템에 필요한 구성 요소와 환경을 정의하고 전반적인 서비스 설계 방안을 제시한다.

머신러닝 데이터의 우울증에 대한 예측 (Prediction of Depression from Machine Learning Data)

  • Jeong Hee KIM;Kyung-A KIM
    • Journal of Korea Artificial Intelligence Association
    • /
    • 제1권1호
    • /
    • pp.17-21
    • /
    • 2023
  • The primary objective of this research is to utilize machine learning models to analyze factors tailored to each dataset for predicting mental health conditions. The study aims to develop appropriate models based on specific datasets, with the goal of accurately predicting mental health states through the analysis of distinct factors present in each dataset. This approach seeks to design more effective strategies for the prevention and intervention of depression, enhancing the quality of mental health services by providing personalized services tailored to individual circumstances. Overall, the research endeavors to advance the development of personalized mental health prediction models through data-driven factor analysis, contributing to the improvement of mental health services on an individualized basis.

A Study on the Generation of Datasets for Applied AI to OLED Life Prediction

  • CHUNG, Myung-Ae;HAN, Dong Hun;AHN, Seongdeok;KANG, Min Soo
    • 한국인공지능학회지
    • /
    • 제10권2호
    • /
    • pp.7-11
    • /
    • 2022
  • OLED displays cannot be used permanently due to burn-in or generation of dark spots due to degradation. Therefore, the time when the display can operate normally is very important. It is close to impossible to physically measure the time when the display operates normally. Therefore, the time that works normally should be predicted in a way other than a physical way. Therefore, if you do computer simulations based on artificial intelligence, you can increase the accuracy of prediction by saving time and continuous learning. Therefore, if we do computer simulations based on artificial intelligence, we can increase the accuracy of prediction by saving time and continuous learning. In this paper, a dataset in the form of development from generation to diffusion of dark spots, which is one of the causes related to the life of OLED, was generated by applying the finite element method. The dark spots were generated in nine conditions, such as 0.1 to 2.0 ㎛ with the size of pinholes, the number was 10 to 100, and 50% with water content. The learning data created in this way may be a criterion for generating an artificial intelligence-based dataset.

LSTM과 Bi-LSTM을 사용한 비주기성 시계열 데이터 예측 성능 비교 분석 (Comparative Analysis of Prediction Performance of Aperiodic Time Series Data using LSTM and Bi-LSTM)

  • 이주형;홍준기
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.217-224
    • /
    • 2022
  • 온라인 쇼핑의 대중화로 인해 많은 의류 상품이 온라인 쇼핑을 통해 소비된다. 의류 상품은 다른 상품과 달리 판매량이 일정하지 않고 날씨의 변화에 따라 판매량이 변화하는 특징이 있다. 따라서 의류 상품의 머신 러닝을 적용한 효율적인 재고 관리 시스템에 대한 연구는 매우 중요하다. 본 논문에서는 의류 업체 'A'로부터 실제 의류 상품 판매량 데이터를 수집하고 판매량 데이터와 같은 시계열 데이터의 예측에 많이 활용되는 LSTM(Long Short-Term Memory)과 Bidirectional-LSTM(Bi-LSTM)의 학습에 사용하여 LSTM과 Bi-LSTM의 판매량 예측 효율을 비교 분석하였다. 시뮬레이션 결과를 통해 LSTM 기술 대비 Bi-LSTM은 시뮬레이션 시간은 더 많이 소요되지만 의류 상품 판매량 데이터와 같은 비주기성 시계열 데이터의 예측 정확도가 동일하다는 것을 확인하였다.

COPD 코호트 자료에서의 Machine Learning 방법론 비교 (Comparison of Machine Learning Methodology in COPD Cohort Data)

  • 정현명;박헌진;이진국;이종민
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.115-128
    • /
    • 2017
  • 최근 머신러닝 방법은 높은 예측력과 함께 널리 이용되지만 머신러닝을 제대로 활용하기 위해서 데이터가 가진 한계를 통계적 기법으로 해결한다면 기존보다 더 높은 예측력을 이끌어 낼 수 있다. 본 연구에서는 Longitudinal and Imbalanced Data에서 SMOTE 방법을 활용하여 불균형 문제를 해결한 결과 예측력이 증가하는 것을 확인할 수 있었다. 추가적으로 만성폐쇄성폐질환 급성악화 관련 연구가 활발히 이루어지고 있지만 급성악화와 관련 있는 요인을 찾는 연구만 이루어지고 있어 여러 요인들에 대한 복합적인 관철과 예측모형을 통한 급성악화 예측 연구는 이루어지지 않는다. 본 연구에서는 여러 요인을 같이 살펴봤을 때 어떤 요인들이 만성폐쇄성폐질환 급성악화와 관련이 있는지 확인하고 개인 맞춤형 특정 질환 예측 모형을 구축하였다.

  • PDF

빅데이터 분석을 이용한 기온 변화에 대한 판매량 예측 모델 (Sales Volume Prediction Model for Temperature Change using Big Data Analysis)

  • 백승훈;오지연;이지수;홍준기;홍성찬
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.29-38
    • /
    • 2019
  • 본 연구에서는 판매량 증대와 효율적인 재고 관리를 위해 지난 5년간 온라인 쇼핑몰 'A'에서 누적된 빅데이터를 활용하여 기온 변화에 따른 반팔 티셔츠와 아우터웨어(outer wear)의 판매량을 예측하는 판매 예측 모델을 제안한다. 제안한 모델은 2014년부터 2017년도까지 기온 변화에 따른 반팔 티셔츠와 아우터웨어의 판매량을 분석하여 2018년 기온 변화에 따른 반팔티셔츠와 아우터웨어의 판매량을 예측한다. 제안한 판매 예측 모델을 사용하여 반팔티셔츠와 아우터웨어의 판매량 예측값과 실제 2018년 판매량을 비교 분석한 결과 반팔티셔츠와 아우터웨어의 예측 오차율은 각각 ±1.5%와 ±8%를 나타내었다.

  • PDF

머신러닝을 이용한 반도체 웨이퍼 평탄화 공정품질 예측 및 해석 모형 개발 (Predicting and Interpreting Quality of CMP Process for Semiconductor Wafers Using Machine Learning)

  • 안정언;정재윤
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.61-71
    • /
    • 2019
  • 반도체 웨이퍼의 표면을 연마하여 평탄화하는 Chemical Mechanical Planarization(CMP) 공정은 다양한 화학물질과 물리적인 기계장치에 의한 작용을 받기 때문에 공정을 안정적으로 관리하기 힘들다. CMP 공정에서 품질 지표로는 Material Removal Rate(MRR)를 많이 사용하고, CMP 공정의 안정적 관리를 위해서는 MRR을 예측하는 것이 중요하다. 본 연구에서는 머신러닝 기법들을 이용하여 CMP 공정에서 수집된 시계열 센서 데이터를 분석하여 MRR을 예측하는 모형과 공정 품질을 해석하기 위한 분류 모형을 개발한다. 나아가 분류 결과를 분석하여, CMP 공정 품질에 영향을 미치는 유의미한 변수를 파악하고 고품질을 유지하기 위한 공정 조건을 설명한다.

  • PDF

Development and Verification of an AI Model for Melon Import Prediction

  • KHOEURN SAKSONITA;Jungsung Ha;Wan-Sup Cho;Phyoungjung Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.29-37
    • /
    • 2023
  • 기후변화로 인해 농작물 생산과 유통에 관한 관심이 증대되고 있고, 빅데이터와 AI를 활용한 생산량 예측을 통해 농가의 출하량 조절과 유통단계의 조절에 활용하는 시도가 이루어지고 있다. 농산물 반입량 예측은 가격에 영향을 미칠 뿐 아니라 농가의 출하량과 유통회사의 유통량 조절을 할 수 있으므로 마케팅 전략을 수립하는데 중요한 정보이다. 본 연구에서는 농업 통계 정보 시스템에서 공개한 도매시장 참외 반입량 데이터를 기반으로 미래의 반입량을 예측하는 인공지능 예측 모델을 생성하고 정확도를 평가한다. 우리는 Neural Prophet 기법과 Ensembled Neural Prophet 모델 그리고 GRU 모델 등 세 가지 모델을 사용하여 예측 모델을 생성한다. 모델의 성능은 MAE와 RMSE라는 두 가지 주요 지표를 비교하여 평가한 결과 Ensembled Neural Prophet 모델이 가장 정확하게 예측하였으며, GRU 모델도 앙상블 모델과 유사한 성능을 보여주고 있다. 본 연구에서 개발된 모형은 웹에 publish 되어 현장에서 1년 6개월 동안 사용하고 있으며, 가까운 미래의 참외 생산량을 예측하고, 마케팅 및 유통전략을 수립하는 데 활용되고 있다.