• 제목/요약/키워드: Interest Prediction

검색결과 476건 처리시간 0.023초

Rockfall Source Identification Using a Hybrid Gaussian Mixture-Ensemble Machine Learning Model and LiDAR Data

  • Fanos, Ali Mutar;Pradhan, Biswajeet;Mansor, Shattri;Yusoff, Zainuddin Md;Abdullah, Ahmad Fikri bin;Jung, Hyung-Sup
    • 대한원격탐사학회지
    • /
    • 제35권1호
    • /
    • pp.93-115
    • /
    • 2019
  • The availability of high-resolution laser scanning data and advanced machine learning algorithms has enabled an accurate potential rockfall source identification. However, the presence of other mass movements, such as landslides within the same region of interest, poses additional challenges to this task. Thus, this research presents a method based on an integration of Gaussian mixture model (GMM) and ensemble artificial neural network (bagging ANN [BANN]) for automatic detection of potential rockfall sources at Kinta Valley area, Malaysia. The GMM was utilised to determine slope angle thresholds of various geomorphological units. Different algorithms(ANN, support vector machine [SVM] and k nearest neighbour [kNN]) were individually tested with various ensemble models (bagging, voting and boosting). Grid search method was adopted to optimise the hyperparameters of the investigated base models. The proposed model achieves excellent results with success and prediction accuracies at 95% and 94%, respectively. In addition, this technique has achieved excellent accuracies (ROC = 95%) over other methods used. Moreover, the proposed model has achieved the optimal prediction accuracies (92%) on the basis of testing data, thereby indicating that the model can be generalised and replicated in different regions, and the proposed method can be applied to various landslide studies.

ARMA모형을 이용한 소비자 심리지수 분석과 예측에 관한 연구 (A Study on Consumer Sentiment Index Analysis and Prediction Using ARMA Model)

  • 김동하
    • 디지털산업정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.75-82
    • /
    • 2022
  • The purpose of the Consumer sentiment index survey is to determine the consumer's economic situation and consumption spending plan, and it is used as basic data for diagnosing economic phenomena and forecasting the future economic direction. The purpose of this paper is to analyze and predict the future Consumer sentiment index using the ARMA model based on the past consumer index. Consumer sentiment index is determined according to consumer trends, so it can reflect consumer realities. The consumer sentiment index is greatly influenced by economic indicators such as the base interest rate and consumer price index, as well as various external economic factors. If the consumer sentiment index, which fluctuates greatly due to consumer economic conditions, can be predicted, it will be useful information for households, businesses, and policy authorities. This study predicted the Consumer sentiment index for the next 3 years (36 months in total) by using time series analysis using the ARMA model. As a result of the analysis, it shows a characteristic of repeating an increase or a decrease every month according to the consumer trend. This study provides empirical results of prediction of Consumer sentiment index through statistical techniques, and has a contribution to raising the need for policy authorities to prepare flexible operating policies in line with economic trends.

Prediction of dynamic soil properties coupled with machine learning algorithms

  • Dae-Hong Min;Hyung-Koo Yoon
    • Geomechanics and Engineering
    • /
    • 제37권3호
    • /
    • pp.253-262
    • /
    • 2024
  • Dynamic properties are pivotal in soil analysis, yet their experimental determination is hampered by complex methodologies and the need for costly equipment. This study aims to predict dynamic soil properties using static properties that are relatively easier to obtain, employing machine learning techniques. The static properties considered include soil cohesion, friction angle, water content, specific gravity, and compressional strength. In contrast, the dynamic properties of interest are the velocities of compressional and shear waves. Data for this study are sourced from 26 boreholes, as detailed in a geotechnical investigation report database, comprising a total of 130 data points. An importance analysis, grounded in the random forest algorithm, is conducted to evaluate the significance of each dynamic property. This analysis informs the prediction of dynamic properties, prioritizing those static properties identified as most influential. The efficacy of these predictions is quantified using the coefficient of determination, which indicated exceptionally high reliability, with values reaching 0.99 in both training and testing phases when all input properties are considered. The conventional method is used for predicting dynamic properties through Standard Penetration Test (SPT) and compared the outcomes with this technique. The error ratio has decreased by approximately 0.95, thereby validating its reliability. This research marks a significant advancement in the indirect estimation of the relationship between static and dynamic soil properties through the application of machine learning techniques.

KNN 알고리즘을 기반으로 하는 질병 예측 및 건강기능식품 추천 알고리즘에 관한 연구 (Research on Disease Prediction and Health Supplement Recommendation Algorithm Based on KNN Algorithm)

  • 추용주
    • 스마트미디어저널
    • /
    • 제13권8호
    • /
    • pp.49-57
    • /
    • 2024
  • 본 논문에서는 최근 고령화 사회로 진입하면서 건강기능식품에 높은 관심과 머신러닝의 발달로 질병을 고려한 맞춤형 건강기능식품을 추천할 수 있는 알고리즘을 제시하였다. KNN 알고리즘을 적용하여 질환에 대한 분석과 공개된 건강기능식품 정보, 국가 공공데이터의 매칭 기법을 적용하여, 맞춤형 건강기능식품 추천에 대한 플랫폼의 기초 워크프레임을 제시하였다. 신뢰성 높은 질환 대비 건강기능식품 사이의 매칭을 위해서, 상관관계를 분석하고, KNN알고리즘의 고도화를 위한 변수의 적절성과 정확도를 분석하고, 향후 공개되는 정보와 학습 모델의 개선을 통해 제안하는 시스템의 개선 방향에 대해서 도출하였다.

SARIMA와 ARDL모형을 활용한 COVID-19 구간별 원/달러 환율 예측 (Prediction of KRW/USD exchange rate during the Covid-19 pandemic using SARIMA and ARDL models)

  • 오인정;김우주
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.191-209
    • /
    • 2022
  • 2020년 코로나19 발발 이후 한국 경제를 포함한 국제 시장 환경은 급속하게 변하고 있고 한국 금융시장의 중요 경제 지표인 원/달러 환율도 요동치고 있다. 대외 의존도가 높은 한국 경제에서 환율에 대한 이해는 항상 중요한 연구 과제였고, 특히 코로나 확산이 환율에 미치는 연구는 시기적으로 많은 경제 학자들의 관심사이기도 하다. 따라서 본 연구는 코로나19 발발 이후 환율과 경제 지표의 관계를 분석하고 환율 예측을 위한 단변량 다변량 예측 모형을 구축하여 모형의 예측 성능을 비교 검증을 하였다. 코로나 전후 기간을 세 기간으로 나눠서 기간 1은 코로나 발발전과 초기, 기간 2는 코로나 대확산, 기간 3을 코로나 안정기로 나누고 기간 1의 환율 데이터를 학습한 SARIMA 모형과 같은 기간의 경제 변수와 환율 데이터를 학습한 ARDL 모형의 예측 성능을 비교하였다. 기간별 RMSE기준으로 SARIMA 모형은 기간 2에서 예측 성능이 뛰어나고 ARDL 모형은 기간 3에서 예측 성능이 가장 우수한 것으로 나타났다. 연구 결론은 환율과 경제 변수의 통상적인 관계가 나타나는 기간 3에서는 변수 관계를 반영하는 ARDL 모형이 좀 더 예측 성능이 좋은 모델이고 기존의 전형적인 환율과 경제 변수의 패턴에서 벗어난 과도기 시기인 기간 2에는 과거 환율 추이만 반영하는 SARIMA 모형이 좀 더 우수한 예측 성능을 보여주는 모델로 검증되었다.

Prediction of the remaining time and time interval of pebbles in pebble bed HTGRs aided by CNN via DEM datasets

  • Mengqi Wu;Xu Liu;Nan Gui;Xingtuan Yang;Jiyuan Tu;Shengyao Jiang;Qian Zhao
    • Nuclear Engineering and Technology
    • /
    • 제55권1호
    • /
    • pp.339-352
    • /
    • 2023
  • Prediction of the time-related traits of pebble flow inside pebble-bed HTGRs is of great significance for reactor operation and design. In this work, an image-driven approach with the aid of a convolutional neural network (CNN) is proposed to predict the remaining time of initially loaded pebbles and the time interval of paired flow images of the pebble bed. Two types of strategies are put forward: one is adding FC layers to the classic classification CNN models and using regression training, and the other is CNN-based deep expectation (DEX) by regarding the time prediction as a deep classification task followed by softmax expected value refinements. The current dataset is obtained from the discrete element method (DEM) simulations. Results show that the CNN-aided models generally make satisfactory predictions on the remaining time with the determination coefficient larger than 0.99. Among these models, the VGG19+DEX performs the best and its CumScore (proportion of test set with prediction error within 0.5s) can reach 0.939. Besides, the remaining time of additional test sets and new cases can also be well predicted, indicating good generalization ability of the model. In the task of predicting the time interval of image pairs, the VGG19+DEX model has also generated satisfactory results. Particularly, the trained model, with promising generalization ability, has demonstrated great potential in accurately and instantaneously predicting the traits of interest, without the need for additional computational intensive DEM simulations. Nevertheless, the issues of data diversity and model optimization need to be improved to achieve the full potential of the CNN-aided prediction tool.

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

초 장단기 통합 태양광 발전량 예측 기법 (Very Short- and Long-Term Prediction Method for Solar Power)

  • 윤문섭;임세령;장한승
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1143-1150
    • /
    • 2023
  • 세계적 기후 위기와 저탄소 정책 이행으로 신재생 에너지에 관한 관심이 높아지고 이와 관련된 산업이 증가하고 있다. 이 중에서 태양 에너지는 고갈되지 않고 오염 물질이나 온실가스를 배출하지 않는 대표적인 친환경 에너지로 주목받고 있으며, 이에 따라 세계적으로 태양광 발전 시설 보급이 증가하고 있다. 하지만 태양광 발전은 지리, 날씨와 같은 환경의 영향을 받기 쉬우므로 안정적인 운영과 효율적인 관리를 위해 정확한 발전량 예측이 중요하다. 하지만 변동성이 큰 태양광 발전을 수학적 통계 기술로 정확한 발전량을 예측하는 것은 불가능하다. 이를 위해서 정확하고 효과적인 예측을 위해 딥러닝 기반의 기술에 관한 연구는 필수적이다. 또한, 기존의 딥러닝을 활용한 예측 방식은 장, 단기적인 예측을 나누어 수행하기 때문에 각각의 예측 결과를 얻기 위한 시간이 길어진다는 단점이 있다. 따라서, 본 연구에서는 시계열 특성을 가진 태양광 발전량 데이터를 사용하여 장단기 통합 예측을 수행하기 위해 순환 신경망의 다대다 구조를 활용한다. 그리고 이를 다양한 딥러닝 모델들에 적용하여 학습을 수행하고 각 모델의 결과를 비교·분석한다.

팜유 가격 예측을 위한 딥러닝 기반 단기 시계열 예측 모델링 (Deep Learning-Based Short-Term Time Series Forecasting Modeling for Palm Oil Price Prediction)

  • 배성호;김명선;정우혁;우지환
    • 경영정보학연구
    • /
    • 제26권2호
    • /
    • pp.45-57
    • /
    • 2024
  • 본 연구에서는 딥러닝 기반의 팜유(Crude Palm Oil: CPO) 가격 예측 방법론을 개발하였다. 팜유는 그 생산 수율과 경제적 효율성으로 인해 다양한 산업에서 중요한 자원으로 활용되고 있으며, 이로 인해 팜유 가격 변동성에 대한 산업계의 관심이 증가하고 있다. 따라서, 팜유 가격 예측을 위한 연구가 활발히 진행되고 있으나, 많은 연구가 시계열 예측 기반으로 정확도에 한계점을 가지고 있다. 본 연구는 기존 방법론의 주요 한계인 정상성 부재 문제를 해결하기 위해 현재 가격 대비 미래 가격의 비율을 종속변수로 사용하는 새로운 모델을 제시한다. 이 접근법은 주식 가격 예측에서의 수익(return) 모델링에 착안하여 개발되었으며, 단순 가격 예측보다 더 높은 성능을 나타낸다. 또한, 다변량 시계열 예측에서 중요한 요소인 독립변수의 지연 값(lag)을 고려하여, 불필요한 잡음을 제거하고 예측 모델의 안정성을 높이는 방법론을 채택했다. 이 연구는 팜유 가격 예측의 정확도를 향상시키는데 중요한 기여를 하며, 시계열 데이터가 중요한 다른 경제적 예측 문제에도 적용 가능한 접근법을 제시한다는 점에서 산업계에 큰 의미가 있다.

단백질 서열정렬 정확도 예측을 위한 새로운 방법 (A new method to predict the protein sequence alignment quality)

  • 이민호;정찬석;김동섭
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.82-87
    • /
    • 2006
  • 현재 가장 많이 사용되는 단백질 구조 예측 방법은 비교 모델링 (comparative modeling) 방법이다. 비교 모델링 방법에서의 정확도를 높이기 위해서는 alignment의 정확도 역시 매우 필수적으로 필요하다. 비교 모델링 과정 중의 fold-recognition 단계에서 alignment의 정확도에 의해 template을 고르는 방법은 단지 가장 비슷한 template을 선택하는 방법에 비해 주목을 받지 못하고 있다. 최근에는 두 가지의 alignment에 사이의 shift 정보를 바탕으로 한 shift score라는 수치가 alignment의 성능을 표현하기 위해서 개발되었다. 우리는 더 정확한 구조 예측의 첫걸음이 될 수 있는 shift score를 예측하는 방법을 개발하였다. Shift score를 예측하기 위해 support vector regression (SVR)이 사용되었다. 사전에 구축된 라이브러리 안의 길이가 n 인 template과 구조를 알고 싶은 query 단백질 사이의 alignment는 n+2 차원의 input 벡터로 변환된다. Structural alignment가 가장 좋은 alignment로 가정되었고 SVR은 query 단백질과 template 단백질의 structural alignment과 profile-profile alignment 사이의 shift score를 예측하도록 training 되었다. 예측 정확도는 Pearson 상관계수로 측정되었다. Training 된 SVR은 실제의 shift score와 예측된 shift score 사이에 0.80의 Pearson 상관계수를 갖는 정도로 예측하였다.

  • PDF