• 제목/요약/키워드: data value prediction

검색결과 1,088건 처리시간 0.038초

Improved Algorithm for User Based Recommender System

  • Lee, Hee-Choon
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.717-726
    • /
    • 2006
  • This study is to investigate the MAE of prediction value by collaborative filtering algorithm originated by GroupLens and improved algorithm. To decrease the MAE on the collaborative recommender system on user based, this research proposes the improved algorithm, which reduces the possibility of over estimation of active user's preference mean collaboratively using other user’s preference mean. The result shows the MAE of prediction by improved algorithm is better than original algorithm, so the active user's preference mean used in prediction formula is possibly over estimated.

  • PDF

고성능 마이크로프로세서에서 값 예측기의 성능평가 (Performance Evaluation of Value Predictor in High Performance Microprocessors)

  • 전병찬;김혁진;류대희
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.87-95
    • /
    • 2005
  • 고성능 마이크로프로세서에서 값 예측기는 한 명령어의 결과를 미리 예측하여 명령들 간의 데이터 종속관계를 극복하고 실행함으로써 명령어 수준 병렬성(Instruction Level Parallelism, ILP)을 향상시키는 기법이다. 본 논문에서는 ILP 프로세서 명령어 수준 병렬성의 성능향상을 위하섞 값을 미리 예측하여 병렬로 이슈하고 수행하는 값 예측기를 비교 분석하여 각 테이블 갱신 시점에 따른 예측기별 평균 성능향상과 예측률 및 예측정확도를 측정하여 평가한다 이러한 타당성을 검증하기 위해 실행구동방식 시뮬레이터를 사용하여 SPECint95 벤치마크를 시뮬레이션하여 비교한다.

  • PDF

The relationship between prediction accuracy and pre-information in collaborative filtering system

  • Kim, Sun-Ok
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.803-811
    • /
    • 2010
  • This study analyzes the characteristics of preference ratings by dividing estimated values into four groups according to rank correlation coefficient after obtaining preference estimated value to user's ratings by using collaborative filtering algorithm. It is known that the value of standard error of skewness and standard error of kurtosis lower in the group of higher rank correlation coefficient This explains that the preference of higher rank correlation coefficient has lower extreme values and the differences of preference rating values. In addition, top n recommendation lists are made after obtaining rank fitting by using the result ranks of prediction value and the ranks of real rated values, and this top n is applied to the four groups. The value of top n recommendation is calculated higher in the group of higher rank correlation coefficient, and the recommendation accuracy in the group of higher rank correlation coefficient is higher than that in the group of lower rank correlation coefficient Thus, when using standard error of skewness and standard error of kurtosis in recommender system, rank correlation coefficient can be higher, and so the accuracy of recommendation prediction can be increased.

Improving the Accuracy of a Heliocentric Potential (HCP) Prediction Model for the Aviation Radiation Dose

  • Hwang, Junga;Yoon, Kyoung-Won;Jo, Gyeongbok;Noh, Sung-Jun
    • Journal of Astronomy and Space Sciences
    • /
    • 제33권4호
    • /
    • pp.279-285
    • /
    • 2016
  • The space radiation dose over air routes including polar routes should be carefully considered, especially when space weather shows sudden disturbances such as coronal mass ejections (CMEs), flares, and accompanying solar energetic particle events. We recently established a heliocentric potential (HCP) prediction model for real-time operation of the CARI-6 and CARI-6M programs. Specifically, the HCP value is used as a critical input value in the CARI-6/6M programs, which estimate the aviation route dose based on the effective dose rate. The CARI-6/6M approach is the most widely used technique, and the programs can be obtained from the U.S. Federal Aviation Administration (FAA). However, HCP values are given at a one month delay on the FAA official webpage, which makes it difficult to obtain real-time information on the aviation route dose. In order to overcome this critical limitation regarding the time delay for space weather customers, we developed a HCP prediction model based on sunspot number variations (Hwang et al. 2015). In this paper, we focus on improvements to our HCP prediction model and update it with neutron monitoring data. We found that the most accurate method to derive the HCP value involves (1) real-time daily sunspot assessments, (2) predictions of the daily HCP by our prediction algorithm, and (3) calculations of the resultant daily effective dose rate. Additionally, we also derived the HCP prediction algorithm in this paper by using ground neutron counts. With the compensation stemming from the use of ground neutron count data, the newly developed HCP prediction model was improved.

특성중요도를 활용한 분류나무의 입력특성 선택효과 : 신용카드 고객이탈 사례 (Feature Selection Effect of Classification Tree Using Feature Importance : Case of Credit Card Customer Churn Prediction)

  • 윤한성
    • 디지털산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.1-10
    • /
    • 2024
  • For the purpose of predicting credit card customer churn accurately through data analysis, a model can be constructed with various machine learning algorithms, including decision tree. And feature importance has been utilized in selecting better input features that can improve performance of data analysis models for several application areas. In this paper, a method of utilizing feature importance calculated from the MDI method and its effects are investigated in the credit card customer churn prediction problem with classification trees. Compared with several random feature selections from case data, a set of input features selected from higher value of feature importance shows higher predictive power. It can be an efficient method for classifying and choosing input features necessary for improving prediction performance. The method organized in this paper can be an alternative to the selection of input features using feature importance in composing and using classification trees, including credit card customer churn prediction.

강우앙상블 예측자료의 공간적 특성 및 적용성 평가 (Appraisal of spatial characteristics and applicability of the predicted ensemble rainfall data)

  • 이상협;성연정;김경탁;정영훈
    • 한국수자원학회논문집
    • /
    • 제53권11호
    • /
    • pp.1025-1037
    • /
    • 2020
  • 본 연구는 호우경보에 사용되는 Limited area ENsemble prediction System (LENS) 강우예측자료에 대한 공간적 특성 및 적용성을 평가하였다. LENS는 13개의 강우앙상블 멤버를 가지고 있어 호우경보를 발령하는데 있어 확률적인 방법을 활용할 수 있다. 그러나 LENS의 자료의 접근성은 매우 낮아 강우예측자료의 적용성에 대한 연구가 미흡한 실정이다. 본 연구에서는 행정구역별로 활용되는 호우경보 시스템에 따라 하나의 지점값과 면적평균값을 관측값과 비교하여 평가지수를 산정하였다. 또한, LENS의 발령시간에 따르는 각 앙상블 멤버들의 정확성을 평가하였다. LENS는 멤버별로 과대 혹은 과소 예측의 불확실성을 보여줬다. 면적단위의 예측이 지점단위의 예측보다 더 높은 예측성을 보여주었다. 또한, 다가오는 72시간의 강우를 예측하는 LENS 자료는 수재해의 영향성이 있을 수 있는 강우 사상에 대하여 예측성능이 좋은 것으로 평가되었다. 추후 국지강우앙상블시스템(LENS) 자료는 행정구역 또는 유역면적 단위의 홍수 대비에 기초자료로 활용될 수 있을 것으로 기대된다.

Prediction of Quantitative Traits Using Common Genetic Variants: Application to Body Mass Index

  • Bae, Sunghwan;Choi, Sungkyoung;Kim, Sung Min;Park, Taesung
    • Genomics & Informatics
    • /
    • 제14권4호
    • /
    • pp.149-159
    • /
    • 2016
  • With the success of the genome-wide association studies (GWASs), many candidate loci for complex human diseases have been reported in the GWAS catalog. Recently, many disease prediction models based on penalized regression or statistical learning methods were proposed using candidate causal variants from significant single-nucleotide polymorphisms of GWASs. However, there have been only a few systematic studies comparing existing methods. In this study, we first constructed risk prediction models, such as stepwise linear regression (SLR), least absolute shrinkage and selection operator (LASSO), and Elastic-Net (EN), using a GWAS chip and GWAS catalog. We then compared the prediction accuracy by calculating the mean square error (MSE) value on data from the Korea Association Resource (KARE) with body mass index. Our results show that SLR provides a smaller MSE value than the other methods, while the numbers of selected variables in each model were similar.

A study of predicting irradiation-induced transition temperature shift for RPV steels with XGBoost modeling

  • Xu, Chaoliang;Liu, Xiangbing;Wang, Hongke;Li, Yuanfei;Jia, Wenqing;Qian, Wangjie;Quan, Qiwei;Zhang, Huajian;Xue, Fei
    • Nuclear Engineering and Technology
    • /
    • 제53권8호
    • /
    • pp.2610-2615
    • /
    • 2021
  • The prediction of irradiation-induced transition temperature shift for RPV steels is an important method for long term operation of nuclear power plant. Based on the irradiation embrittlement data, an irradiation-induced transition temperature shift prediction model is developed with machine learning method XGBoost. Then the residual, standard deviation and predicted value vs. measured value analysis are conducted to analyze the accuracy of this model. At last, Cu content threshold and saturation values analysis, temperature dependence, Ni/Cu dependence and flux effect are given to verify the reliability. Those results show that the prediction model developed with XGBoost has high accuracy for predicting the irradiation embrittlement trend of RPV steel. The prediction results are consistent with the current understanding of RPV embrittlement mechanism.

딥러닝 알고리즘 기반의 초미세먼지(PM2.5) 예측 성능 비교 분석 (Comparison and analysis of prediction performance of fine particulate matter(PM2.5) based on deep learning algorithm)

  • 김영희;장관종
    • 융합정보논문지
    • /
    • 제11권3호
    • /
    • pp.7-13
    • /
    • 2021
  • 본 연구는 딥러닝(Deep Learning) 알고리즘 GAN 모델을 기반으로 초미세먼지(PM2.5) 인공지능 예측시스템을 개발한다. 실험 데이터는 시계열 축으로 생성된 온도, 습도, 풍속, 기압의 기상변화와 SO2, CO, O3, NO2, PM10와 같은 대기오염물질 농도와 밀접한 관련이 있다. 데이터 특성상, 현재시간 농도가 이전시간 농도에 영향을 받기 때문에 반복지도학습(Recursive Supervised Learning) 예측 모델을 적용하였다. 기존 모델인 CNN, LSTM의 정확도(Accuracy)를 비교분석을 위해 관측값(Observation Value)과 예측값(Prediction Value)간의 차이를 분석하고 시각화했다. 성능분석 결과 제안하는 GAN이 LSTM 대비 평가항목 RMSE, MAPE, IOA에서 각각 15.8%, 10.9%, 5.5%로 향상된 것을 확인하였다.

2단계 k-평균 군집화를 활용한 한류컨텐츠 기업 주가 예측 연구 (A Study On Predicting Stock Prices Of Hallyu Content Companies Using Two-Stage k-Means Clustering)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.169-179
    • /
    • 2021
  • 본 연구는 기존의 k-평균 군집화를 활용한 2단계 k-평균 군집화 방법을 사용하여 한류콘텐츠 기업들의 주식가격을 예측함으로써 본 기법이 예측성능을 개선할 수 있음을 보이고자 하였다. 이를 위하여 본 연구는 2단계 k-평균 군집화의 알고리즘을 소개하고, 다양한 머신러닝 기법들과의 예측값 비교를 통하여 본 기법의 예측성능을 검증하였다. 본 기법은 기존의 k-평균 군집화로부터 얻어진 군집들 중에서 예측 대상에 근접한 군집을 추출하고 이 군집에 k-평군 군집화 방법을 다시 적용하여 실제 값에 보다 근접한 군집을 탐색하는 방식이다. 본 기법을 한류콘텐츠 기업들의 주가 시계열 자료에 적용한 결과, 다른 머신러닝 기법의 예측값들보다 실제 주식가격에 근접한 예측값을 나타내어, 기존의 k-평균 군집화 방법보다 개선된 예측성능을 보였다. 또한, 본 기법은 상대적으로 적은 크기의 군집을 사용함에도 불구하고 비교적 안정적인 예측값을 나타내었다. 이에 따라, 2단계 k-평균 군집화 기법은 예측의 정확성과 안정성을 동시에 개선할 수 있으며, 소규모 자료에도 유용할 수 있는 새로운 군집화 방식을 제시했다고 볼 수 있다. 향후에는 본 기법을 발전시켜 대규모 자료에도 적용하는 방안을 검토하는 연구가 요구된다.