• 제목/요약/키워드: multi model ensemble

검색결과 95건 처리시간 0.028초

An AutoML-driven Antenna Performance Prediction Model in the Autonomous Driving Radar Manufacturing Process

  • So-Hyang Bak;Kwanghoon Pio Kim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권12호
    • /
    • pp.3330-3344
    • /
    • 2023
  • This paper proposes an antenna performance prediction model in the autonomous driving radar manufacturing process. Our research work is based upon a challenge dataset, Driving Radar Manufacturing Process Dataset, and a typical AutoML machine learning workflow engine, Pycaret open-source Python library. Note that the dataset contains the total 70 data-items, out of which 54 used as input features and 16 used as output features, and the dataset is properly built into resolving the multi-output regression problem. During the data regression analysis and preprocessing phase, we identified several input features having similar correlations and so detached some of those input features, which may become a serious cause of the multicollinearity problem that affect the overall model performance. In the training phase, we train each of output-feature regression models by using the AutoML approach. Next, we selected the top 5 models showing the higher performances in the AutoML result reports and applied the ensemble method so as for the selected models' performances to be improved. In performing the experimental performance evaluation of the regression prediction model, we particularly used two metrics, MAE and RMSE, and the results of which were 0.6928 and 1.2065, respectively. Additionally, we carried out a series of experiments to verify the proposed model's performance by comparing with other existing models' performances. In conclusion, we enhance accuracy for safer autonomous vehicles, reduces manufacturing costs through AutoML-Pycaret and machine learning ensembled model, and prevents the production of faulty radar systems, conserving resources. Ultimately, the proposed model holds significant promise not only for antenna performance but also for improving manufacturing quality and advancing radar systems in autonomous vehicles.

다중 지역기후모델로부터 모의된 월 기온자료를 이용한 다중선형회귀모형들의 예측성능 비교 (Inter-comparison of Prediction Skills of Multiple Linear Regression Methods Using Monthly Temperature Simulated by Multi-Regional Climate Models)

  • 성민규;김찬수;서명석
    • 대기
    • /
    • 제25권4호
    • /
    • pp.669-683
    • /
    • 2015
  • In this study, we investigated the prediction skills of four multiple linear regression methods for monthly air temperature over South Korea. We used simulation results from four regional climate models (RegCM4, SNURCM, WRF, and YSURSM) driven by two boundary conditions (NCEP/DOE Reanalysis 2 and ERA-Interim). We selected 15 years (1989~2003) as the training period and the last 5 years (2004~2008) as validation period. The four regression methods used in this study are as follows: 1) Homogeneous Multiple linear Regression (HMR), 2) Homogeneous Multiple linear Regression constraining the regression coefficients to be nonnegative (HMR+), 3) non-homogeneous multiple linear regression (EMOS; Ensemble Model Output Statistics), 4) EMOS with positive coefficients (EMOS+). It is same method as the third method except for constraining the coefficients to be nonnegative. The four regression methods showed similar prediction skills for the monthly air temperature over South Korea. However, the prediction skills of regression methods which don't constrain regression coefficients to be nonnegative are clearly impacted by the existence of outliers. Among the four multiple linear regression methods, HMR+ and EMOS+ methods showed the best skill during the validation period. HMR+ and EMOS+ methods showed a very similar performance in terms of the MAE and RMSE. Therefore, we recommend the HMR+ as the best method because of ease of development and applications.

HadGEM2-AO의 북태평양 중층수 모의 성능 평가 (Evaluation of North Pacific Intermediate Water Simulated by HadGEM2-AO)

  • 민홍식;임보영
    • Ocean and Polar Research
    • /
    • 제37권4호
    • /
    • pp.265-278
    • /
    • 2015
  • We analyzed the North Pacific Intermediate Water (NPIW) that was simulated in 25 coupled general circulation models (CGCMs) using historical and Representative Concentration Pathway 4.5 (RCP4.5) scenario experiments of Coupled Model Intercomparison Project Phase 5 (CMIP5), focusing on the evaluation of the performance of HadGEM2-AO. A large inter-model diversity in salinity, density, and depth of the NPIW exists even though the multi-model ensemble mean (MME) is comparable to observations. It was found that the depth of the NPIW tends to be deeper in the models in which the NPIW is relatively saltier. HadGEM2-AO simulates the lightest NPIW having the lowest salinity at shallower depth, compared with other CGCMs. Future projections of the NPIW show that the temperature of the NPIW increases, but the density decreases in all CMIP5 models. It was shown that the salinity of the NPIW decreases in most models and the decrease tends to be larger in models simulating the lighter NPIW. The HadGEM2-AO projects moderate changes in the temperature and density of the NPIW out of the CMIP5 models.

기상자료 및 GCMs 예측결과를 활용한 단기 가뭄 예측 (Climate Information and GCMs Seasonal Forecasts Based Short-term Forecasts for Drought)

  • 권현한;문장원;송현섭;문영일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1186-1190
    • /
    • 2009
  • 강수량이 예년에 비해 적은 양상은 여름강수량에 대한 부족으로 기인한다. 우리나라의 경우 장마기간의 강수와 태풍으로 인해 발생하는 강수가 전체 강수량에 많은 부분을 차지하고 있기 때문에 여름강수량이 적게 나타나게 되면 가을 가뭄 및 봄 가뭄에 대한 발생 압력도 그 만큼 커지게 되는 것이 일반적이다. 기존 연구들이 단순히 강수량을 가정하거나 시나리오를 기반으로 가뭄을 전망하는데 그치고 있으나 본 연구에서는 2009년 가뭄전망을 위해서 전지구기후모형(GCMs)의 3개월 기상예측 결과를 활용하고자 한다. 즉, APEC 기후예측 센터로부터 제공 받은 3개월 GCM Multi-Model Ensemble 예측 결과를 바탕으로 가뭄상태를 평가하였다. 따라서 본 연구의 목적은 Large-scale의 기후예측 시스템과 기상관측지점의 강수 및 온도를 연결시켜 가뭄을 전망할 수 있는 시스템을 구축하는데 있다. GCM 예측 결과를 바탕으로 2009년도 매월 강수량 및 평균 온도를 추정하여 PDSI 가뭄지수 산정에 이용하였다.

  • PDF

계층적 베이지안 모델을 통한 최적 기후변화 시나리오 추정 : CORDEX 시나리오 사용 (Optimum Climate Change Scenario Estimation via Hierarchical Bayesian Model : Using CORDEX Scenarios)

  • 정민규;김용탁;김현묵;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.168-168
    • /
    • 2018
  • 최근 기후변화로 인하여 전 세계적으로 과거 강우사상에서 확인되지 않는 극치사상이 빈번하게 관측되고 있으며 이에 따른 피해도 증가하고 있다. 미래의 기상학적 변동성 및 기후변화 영향은 지구순환모형 (General Circulation Models, GCM)을 통해 구체화되며 가장 일반적인 기후변화 전망자료로서 활용된다. 그러나 산정된 기후변화 시나리오마다 서로 그 특성에 차이가 있으며 이러한 이유로 다양한 원인으로 인해 큰 변동성을 가지는 미래 극치강우를 하나의 시나리오로 분석하기에는 무리가 있다. 또한 다양한 시나리오를 통해 분석한 결과값이 상이하며 이러한 시나리오별 산정 결과의 차이는 사용자에게 혼란을 야기할 수 있어 이를 하나의 결과로 나타낼 필요성이 있으나 정량적인 대푯값을 얻기 위해 특정 시나리오를 선택하는 것은 신뢰성에 문제가 있다. 본 연구에서는 시나리오들을 정량적 지표에 의거하여 혼합된 하나의 시나리오로 표출하고자 하였다. CORDEX-RCMs 시나리오 중 HadGEM3-RA, RegCM, SNU_WRF 및 GRIMs를 입력 자료로 하여 다중모형앙상블(Multi-Model Ensemble, MME)을 통해 낙동강 유역의 극치강우에 대한 하나의 최적 기후변화 시나리오를 도출하고자 하였으며 계층적 베이지안 (Hierarchical Bayesian Model, HBM) 기법을 통하여 기후변화 시나리오에 내제된 불확실성에 대한 정량적인 해석을 수행하였다.

  • PDF

Students' Performance Prediction in Higher Education Using Multi-Agent Framework Based Distributed Data Mining Approach: A Review

  • M.Nazir;A.Noraziah;M.Rahmah
    • International Journal of Computer Science & Network Security
    • /
    • 제23권10호
    • /
    • pp.135-146
    • /
    • 2023
  • An effective educational program warrants the inclusion of an innovative construction which enhances the higher education efficacy in such a way that accelerates the achievement of desired results and reduces the risk of failures. Educational Decision Support System (EDSS) has currently been a hot topic in educational systems, facilitating the pupil result monitoring and evaluation to be performed during their development. Insufficient information systems encounter trouble and hurdles in making the sufficient advantage from EDSS owing to the deficit of accuracy, incorrect analysis study of the characteristic, and inadequate database. DMTs (Data Mining Techniques) provide helpful tools in finding the models or forms of data and are extremely useful in the decision-making process. Several researchers have participated in the research involving distributed data mining with multi-agent technology. The rapid growth of network technology and IT use has led to the widespread use of distributed databases. This article explains the available data mining technology and the distributed data mining system framework. Distributed Data Mining approach is utilized for this work so that a classifier capable of predicting the success of students in the economic domain can be constructed. This research also discusses the Intelligent Knowledge Base Distributed Data Mining framework to assess the performance of the students through a mid-term exam and final-term exam employing Multi-agent system-based educational mining techniques. Using single and ensemble-based classifiers, this study intends to investigate the factors that influence student performance in higher education and construct a classification model that can predict academic achievement. We also discussed the importance of multi-agent systems and comparative machine learning approaches in EDSS development.

유전 알고리즘을 이용한 국소가중회귀의 다중모델 결합을 위한 점진적 앙상블 학습 (Incremental Ensemble Learning for The Combination of Multiple Models of Locally Weighted Regression Using Genetic Algorithm)

  • 김상훈;정병희;이건호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.351-360
    • /
    • 2018
  • 전통적으로 나태한 학습에 해당하는 국소가중회귀(LWR: Locally Weighted Regression)모델은 입력변수인 질의지점에 따라 예측의 해를 얻기 위해 일정구간 범위내의 학습 데이터를 대상으로 질의지점의 거리에 따라 가중값을 달리 부여하여 학습 한 결과로 얻은 짧은 구간내의 회귀식이다. 본 연구는 메모리 기반학습의 형태에 해당하는 LWR을 위한 점진적 앙상블 학습과정을 제안한다. LWR를 위한 본 연구의 점진적 앙상블 학습법은 유전알고리즘을 이용하여 시간에 따라 LWR모델들을 순차적으로 생성하고 통합하는 것이다. 기존의 LWR 한계는 인디케이터 함수와 학습 데이터의 선택에 따라 다중의 LWR모델이 생성될 수 있으며 이 모델에 따라 예측 해의 질도 달라질 수 있다. 하지만 다중의 LWR 모델의 선택이나 결합의 문제 해결을 위한 연구가 수행되지 않았다. 본 연구에서는 인디케이터 함수와 학습 데이터에 따라 초기 LWR 모델을 생성한 후 진화 학습 과정을 반복하여 적절한 인디케이터 함수를 선택하며 또한 다른 학습 데이터에 적용한 LWR 모델의 평가와 개선을 통하여 학습 데이터로 인한 편향을 극복하고자 한다. 모든 구간에 대해 데이터가 발생 되면 점진적으로 LWR모델을 생성하여 보관하는 열심학습(Eager learning)방식을 취하고 있다. 특정 시점에 예측의 해를 얻기 위해 일정구간 내에 신규로 발생된 데이터들을 기반으로 LWR모델을 생성한 후 유전자 알고리즘을 이용하여 구간 내의 기존 LWR모델들과 결합하는 방식이다. 제안하는 학습방법은 기존 단순평균법을 이용한 다중 LWR모델들의 선택방법 보다 적합도 평가에서 우수한 결과를 보여주고 있다. 특정지역의 시간 별 교통량, 고속도로 휴게소의 시간별 매출액 등의 실제 데이터를 적용하여 본 연구의 LWR에 의한 결과들의 연결된 패턴과 다중회귀분석을 이용한 예측결과를 비교하고 있다.

The change of East Asian Monsoon to $CO_2$ increase

  • Kripalani, R.H.;Oh, J.H.;Chaudhari, H.S.
    • 한국제4기학회지
    • /
    • 제20권1호
    • /
    • pp.9-27
    • /
    • 2006
  • 이 연구는 동아시아 (중국, 한국, 그리고 일본) 여름몬순과 그 변동성을 MME (multi-model ensemble)을 이용하여 IPCC AR4 (Intergovernmental Panel on Climate Change Fourth Assessment Report) 실험의22개 접합 기후모델 결과 자료로 분석하였다. 결과자료들은 사용 가능한 모든 모델의 평균값을 이용하였다. 여름 몬순 기간 동안 최대 강수를 가지는 연주기는 모델에 의해 모의되었으나 장마(Meiyu-Changma-Baiu) 강수밴드의 이동(북쪽)과 연관되어 7월에 나타나는 최소값은 모의하지 못했다. MME 강수 패턴은 북태평양아열대 고기압과 장마전선대의 위치와 연관된 강수의 공간적 분포를 잘 나타내었다. 그러나 중국, 한반도, 그리고 일본의 동해와 인근 해역의 강수는 과소 예측되었다. 마지막으로 $CO_2$ 농도 배증시나리오의 복사 강제에 대한 미래예측을 분석하였다. MME는 $CO_2$ 농도가 배증될 때 동아시아지역에서 강수는 평균 7.8%로 나타났고, $5{\sim}10%$의 변화폭을 보였다. 그러나 이러한 강수의 증가는 통계적으로 한반도와 일본, 그리고 인근 북중국 지역에서만 중요한 의미를 가진다. 강수 예측에서 나타난 변화는 아열대 고기압의 강도 변화에 비례하는 것으로 나타났다. 그리고 봄에서 초가을까지 여름 몬순의 지속기간이 길어짐을 확인하였다.

  • PDF

현 기후 모델에서 모의되는 20세기 후반 해들리 순환 변화의 특징 (The Characteristics of the Change of Hadley Circulation during the Late 20th Century in the Current AOGCMs)

  • 신상희;정일웅
    • 대기
    • /
    • 제22권3호
    • /
    • pp.331-344
    • /
    • 2012
  • The changes in the Hadley circulation during the second half of the 20th century were examined using observations and the 20C3M (Twentieth Century Climate in Coupled Models) simulations by the 21 IPCC AR4 models. Multi-model ensemble (MME) mean shows that the mean features of the Hadley circulation, such as the intensity, magnitude, and the seasonal variations, are very realistically reproduced, compared to the ERA40 reanalysis. But the long-term trends of the Hadley circulation in 20C3M MME are quite different to those of observations. The observed intensity of the Hadley cell is persistently enhanced, particularly during boreal winter. In comparison, the meridional overturning circulations reproduced in the MME mean remains invariant in time, and even weakened in boreal summer. This discrepancy between the ERA40 and 20C3M MME is consistently shown in the overall structure of the Hadley circulations, such as mass streamfunction, the velocity potential, the vertical shear of meridional wind, and the vertical velocity in the tropical region. This results indicate that the current climate models are skill-less to capture the long-term trend of Hadley circulation yet, and should be improved in simulation of the large-scale features to enhance the confidence level of future climate change projection.

다양한 지구통계기법의 지하매질 예측능 및 적용성 비교연구 (Comparative Analysis of Subsurface Estimation Ability and Applicability Based on Various Geostatistical Model)

  • 안정우;정진아;박은규
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제19권4호
    • /
    • pp.31-44
    • /
    • 2014
  • In the present study, a few of recently developed geostatistical models are comparatively studied. The models are two-point statistics based sequential indicator simulation (SISIM) and generalized coupled Markov chain (GCMC), multi-point statistics single normal equation simulation (SNESIM), and object based model of FLUVSIM (fluvial simulation) that predicts structures of target object from the provided geometric information. Out of the models, SNESIM and FLUVSIM require additional information other than conditioning data such as training map and geometry, respectively, which generally claim demanding additional resources. For the comparative studies, three-dimensional fluvial reservoir model is developed considering the genetic information and the samples, as input data for the models, are acquired by mimicking realistic sampling (i.e. random sampling). For SNESIM and FLUVSIM, additional training map and the geometry data are synthesized based on the same information used for the objective model. For the comparisons of the predictabilities of the models, two different measures are employed. In the first measure, the ensemble probability maps of the models are developed from multiple realizations, which are compared in depth to the objective model. In the second measure, the developed realizations are converted to hydrogeologic properties and the groundwater flow simulation results are compared to that of the objective model. From the comparisons, it is found that the predictability of GCMC outperforms the other models in terms of the first measure. On the other hand, in terms of the second measure, the both predictabilities of GCMC and SNESIM are outstanding out of the considered models. The excellences of GCMC model in the comparisons may attribute to the incorporations of directional non-stationarity and the non-linear prediction structure. From the results, it is concluded that the various geostatistical models need to be comprehensively considered and comparatively analyzed for appropriate characterizations.