• 제목/요약/키워드: Model Ensemble

검색결과 643건 처리시간 0.024초

Relevancy contemplation in medical data analytics and ranking of feature selection algorithms

  • P. Antony Seba;J. V. Bibal Benifa
    • ETRI Journal
    • /
    • 제45권3호
    • /
    • pp.448-461
    • /
    • 2023
  • This article performs a detailed data scrutiny on a chronic kidney disease (CKD) dataset to select efficient instances and relevant features. Data relevancy is investigated using feature extraction, hybrid outlier detection, and handling of missing values. Data instances that do not influence the target are removed using data envelopment analysis to enable reduction of rows. Column reduction is achieved by ranking the attributes through feature selection methodologies, namely, extra-trees classifier, recursive feature elimination, chi-squared test, analysis of variance, and mutual information. These methodologies are ranked via Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS) using weight optimization to identify the optimal features for model building from the CKD dataset to facilitate better prediction while diagnosing the severity of the disease. An efficient hybrid ensemble and novel similarity-based classifiers are built using the pruned dataset, and the results are thereafter compared with random forest, AdaBoost, naive Bayes, k-nearest neighbors, and support vector machines. The hybrid ensemble classifier yields a better prediction accuracy of 98.31% for the features selected by extra tree classifier (ETC), which is ranked as the best by TOPSIS.

Malwares Attack Detection Using Ensemble Deep Restricted Boltzmann Machine

  • K. Janani;R. Gunasundari
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.64-72
    • /
    • 2024
  • In recent times cyber attackers can use Artificial Intelligence (AI) to boost the sophistication and scope of attacks. On the defense side, AI is used to enhance defense plans, to boost the robustness, flexibility, and efficiency of defense systems, which means adapting to environmental changes to reduce impacts. With increased developments in the field of information and communication technologies, various exploits occur as a danger sign to cyber security and these exploitations are changing rapidly. Cyber criminals use new, sophisticated tactics to boost their attack speed and size. Consequently, there is a need for more flexible, adaptable and strong cyber defense systems that can identify a wide range of threats in real-time. In recent years, the adoption of AI approaches has increased and maintained a vital role in the detection and prevention of cyber threats. In this paper, an Ensemble Deep Restricted Boltzmann Machine (EDRBM) is developed for the classification of cybersecurity threats in case of a large-scale network environment. The EDRBM acts as a classification model that enables the classification of malicious flowsets from the largescale network. The simulation is conducted to test the efficacy of the proposed EDRBM under various malware attacks. The simulation results show that the proposed method achieves higher classification rate in classifying the malware in the flowsets i.e., malicious flowsets than other methods.

자료동화 기법을 연계한 실시간 하천유량 예측모형 개발 (Development of Real-Time River Flow Forecasting Model with Data Assimilation Technique)

  • 이병주;배덕효
    • 한국수자원학회논문집
    • /
    • 제44권3호
    • /
    • pp.199-208
    • /
    • 2011
  • 본 연구에서는 연속형 강우-유출모형과 앙상블 칼만 필터 기법을 연계하여 실시간 하천유량 예측모형을 개발하고 자료동화로 인한 정확도 개선 정도를 평가하고자 한다. 대상유역은 안동댐 상류유역을 선정하고 2006.7.1~8.18과 2007.8.1~9.30의 홍수기간에 대해 평가를 수행하였다. 자료동화를 위한 모형 상태변수는 유역의 토양수분과 저류량 및 하도 저류량을 선정하였으며 하류 댐 지점의 관측유량을 이용하여 상태변수를 갱신하도록 모형을 설계하였다. 상태변수의 칼만게인 거동을 분석한 결과 모의유량은 관측유량으로 74% 이동한 것으로 나타났다. 예측강우를 관측강우와 동일하다고 가정하고 예측선행시간 1시간에 대해 자료동화 전 후의 모의유량을 분석한 결과 2006년과 2007년에 각각 49.6%와 33.1%의 정확도가 향상됨을 확인하였다. 이상의 결과로부터 실시간 하천유량 예측시스템에 자료동화기법을 연계할 경우 강우-유출모형만을 이용한 결과보다 정확한 홍수량 예측이 가능할 것으로 판단된다.

A Model Calculation of Solar Microwave Burst Structure

  • Choi, Yong-Seok
    • 한국우주과학회:학술대회논문집(한국우주과학회보)
    • /
    • 한국우주과학회 1995년도 한국우주과학회보 제4권1호
    • /
    • pp.21-21
    • /
    • 1995
  • The structures of 17GHz microwave burst for bipolar sunspots have investigated. which included the effects of the projected shapes of radio sources as they traverse across the solar disk using a magnetic loop employing a model of solenoid coils. An ensemble of high-energy electrons confined in the loop be assumed. The projected brightnesls distributions of gyrosynchrotron emission in x- and o-modes are computed and converted into total intensity and circular polarization difference at 17GHz for various heliocentric distances using numerical integration of the transfer equation along the line of sight. The results of computations at 17GHz for optical thin case will be presented. and the effects of the orientation of the loop will be discussed in detail, as well as the effect of size, position, Structure, and polarization of the emission. Also the results of the various physical P8lrameters such as the strength of magnetic field. high and low energy cut-off of accelerated electrons. spectral index and density of electrons will be preslmted. After comparing the results of model calculation with observations. we found that the observations can be well explained in terms of a loop model and its projection effect.effect.

  • PDF

Bankruptcy Prediction with Explainable Artificial Intelligence for Early-Stage Business Models

  • Tuguldur Enkhtuya;Dae-Ki Kang
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권3호
    • /
    • pp.58-65
    • /
    • 2023
  • Bankruptcy is a significant risk for start-up companies, but with the help of cutting-edge artificial intelligence technology, we can now predict bankruptcy with detailed explanations. In this paper, we implemented the Category Boosting algorithm following data cleaning and editing using OpenRefine. We further explained our model using the Shapash library, incorporating domain knowledge. By leveraging the 5C's credit domain knowledge, financial analysts in banks or investors can utilize the detailed results provided by our model to enhance their decision-making processes, even without extensive knowledge about AI. This empowers investors to identify potential bankruptcy risks in their business models, enabling them to make necessary improvements or reconsider their ventures before proceeding. As a result, our model serves as a "glass-box" model, allowing end-users to understand which specific financial indicators contribute to the prediction of bankruptcy. This transparency enhances trust and provides valuable insights for decision-makers in mitigating bankruptcy risks.

CV 기반 악성 URL 탐지 앙상블 스태킹 모델 (CV-based malicious URL detection ensemble stacking model)

  • 이종호;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.846-849
    • /
    • 2024
  • 다양한 분야에서 QR 코드가 급속도로 확산되면서, QR 코드를 악용하여 사용자를 악성 웹사이트로 리디렉션하는 '큐싱(Qshing)'이라는 새로운 형태의 사이버 범죄가 등장했다. 이에 본 연구에서는 일반화 성능을 향상시키기 위해 교차 검증(CV)을 활용하여 QR 코드 스캔과 관련된 악성 URL을 탐지하도록 설계된 스태킹 앙상블 모델을 제안한다. 이러한 통합은 실제 애플리케이션에서 높은 성능을 기대할 수 있도록 설계되었다. 본 연구는 이 모델이 기존의 연구보다 QR 코드 관련 사이버 위협에 대처하는 보다 효과적인 수단을 제공할 것으로 기대한다.

  • PDF

시간 연속성을 고려한 딥러닝 기반 레이더 강우예측 (Radar rainfall prediction based on deep learning considering temporal consistency)

  • 신홍준;윤성심;최재민
    • 한국수자원학회논문집
    • /
    • 제54권5호
    • /
    • pp.301-309
    • /
    • 2021
  • 본 연구에서는 시계열 순서의 의미가 희석될 수 있는 기존의 U-net 기반 딥러닝 강우예측 모델의 성능을 개선하고자 하였다. 이를 위해서 데이터의 연속성을 고려한 ConvLSTM2D U-Net 신경망 구조를 갖는 모델을 적용하고, RainNet 모델 및 외삽 기반의 이류모델을 이용하여 예측정확도 개선 정도를 평가하였다. 또한 신경망 기반 모델 학습과정에서의 불확실성을 개선하기 위해 단일 모델뿐만 아니라 10개의 앙상블 모델로 학습을 수행하였다. 학습된 신경망 강우예측모델은 현재를 기준으로 과거 30분 전까지의 연속된 4개의 자료를 이용하여 10분 선행 예측자료를 생성하는데 최적화되었다. 최적화된 딥러닝 강우예측모델을 이용하여 강우예측을 수행한 결과, ConvLSTM2D U-Net을 사용하였을 때 예측 오차의 크기가 가장 작고, 강우 이동 위치를 상대적으로 정확히 구현하였다. 특히, 앙상블 ConvLSTM2D U-Net이 타 예측모델에 비해 높은 CSI와 낮은 MAE를 보이며, 상대적으로 정확하게 강우를 예측하였으며, 좁은 오차범위로 안정적인 예측성능을 보여주었다. 다만, 특정 지점만을 대상으로 한 예측성능은 전체 강우 영역에 대한 예측성능에 비해 낮게 나타나, 상세한 영역의 강우예측에 대한 딥러닝 강우예측모델의 한계도 확인하였다. 본 연구를 통해 시간의 변화를 고려하기 위한 ConvLSTM2D U-Net 신경망 구조가 예측정확도를 높일 수 있었으나, 여전히 강한 강우영역이나 상세한 강우예측에는 공간 평활로 인한 합성곱 신경망 모델의 한계가 있음을 확인하였다.

FR과 LR 앙상블 모형을 이용한 산사태 취약성 지도 제작 및 검증 (Landslide Susceptibility Mapping Using Ensemble FR and LR models at the Inje Area, Korea)

  • 김진수;박소영
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.19-27
    • /
    • 2017
  • 본 연구의 목적은 인제읍을 대상으로 빈도비와 로지스틱 회귀분석 모델을 통합한 앙상블 모델을 이용하여 산사태 취약성을 분석하고, 예측 정확도를 비교하는 것이다. 산사태 위치는 산사태 발생 전 후에 촬영된 항공사진을 이용하여 추출되었다. 추출된 총 422개의 산사태는 산사태 취약성 분석을 위해 훈련용 (70%)과 검증용 (30%) 자료로 랜덤하게 분류되었다. 산사태 관련인자는 고도, 경사도, 경사향, 배수로부터의 거리, 토양수분지수, 하천강도지수, 토질, 유효토심, 영급, 경급, 밀도, 임상 등 총 12개의 인자를 이용하였다. 산사태 및 산사태 관련인자는 공간데이터베이스로 구축된 뒤 빈도비와 앙상블 모델을 이용하여 산사태와 산사태 관련 인자 간 상관관계를 분석하였다. 그 결과를 바탕으로 각 모델별 산사태 취약성 지도를 작성하였고, relative operating characteristics(ROC) 곡선을 이용하여 예측 정확도를 검증 및 비교하였다. 분석 결과, 앙상블 모델에 의해 작성된 산사태 취약성 지도는 75.2%의 예측 정확도를 보였고, 이 결과는 빈도비 모델에 의해 작성된 산사태 취약성 지도와 비교하여 예측 정확도가 약 2% 향상된 것으로 나타났다. 본 연구에서 작성된 산사태 취약성 지도는 향후 효과적인 토지이용 계획을 수립하고, 재난재해로 인한 피해를 경감시키는데 활용 가능할 것으로 판단된다.

열성층 해석 난류모델 평가 (EVALUATION OF TURBULENCE MODELS FOR ANALYSIS OF THERMAL STRATIFICATION)

  • 최석기;김세윤;김성오
    • 한국전산유체공학회지
    • /
    • 제10권4호통권31호
    • /
    • pp.12-17
    • /
    • 2005
  • A computational study of evaluation of current turbulence models is performed for a better prediction of thermal stratification in an upper plenum of a liquid metal reactor. The turbulence models tested in the present study are the two-layer model, the shear stress transport (SST) model, the v2-f model and the elliptic blending mode(EBM). The performances of the turbulence models are evaluated by applying them to the thermal stratification experiment conducted at JNC (Japan Nuclear Corporation). The algebraic flux model is used for treating the turbulent heat flux for the two-layer model and the SST model, and there exist little differences between the two turbulence models in predicting the temporal variation of temperature. The v2-f model and the elliptic blending model better predict the steep gradient of temperature at the interface of thermal stratification, and the v2-f model and elliptic blending model predict properly the oscillation of the ensemble-averaged temperature. In general the overall performance of the elliptic blending model is better than the v2-f model in the prediction of the amplitude and frequency of the temperature oscillation.

텐서플로우 튜토리얼 방식의 머신러닝 신규 모델 개발 : 캐글 타이타닉 데이터 셋을 중심으로 (Developing of New a Tensorflow Tutorial Model on Machine Learning : Focusing on the Kaggle Titanic Dataset)

  • 김동길;박용순;박래정;정태윤
    • 대한임베디드공학회논문지
    • /
    • 제14권4호
    • /
    • pp.207-218
    • /
    • 2019
  • The purpose of this study is to develop a model that can systematically study the whole learning process of machine learning. Since the existing model describes the learning process with minimum coding, it can learn the progress of machine learning sequentially through the new model, and can visualize each process using the tensor flow. The new model used all of the existing model algorithms and confirmed the importance of the variables that affect the target variable, survival. The used to classification training data into training and verification, and to evaluate the performance of the model with test data. As a result of the final analysis, the ensemble techniques is the all tutorial model showed high performance, and the maximum performance of the model was improved by maximum 5.2% when compared with the existing model using. In future research, it is necessary to construct an environment in which machine learning can be learned regardless of the data preprocessing method and OS that can learn a model that is better than the existing performance.