• 제목/요약/키워드: SVM algorithm

검색결과 637건 처리시간 0.027초

Comparative Analysis of Machine Learning Techniques for IoT Anomaly Detection Using the NSL-KDD Dataset

  • Zaryn, Good;Waleed, Farag;Xin-Wen, Wu;Soundararajan, Ezekiel;Maria, Balega;Franklin, May;Alicia, Deak
    • International Journal of Computer Science & Network Security
    • /
    • 제23권1호
    • /
    • pp.46-52
    • /
    • 2023
  • With billions of IoT (Internet of Things) devices populating various emerging applications across the world, detecting anomalies on these devices has become incredibly important. Advanced Intrusion Detection Systems (IDS) are trained to detect abnormal network traffic, and Machine Learning (ML) algorithms are used to create detection models. In this paper, the NSL-KDD dataset was adopted to comparatively study the performance and efficiency of IoT anomaly detection models. The dataset was developed for various research purposes and is especially useful for anomaly detection. This data was used with typical machine learning algorithms including eXtreme Gradient Boosting (XGBoost), Support Vector Machines (SVM), and Deep Convolutional Neural Networks (DCNN) to identify and classify any anomalies present within the IoT applications. Our research results show that the XGBoost algorithm outperformed both the SVM and DCNN algorithms achieving the highest accuracy. In our research, each algorithm was assessed based on accuracy, precision, recall, and F1 score. Furthermore, we obtained interesting results on the execution time taken for each algorithm when running the anomaly detection. Precisely, the XGBoost algorithm was 425.53% faster when compared to the SVM algorithm and 2,075.49% faster than the DCNN algorithm. According to our experimental testing, XGBoost is the most accurate and efficient method.

웨이블릿 특징 벡터 기반 SVM을 이용한 ERP 검출 알고리즘에 관한 연구 (Study on ERP Detection Algorithm Using SVM with wavelet feature vector)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.9-15
    • /
    • 2017
  • 본 연구에서는 웨이블릿 평면에서 대역 분할된 데이터를 특징 벡터로 하는 SVM을 이용한 ERP 검출 실험을 하였다. 뇌파 신호는 SCSD의 SCCN 뇌파 데이터베이스에 있는 시각적 자극(visual stimulus)을 이용하여 발생한 ERP를 사용하였다. 검출 알고리즘을 이용한 실험은 기존의 뇌파의 주파수 분석 데이터를 특징 벡터로 하는 방법과 웨이블릿 평면에서 전개된 뇌파 데이터를 특징 벡터로 하는 SVM 검출 방식을 비교하였다. 실험 결과는 기존의 특징 벡터를 이용하는 방법에 비하여 웨이블릿 평면에서 전개된 특징 벡터를 이용하는 SVM 방식이 EPR의 검출 율에서 약 10%의 향상된 성능을 나타내었다. 실험 결과에 대한 분석에서 웨이블릿 평면 특징 벡터를 적용한 SVM 실험 결과에서 검출율이 향상된 이유로서 대뇌 피질 활동이 ERP의 주파수 대역에 따른 활동성의 증감 특성과 ERP의 웨이블릿 평면 대역별 특성에 대한 비교 분석을 수행하였다.

SMV코덱의 음성/음악 분류 성능 향상을 위한 최적화된 가중치를 적용한 입력벡터 기반의 SVM 구현 (Analysis and Implementation of Speech/Music Classification for 3GPP2 SMV Codec Employing SVM Based on Discriminative Weight Training)

  • 김상균;장준혁;조기호;김남수
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.471-476
    • /
    • 2009
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 최적화된 가중치를 가지는 입력벡터를 구성하여 support vector machine (SVM)을 이용한 기존의 3GPP2 selectable mode vocoder (SMV)코덱의 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. 구체적으로, 최소 분류 오차 minimum classification error (MCE) 방법을 도입하여, 최적화된 가중치를 각각의 특징벡터별로 부가한 SVM을 적용하여 기존의 가중치를 고려하지 않은 SVM 기반의 알고리즘과 비교하였으며, 우수한 음성/음악 분류 성능을 보였다.

Support Vector Machine (SVM) 기반 전압안정성 분류 알고리즘 (Support Vector Machine (SVM) based Voltage Stability Classifier)

  • 로델도사노;송화창;이병준
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 추계학술대회 논문집 전력기술부문
    • /
    • pp.36-39
    • /
    • 2006
  • This paper proposes a support vector machine (SVM) based power system voltage stability classifier using local measurement data. The excellent performance of the SVM in the classification related to time-series prediction matches the real-time data of PMU for monitoring power system dynamics. The methodology for fast monitoring of the system is initiated locally which aims to leave sufficient time to perform immediate corrective actions to stop system degradation by the effect of major disturbances. This paper briefly describes the mathematical background of SVM, and explains the procedure for fast classification of voltage stability using the SVM algorithm. To illustrate the effectiveness of the classifier, this paper includes numerical examples with a 11-bus test system.

  • PDF

마진 벡터를 이용한 앙상블 SVM의 학습 (Ensemble SVM Learning Using Margin Vector)

  • 박상호;김태순;박선;강윤희;이주홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.301-304
    • /
    • 2003
  • SVM은 일반화된 높은 분류 정확률을 보인다. 그러나, SVM은 데이터의 양이 커질수록 높은 시간 공간적 복잡성 때문에 근사화 알고리즘(Approximation Algorithm)을 이용한다. 이러한 접근 방법은 실제구현에서 높은 시간 공간적 복잡성을 요구하여 분류 정확률과 효율성을 낮아지게 한다. 따라서, 본 논문은 SVM을 앙상블 구조로 구성하여 분류 정확률을 높이고, 분류자의 최적 하이퍼플랜(Optimal Hyperplane)결정을 위해 마진 벡터만을 이용하여 시간 공간적 문제를 해결하였다. 실험결과, 본 논문에서 제시한 방법이 단일 SVM을 이용한 방법보다 높은 분류 정확률과 높은 효율성을 가짐을 보여준다...

  • PDF

SVM을 이용한 음성 사상체질 분류 알고리즘 (Voice Classification Algorithm for Sasang Constitution Using Support Vector Machine)

  • 강재환;도준형;김종열
    • 사상체질의학회지
    • /
    • 제22권1호
    • /
    • pp.17-25
    • /
    • 2010
  • 1. Objectives: Voice diagnosis has been used to classify individuals into the Sasang constitution in SCM(Sasang Constitution Medicine) and to recognize his/her health condition in TKM(Traditional Korean Medicine). In this paper, we purposed a new speech classification algorithm for Sasang constitution. 2. Methods: This algorithm is based on the SVM(Support Vector Machine) technique, which is a classification method to classify two distinct groups by finding voluntary nonlinear boundary in vector space. It showed high performance in classification with a few numbers of trained data set. We designed for this algorithm using 3 SVM classifiers to classify into 4 groups, which are composed of 3 constitutional groups and additional indecision group. 3. Results: For the optimal performance, we found that 32.2% of the voice data were classified into three constitutional groups and 79.8% out of them were grouped correctly. 4. Conclusions: This new classification method including indecision group appears efficient compared to the standard classification algorithm which classifies only into 3 constitutional groups. We find that more thorough investigation on the voice features is required to improve the classification efficiency into Sasang constitution.

Study on gesture recognition based on IIDTW algorithm

  • Tian, Pei;Chen, Guozhen;Li, Nianfeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권12호
    • /
    • pp.6063-6079
    • /
    • 2019
  • When the length of sampling data sequence is too large, the method of gesture recognition based on traditional Dynamic Time Warping (DTW) algorithm will lead to too long calculation time, and the accuracy of recognition result is not high.Support vector machine (SVM) has some shortcomings in precision, Edit Distance on Real Sequences(EDR) algorithm does not guarantee that noise suppression will not suppress effective data.A new method based on Improved Interpolation Dynamic Time Warping (IIDTW)algorithm is proposed to improve the efficiency of gesture recognition and the accuracy of gesture recognition. The results show that the computational efficiency of IIDTW algorithm is more than twice that of SVM-DTW algorithm, the error acceptance rate is FAR reduced by 0.01%, and the error rejection rate FRR is reduced by 0.5%.Gesture recognition based on IIDTW algorithm can achieve better recognition status. If it is applied to unlock mobile phone, it is expected to become a new generation of unlock mode.

퍼지 원 클래스 서포트 벡터 머신 (Fuzzy One Class Support Vector Machine)

  • 김기주;최영식
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.159-170
    • /
    • 2005
  • OC-SVM(One Class Support Vector Machine)은 주어진 전체 데이터의 분포를 측정하는 대신에. 데이터 분포의 서포트(support)를 측정하는 기술로서 주어진 데이터를 가장 잘 설명할 수 있는 최적의 서포트 벡터(support vector)를 구하는 기술이다. OC-SVM은 데이터 분포의 표현에 아주 뛰어난 접근 방법이지만, 사람의 주관적인 중요도를 반영하는 것은 힘들다. 본 논문에서는 각 데이터에 퍼지 맴버쉽(fuzzy membership)을 적용하여 기존의 OC-SVM에 사용자의 주관적인 중요도를 표현할 수 있는 FOC-SVM(Fuzzy One class Support Vector Machine)을 유도 하였다. FOC-SVM은 데이터들을 동등하게 다루는 것이 아니라, 데이터 객체의 중요도에 따라 데이터를 다룬다. 즉, 덜 중요한 데이터의 특징 벡터는 OC-SVM의 처리과정에 덜 기여하도록 하기 위하여, 객체의 중요도에 따라 특징 벡터의 크기를 조정하였다. 이를 증명하기 위하여 가상의 데이터를 가지고 실험을 하였고, 실험 결과는 예측된 결과를 보여 주었다.

  • PDF

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

교차검증과 SVM을 이용한 도시침수 위험기준 추정 알고리즘 적용성 검토 (Applicability study on urban flooding risk criteria estimation algorithm using cross-validation and SVM)

  • 이한승;조재웅;강호선;황정근
    • 한국수자원학회논문집
    • /
    • 제52권12호
    • /
    • pp.963-973
    • /
    • 2019
  • 본 연구는 도시침수 위험기준이 산정되지 않은 지역의 예·경보 기준을 예측하기 위해 유역특성 자료와 피해이력 기반으로 산정된 한계강우량을 활용하여 도시침수 위험기준을 추정하는 모델을 검토하였다. 위험기준 추정모델은 머신러닝 알고리즘의 하나인 Support Vector Machine을 이용하여 설계하였으며, 학습자료는 지역별 한계강우량과 유역특성으로 구성하였다. 학습자료는 정규화 한 후 SVM 알고리즘에 적용하였으며, SVM에 적용시 Leave-One-Out과 K-fold 교차검증 알고리즘을 이용하여 절대평균오차와 표준편차를 계산한 후 모델의 성능을 평가하였다. Leave-One-Out의 경우 표준편차가 작은 모델이 최적모델로 선정되었으며, K-fold의 경우 fold의 개수가 적은 모델이 선정되었다. 선정된 모델의 지속시간별 평균 정확도는 80% 이상으로 나타나 침수 위험기준 추정을 위해 SVM을 활용가능 할 것으로 판단된다.