• 제목/요약/키워드: k-Nearest neighbor

검색결과 641건 처리시간 0.027초

Machine Learning-based Detection of DoS and DRDoS Attacks in IoT Networks

  • Yeo, Seung-Yeon;Jo, So-Young;Kim, Jiyeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.101-108
    • /
    • 2022
  • 본 논문은 다수의 사물인터넷 단말에서 보편적으로 수집할 수 있는 시스템 및 네트워크 메트릭을 학습하여 각 사물의 경험데이터를 기반으로 서비스거부 및 분산반사 서비스거부 공격을 탐지하는 침입 탐지 모델을 제안한다. 먼저, 공격 시나리오 유형별로 각 사물에서 37종의 시스템 및 네트워크 메트릭을 수집하고, 이를 6개 유형의 머신러닝 모델을 기반으로 학습하여 사물인터넷 공격 탐지 및 분류에 가장 효과적인 모델 및 메트릭을 분석한다. 본 논문의 실험을 통해, 랜덤 포레스트 모델이 96% 이상의 정확도로 가장 높은 공격 탐지 및 분류 성능을 보이는 것을 확인하였고, 그 다음으로는 K-최근접 이웃 모델과 결정트리 모델의 성능이 우수한 것을 확인하였다. 37종의 메트릭 중에는 모든 공격 시나리오에서 공격의 특징을 가장 잘 반영하는 CPU, 메모리, 네트워크 메트릭 5종을 발견하였으며 큰 사이즈의 패킷보다는 빠른 전송속도를 갖는 패킷이 사물인터넷 네트워크에서 서비스거부 및 분산반사 서비스거부 공격 특징을 더욱 명확히 나타내는 것을 실험을 통해 확인하였다.

Indoor Path Recognition Based on Wi-Fi Fingerprints

  • Donggyu Lee;Jaehyun Yoo
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제12권2호
    • /
    • pp.91-100
    • /
    • 2023
  • The existing indoor localization method using Wi-Fi fingerprinting has a high collection cost and relatively low accuracy, thus requiring integrated correction of convergence with other technologies. This paper proposes a new method that significantly reduces collection costs compared to existing methods using Wi-Fi fingerprinting. Furthermore, it does not require labeling of data at collection and can estimate pedestrian travel paths even in large indoor spaces. The proposed pedestrian movement path estimation process is as follows. Data collection is accomplished by setting up a feature area near an indoor space intersection, moving through the set feature areas, and then collecting data without labels. The collected data are processed using Kernel Linear Discriminant Analysis (KLDA) and the valley point of the Euclidean distance value between two data is obtained within the feature space of the data. We build learning data by labeling data corresponding to valley points and some nearby data by feature area numbers, and labeling data between valley points and other valley points as path data between each corresponding feature area. Finally, for testing, data are collected randomly through indoor space, KLDA is applied as previous data to build test data, the K-Nearest Neighbor (K-NN) algorithm is applied, and the path of movement of test data is estimated by applying a correction algorithm to estimate only routes that can be reached from the most recently estimated location. The estimation results verified the accuracy by comparing the true paths in indoor space with those estimated by the proposed method and achieved approximately 90.8% and 81.4% accuracy in two experimental spaces, respectively.

Tei Index를 이용한 경도의 좌심실 이완 기능 장애 분류 모델 평가 (Evaluation of Classification Models of Mild Left Ventricular Diastolic Dysfunction by Tei Index)

  • 김수민;예수영
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.761-766
    • /
    • 2023
  • 본 논문에는 경도의 좌심실 이완 기능 장애 유무를 분류하기 위해 TI을 측정하였다. 분류에 사용된 기계 학습 모델은 SVM과 KNN을 이용하였다. 총 306개의 데이터 중에서 206개는 트레이닝 데이터, 100개는 테스트 데이터로 사용하였다. 그 결과, SVM이 KNN에 비하여 비교적 높은 정확도를 보여 좌심실 이완 기능 장애 유무 진단에 더 유용함을 확인했다. 향후 연구에서 TI 뿐만 아니라 심장의 기능을 평가하는 다양한 지표들을 추가하고 더 많은 데이터를 확보한다면 분류 성능을 더 높일 수 있을 것으로 기대된다. 나아가, 타 질환의 예측 및 분류, 증가하는 검사 건수에 비해 부족한 의료 인력 문제를 해결하는데 기초 자료로 활용될 것으로 기대된다.

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

철원지역 두루미 취식지의 핵심지역 설정을 위한 MCP, 커널밀도측정법(KDE)과 국지근린지점외곽연결(LoCoH) 분석 (MCP, Kernel Density Estimation and LoCoH Analysis for the Core Area Zoning of the Red-crowned Crane's Feeding Habitat in Cheorwon, Korea)

  • 유승화;이기섭;박종화
    • 한국환경생태학회지
    • /
    • 제27권1호
    • /
    • pp.11-21
    • /
    • 2013
  • 본 연구는 두루미(Grus japonensis)의 이용분포 내에서 행동권 분석의 기법인 MCP(최소볼록다각형법), KDE(커널밀도측정법), LoCoH(국지근린지점외곽연결)를 이용하여 이용면적과 핵심서식지를 선정하였다. 또한, 각 기법의 차이와 의미를 고찰하도록 하였다. 두루미의 분포자료는 철원지역 2012년 2월 17일 조사자료를 사용하였다. MCP에 의한 두루미류 서식영역은 $140km^2$이었다. KDE 분석에서 띠폭에 해당하는 h값을 1000m, CVh, LSCVh로 달리하여 KDE 등치선을 생성하였을 때, 핵심지역에 해당하는(Kernel 50% 이상) 면적은 $33.3km^2$($KDE_{1000m}$), $25.7km^2$($KDE_{CVh}$), $19.7km^2$($KDE_{LSCVh}$)이었다. 결과적으로 띠폭에 대한 기본값(1000m)-CVh(554.6m)-LSCVh(329.9m) 순으로 변수를 작게 입력할 경우 핵심면적 개수는 늘어나고, 면적은 감소하였으며, 형태의 복잡성은 증가하였다. 두루미류의 KDE 분석에 의한 핵심지역의 선정에서 적합한 띠폭변수는 CVh 값인 것으로 판단되었다. LoCoH분석에서는 서식범위와 핵심지역(50% 등치선 이상의 지역)의 면적이 k값의 증가에 따라 증가하는 모습을 보였으며, 점차 큰 핵심지역으로 합쳐지는 모습을 나타내었다. 핵심지역을 도출하기에 적합한 k 값은 24로 나타났으며, 전체 개체군의 핵심지역은 $18.2km^2$로 전체 서식면적의 16.5%를 차지하였다. 최종적으로, LoCoH 분석은 두 개의 큰 핵심서식지를 제시하였으며, 이것은 KDE에 의한 핵심지역에 비하여 작은 수의 핵심지역을 제시한 것이었다. 국내의 게재논문 및 발표자료를 포함한 연구에서 KDE는 대부분 기본설정으로 분석되었으며, 띠폭에 의한 변수를 고려한 것은 매우 드물었다. 따라서 띠폭변수를 명확히 제시하는 것이 요구되었다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

실시간 데이터 분석의 성능개선을 위한 적응형 학습 모델 연구 (A Study on Adaptive Learning Model for Performance Improvement of Stream Analytics)

  • 구진희
    • 융합정보논문지
    • /
    • 제8권1호
    • /
    • pp.201-206
    • /
    • 2018
  • 최근 인공지능을 구현하기 위한 기술들이 보편화되면서 특히, 기계 학습이 폭넓게 사용되고 있다. 기계 학습은 대량의 데이터를 수집하고 일괄적으로 처리하며 최종 조치를 취할 수 있는 통찰력을 제공하나, 작업의 효과가 즉시 학습 과정에 통합되지는 않는다. 본 연구에서는 비즈니스의 큰 이슈로서 실시간 데이터 분석의 성능을 개선하기 위한 적응형 학습 모델을 제안하였다. 적응형 학습은 데이터세트의 복잡성에 적응하여 앙상블을 생성하고 알고리즘은 샘플링 할 최적의 데이터 포인트를 결정하는데 필요한 데이터를 사용한다. 6개의 표준 데이터세트를 대상으로 한 실험에서 적응형 학습 모델은 학습 시간과 정확도에서 분류를 위한 단순 기계 학습 모델보다 성능이 우수하였다. 특히 서포트 벡터 머신은 모든 앙상블의 후단에서 우수한 성능을 보였다. 적응형 학습 모델은 시간이 지남에 따라 다양한 매개변수들의 변화에 대한 추론을 적응적으로 업데이트가 필요한 문제에 폭넓게 적용될 수 있을 것으로 기대한다.

사각형 특징 기반 분류기와 클래스 매칭을 이용한 실시간 얼굴 검출 및 인식 (Real Time Face Detection and Recognition using Rectangular Feature based Classifier and Class Matching Algorithm)

  • 김종민;강명아
    • 한국콘텐츠학회논문지
    • /
    • 제10권1호
    • /
    • pp.19-26
    • /
    • 2010
  • 본 논문은 사각형 특징 기반 분류기를 제안하여 실시간으로 얼굴 영역을 검출하며, 계산의 효율성과 검출 성능을 동시에 만족시키는 강인한 검출 알고리즘을 구현하고자 한다. 제안한 알고리즘은 특징 생성, 분류기 학습, 실시간 얼굴 영역 검출의 세 단계로 구성된다. 특징 생성은 제안된 5개의 사각형 특징으로 특징 집합을 구성하며, SAT(Summed-Area Tables)를 이용하여 특징 값을 효율적으로 계산한다. 분류기 학습은 AdaBoost 알고리즘을 이용하여, 분류기를 계층적으로 생성한다. 또한 중요한 얼굴 패턴은 다음 레벨에 반복적으로 적용함으로써 우수한 검출 성능을 가진다. 실시간 얼굴 영역 검출은 생성된 사각형 특징 기반 분류기를 통해, 빠르고 효율적으로 얼굴 영역을 찾아낸다. 또한 얼굴 영역을 검출한 영역을 인식의 입력 영상으로 사용하여 PCA와 KNN 알고리즘을 이용하여 기존의 매칭 방법인 Point to point 방법이 아닌 Class to Class 방식을 이용하여 인식률을 향상시켰다.

코페이셜 적층 구조를 가진 펜타센 유도체 단결정기반 유기트랜지스터의 계면 전하이동 이방성에 관한 연구 (Interfacial Charge Transport Anisotropy of Organic Field-Effect Transistors Based on Pentacene Derivative Single Crystals with Cofacial Molecular Stack)

  • 최현호
    • 접착 및 계면
    • /
    • 제20권4호
    • /
    • pp.155-161
    • /
    • 2019
  • 공액분자 나노구조체 계면에서의 전하이동 이방성을 이해하는 것은 유기전계효과트랜지스터(OFET)에서 구조-물성 상관관계를 규명하는데 중요하다. 본 연구에서는 대표적인 코페이셜 적층구조를 가진 6,13-bis(triisopropylsilylethynyl) pentacene (TIPS-pentacene) 유기반도체 단결정과 산화물 계면에서 전하이동도 이방성을 연구하였다. 용매치환공정을 이용해 유기단결정을 산화실리콘 절연체 표면에 성장시키고 유기단결정/산화물 계면에서 전하이동을 유도할 수 있도록 OFET 소자를 완성하였다. TIPS-pentacene OFET에서 최고/최저 전하이동도 이방성은 5.2로 관찰되었다. TIPS-pentacene의 전하이동을 담당하는 공액부의 최인접부와의 상호작용을 분석한 결과, HOMO 준위 커플링과 전하의 호핑 궤도가 전하이동도 이방성에 기여하는 것으로 밝혀졌다. HOMO 준위 커플링에 기반한 전하이동도 이방성의 정량적 예측은 실험결과와 유사하게 나타났다.

수중 애드 혹 네트워크에서의 시스템 모델링 및 용량 스케일링 법칙에 대하여 (On the System Modeling and Capacity Scaling Law in Underwater Ad Hoc Networks)

  • 신원용;김아정
    • 한국통신학회논문지
    • /
    • 제36권4B호
    • /
    • pp.422-428
    • /
    • 2011
  • 본 논문에서는 n개의 균등하게 위치한 센서 노드를 가지는 수중 애드 혹 음향 네트워크에서의 시스템 및 채널 모델링, 그리고 이를 바탕으로 유도한 용량 스케일링 법칙을 소개한다. 특히 협 대역 모델에서 캐리어 주파수가 n의 함수로 스케일 되는 것을 허용하는 상황을 가정한다. 가정하는 네트워크에서, 전송 거리 뿐 아니라 주파수 스케일링에도 의존하는 감쇠 변수의 특성을 분석한다. 이를 바탕으로 단일 노드 밀도를 가지는 확장 네트워크 하에서 용량 스케일링에 대한 cut-set 기반 상향 경계선을 유도한다. 상향 경계선은 감쇠 변수에 역으로 비례한다는 결과물로부터, 전 영역에 대해 전력 제한된 네트워크가 생성됨을 보인다. 뿐만 아니라 간단한 최 근거리 다중 홉 전송에 기반 하여 용량 달성 가능한 기술을 소개한다. 확장 네트워크에서 다중 홉 기술은 감쇠 변수의 함수로 표현되는 모든 동작 영역에서 order 측면 최적임을 보인다.