• 제목/요약/키워드: k-NN classification

검색결과 188건 처리시간 0.023초

거리 기반 유사도 측정을 통한 유방 초음파 영상의 내용 기반 검색 컴퓨터 보조 진단 시스템에 관한 연구 (A Study of CBIR(Content-based Image Retrieval) Computer-aided Diagnosis System of Breast Ultrasound Images using Similarity Measures of Distance)

  • 김민정;조현종
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1272-1277
    • /
    • 2017
  • To assist radiologists for the characterization of breast masses, Computer-aided Diagnosis(CADx) system has been studied. The CADx system can improve the diagnostic accuracy of radiologists by providing objective information about breast masses. Morphological and texture features were extracted from the breast ultrasound images. Based on extracted features, the CADx system retrieves masses that are similar to a query mass from a reference library using a k-nearest neighbor (k-NN) approach. Eight similarity measures of distance, Euclidean, Chebyshev(Minkowski family), Canberra, Lorentzian($F_2$ family), Wave Hedges, Motyka(Intersection family), and Cosine, Dice(Inner Product family) are evaluated by ROC(Receiver Operating Characteristic) analysis. The Inner Product family measure used with the k-NN classifier provided slightly higher performance for classification of malignant and benign masses than those with the Minkowski, $F_2$, and Intersection family measures.

I-벡터 기반 오픈세트 언어 인식을 위한 다중 판별 DNN (Multiple Discriminative DNNs for I-Vector Based Open-Set Language Recognition)

  • 강우현;조원익;강태균;김남수
    • 한국통신학회논문지
    • /
    • 제41권8호
    • /
    • pp.958-964
    • /
    • 2016
  • 본 논문에서는 여러 개의 이원 support vector machine (binary SVM)을 사용하여 세 개 이상의 클래스를 분류하는 multi-class SVM과 유사하게 다중의 판별 deep neural network (DNN) 모델을 사용하는 i-벡터 기반의 언어 인식 시스템을 제안한다. 제안하는 시스템은 NIST 2015 i-vector Machine Learning Challenge 데이터베이스에 포함된 i-벡터들을 이용하여 학습 및 테스트 되었으며, 오픈 세트에서 기존의 cosine distance, multi-class SVM 및 단일 neural network (NN) 기반의 언어 인식 시스템에 비하여 높은 성능을 보임이 확인되었다.

Native API 의 효과적인 전처리 방법을 이용한 악성 코드 탐지 방법에 관한 연구 (Malicious Code Detection using the Effective Preprocessing Method Based on Native API)

  • 배성재;조재익;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권4호
    • /
    • pp.785-796
    • /
    • 2012
  • 본 논문에서는 악성코드의 시스템 콜 빈도수를 특징값으로 행위 기반 탐지(behavior-based detection)를 할 때, 시스템 콜의 속성 개수보다 학습데이터 개수가 적더라도 효과적으로 악성 코드를 탐지하는 기법을 제안한다. 이 연구에서는, 프로그램 코드가 동작할 때, 발생시키는 윈도우 커널 데이터인 Native API를 수집하여 빈도수로 정규화한 것을 기본적인 속성 값으로 사용하였다. 또한 악성코드와 정상 코드를 효과적으로 분류할 수 있으면서, 악성코드를 분류하기 위한 기본적인 속성의 개수보다 학습데이터 개수가 적어도 적용 가능한 GLDA(Generalized Linear Discriminant Analysis)를 사용하여, 새로운 속성 값들로 전환하였다. 분류 기법으로는 베이지언 분류법의 일종인 kNN(k-Nearest Neighbor) 분류법을 이용하여 악성 코드를 탐지하였다. 제안된 탐지 기법의 성능을 검증하기 위하여 수집된 Native API 로 기존의 연구 방법과 비교 검증하였다. 본 논문에 제안된 기법이 탐지율(detection rate) 100%인 Threshold 값에서, 다른 탐지 기법보다 낮은 오탐율(false positive rate)을 나타내었다.

머신러닝 모델을 이용한 석산 개발 발파진동 예측 (Prediction of Blast Vibration in Quarry Using Machine Learning Models)

  • 정다희;최요순
    • 터널과지하공간
    • /
    • 제31권6호
    • /
    • pp.508-519
    • /
    • 2021
  • 본 연구에서는 발파 시 사람과 주변 환경에 영향을 끼치는 발파진동(peak particle velocity, PPV)을 예측하는 모델을 개발하였다. PPV를 예측하기 위해 kNN(k-nearest neighbors), CART(classification and regression tree), SVR(support vector regression), PSO(particle swarm optimization)-SVR 알고리즘을 이용한 4가지 머신러닝 모델을 개발하고 상호 비교하였다. 머신러닝 모델을 훈련하기 위해 경상남도 창원시에 있는 욕망산을 연구지역으로 선정하고 1048개의 발파 데이터를 획득하였다. 발파 데이터는 천공장, 저항선, 공간격, 최대지발장약량, 비장약량, 총공수, 에멀전비율, 이격거리, PPV로 구성되었다. 훈련된 모델들의 성능을 평가하기 위한 지표 값으로 MAE(mean absolute error), MSE(mean squared error), RMSE(root mean squared error)를 사용하였다. 평가결과 PSO-SVR 모델이 MAE, MSE, RMSE가 각각 0.0348, 0.0021, 0.0458으로 가장 우수한 예측 성능을 나타냈다. 마지막으로 개발된 머신러닝 모델을 이용하여 주변 환경에 영향을 끼치는 정도를 예측하는 방법을 제시하였다.

Speech Emotion Recognition with SVM, KNN and DSVM

  • Hadhami Aouani ;Yassine Ben Ayed
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.40-48
    • /
    • 2023
  • Speech Emotions recognition has become the active research theme in speech processing and in applications based on human-machine interaction. In this work, our system is a two-stage approach, namely feature extraction and classification engine. Firstly, two sets of feature are investigated which are: the first one is extracting only 13 Mel-frequency Cepstral Coefficient (MFCC) from emotional speech samples and the second one is applying features fusions between the three features: Zero Crossing Rate (ZCR), Teager Energy Operator (TEO), and Harmonic to Noise Rate (HNR) and MFCC features. Secondly, we use two types of classification techniques which are: the Support Vector Machines (SVM) and the k-Nearest Neighbor (k-NN) to show the performance between them. Besides that, we investigate the importance of the recent advances in machine learning including the deep kernel learning. A large set of experiments are conducted on Surrey Audio-Visual Expressed Emotion (SAVEE) dataset for seven emotions. The results of our experiments showed given good accuracy compared with the previous studies.

버그 리포트를 이용한 버그 정정 시간 추정 (Estimating the Time to Fix Bugs Using Bug Reports)

  • 권기문;진광희;이병정
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.755-763
    • /
    • 2015
  • 버그 정정 활동은 소프트웨어 개발과 유지보수 작업에서 많은 비중을 차지하므로, 버그 정정활동에 소요되는 시간을 미리 추정할 수 있다면 소프트웨어 프로젝트 작업 계획에 큰 도움이 될 것이다. 따라서 본 연구에서는 버그 리포트를 이용하여 버그 정정 시간을 추정하는 방법을 제안한다. 본 방법에서는 먼저, 버그 리포트가 제공하는 버그 메타 필드에 k-NN 방법을 적용하여 과거 버그 리포트들을 분류한다. 다음으로, 버그 리포트의 텍스트 정보를 활용하여 과거 버그와 새로운 버그 사이의 유사도를 계산하고, 유사한 버그의 정정 시간을 활용하여 새로운 버그의 정정 시간을 추정한다. 마지막으로, 오픈 소스 프로젝트에 본 방법을 적용한 실험을 통하여 효과적으로 버그 정정 시간을 추정한다는 것을 보인다.

Intrusion Detection: Supervised Machine Learning

  • Fares, Ahmed H.;Sharawy, Mohamed I.;Zayed, Hala H.
    • Journal of Computing Science and Engineering
    • /
    • 제5권4호
    • /
    • pp.305-313
    • /
    • 2011
  • Due to the expansion of high-speed Internet access, the need for secure and reliable networks has become more critical. The sophistication of network attacks, as well as their severity, has also increased recently. As such, more and more organizations are becoming vulnerable to attack. The aim of this research is to classify network attacks using neural networks (NN), which leads to a higher detection rate and a lower false alarm rate in a shorter time. This paper focuses on two classification types: a single class (normal, or attack), and a multi class (normal, DoS, PRB, R2L, U2R), where the category of attack is also detected by the NN. Extensive analysis is conducted in order to assess the translation of symbolic data, partitioning of the training data and the complexity of the architecture. This paper investigates two engines; the first engine is the back-propagation neural network intrusion detection system (BPNNIDS) and the second engine is the radial basis function neural network intrusion detection system (BPNNIDS). The two engines proposed in this paper are tested against traditional and other machine learning algorithms using a common dataset: the DARPA 98 KDD99 benchmark dataset from International Knowledge Discovery and Data Mining Tools. BPNNIDS shows a superior response compared to the other techniques reported in literature especially in terms of response time, detection rate and false positive rate.

전류 및 자속센서를 이용한 유도전동기 예방진단 알고리즘 개발에 관한 연구 (Study on the Development of Diagnosis Algorithm for Induction Motor Using Current and Magnetic Flux Sensors)

  • 한상보
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1157-1165
    • /
    • 2019
  • 본 논문은 전류신호와 자속신호를 이용한 유도전동기 예방진단시스템을 개발하기 위한 머신러닝 알고리즘의 개발 및 적용 결과에 대하여 논하였다. 유도전동기의 결함 종류를 판별하기 위한 최적 특징추출단계를 통하여 총 29개의 특징을 도출하였다. 특히, 전류신호의 제7차 고조파 중심으로부터 사이드밴드까지의 주파수의 차이가 부하율 증가에 따라서 증가되는 경향을 이용하여 임의의 부하율 상태를 반영할 수 있는 알고리즘을 도출하였으며, KPCA 특징 축소 기법, k-NN 판단 알고리즘에 의한 분류 정확도를 조사한 결과, 약 84.6%의 분류 정확도를 보였다.

반복적 고정분할 평균기법을 이용한 메모리기반 학습기법 (A Memory-based Learning using Repetitive Fixed Partitioning Averaging)

  • 이형일
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1516-1522
    • /
    • 2007
  • FPA(Fixed Partition Averaging) 기법은 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안되었던 메모리 기반 추론 기법으로 대상 패턴 공간을 분할 한 후 대표 패턴을 추출하여 분류 기준 패턴으로 사용한다. 이 기법은 메모리 사용 효율과 분류 성능 면에서 우수한 결과를 보인다. 그러나 여러 클래스가 혼합된 분할패턴공간의 경우에 원래의 패턴들을 그대로 저장하여 메모리와 분류성능에 부담으로 작용하는 문제점을 가지고 있다. 본 논문에서는 여러 클래스가 혼합된 분할공간에서 패턴비율을 고려하여 고정분할을 반복적으로 실행하여 초월평면을 생성하고 분류하는 반복적 고정분할평균기법을 제안한다. 본 논문에서 제안한 기법은 기존의 k-NN 기법과 비교하여 현저하게 줄어든 대표패턴을 이용하여 유사한 분류 성능을 보여주며, NGE 이론을 구현한 EACH 시스템과 FPA 기법 등과 비교하여 탁월한 분류 성능을 보여준다.

  • PDF

PCA와 비선형분류기에 기반을 둔 유도전동기의 고장진단 (Fault Diagnosis of Induction Motor based on PCA and Nonlinear Classifier)

  • 박성무;이대종;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.119-123
    • /
    • 2006
  • 본 논문에서는, 주성분분석기법과 다층신경망에 기반을 유도전동기의 고장진단기법을 제안하고자 한다. 입력의 수가 많을 경우 다층신경망만을 이용하여 분류하는 데는 한계가 있다. 이러한 문제점을 해결하기 위해 주성분분석기법에 의해 입력특징의 수를 축약한 후, 비선형분류기인 다층신경망을 적용하였다. 또한, 주성 분석기법에 추출된 특징벡터가 고장상태별로 비선형성 특성을 보일 경우 기존의 거리척도 기반에 의한 분류방법으로 정확한 진단을 하는데 어려움이 있다. 이를 위해 비선형 분류기인 MLP를 적용함으로써 효과적인 고장진단을 하자 한다. 세안된 기법은 다양한 실험을 통해 기존의 선형분류기에 비해 우수한 겨과를 보임을 나타내고자 한다.