• Title/Summary/Keyword: Knn

Search Result 261, Processing Time 0.023 seconds

Comparative Study to Measure the Performance of Commonly Used Machine Learning Algorithms in Diagnosis of Alzheimer's Disease

  • kumar, Neeraj;manhas, Jatinder;sharma, Vinod
    • Journal of Multimedia Information System
    • /
    • 제6권2호
    • /
    • pp.75-80
    • /
    • 2019
  • In machine learning, the performance of the system depends upon the nature of input data. The efficiency of the system improves when the behavior of the input data changes from un-normalized to normalized form. This paper experimentally demonstrated the performance of KNN, SVM, LDA and NB on Alzheimer's dataset. The dataset undertaken for the study consisted of 3 classes, i.e. Demented, Converted and Non-Demented. Analysis shows that LDA and NB gave an accuracy of 89.83% and 88.19% respectively in both the cases whereas the accuracy of KNN and SVM improved from 46.87% to 82.80% and 53.40% to 88.75% respectively when input data changed from un-normalized to normalized state. From the above results it was observed that KNN and SVM show significant improvement in classification accuracy on normalized data as compared to un-normalized data, whereas LDA and NB reflect no such change in their performance.

디지털 데이터에서 데이터 전처리를 위한 자동화된 결측 구간 대치 방법에 관한 연구 (A Study on Automatic Missing Value Imputation Replacement Method for Data Processing in Digital Data)

  • 김종찬;심춘보;정세훈
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.245-254
    • /
    • 2021
  • We proposed the research on an analysis and prediction model that allows the identification of outliers or abnormality in the data followed by effective and rapid imputation of missing values was conducted. This model is expected to analyze efficiently the problems in the data based on the calibrated raw data. As a result, a system that can adequately utilize the data was constructed by using the introduced KNN + MLE algorithm. With this algorithm, the problems in some of the existing KNN-based missing data imputation algorithms such as ignoring the missing values in some data sections or discarding normal observations were effectively addressed. A comparative evaluation was performed between the existing imputation approaches such as K-means, KNN, MEI, and MI as well as the data missing mechanisms including MCAR, MAR, and NI to check the effectiveness/efficiency of the proposed algorithm, and its superiority in all aspects was confirmed.

Development of a Personalized Music Recommendation System Using MBTI Personality Types and KNN Algorithm

  • Chun-Ok Jang
    • International Journal of Advanced Culture Technology
    • /
    • 제12권3호
    • /
    • pp.427-433
    • /
    • 2024
  • This study aims to develop a personalized music digital therapeutic based on MBTI personality types and apply it to depression treatment. In the data collection stage, participants' MBTI personality types and music preferences were surveyed to build a database, which was then preprocessed as input data for the KNN model. The KNN model calculates the distance between personality types using Euclidean distance and recommends music suitable for the user's MBTI type based on the nearest K neighbors' data. The developed system was tested with new participants, and the system and algorithm were improved based on user feedback. In the final validation stage, the system's effectiveness in alleviating depression was evaluated. The results showed that the MBTI personality type-based music recommendation system provides a personalized music therapy experience, positively impacting emotional stability and stress reduction. This study suggests the potential of nonpharmacological treatments and demonstrates that a personalized treatment experience can offer more effective and safer methods for treating depression.

센서 네트워크에서 효율적인 KNN 질의처리 방법 (An Efficient KNN Query Processing Method in Sensor Networks)

  • 손인근;현동준;정연돈;이은규;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.429-440
    • /
    • 2005
  • 전기전자 기술의 발달로 센서의 기능이 더욱 강력해지면서, 센서 네트워크의 활용 분야는 더욱 다양해지고 있다. 센서 네트워크 어플리케이션을 사용하는 주 목적은 관심 지역(예, 공장 물품 창고, 재난지역, 야생 서식지 등)에서 발생하는 현상들을 관찰하고, 유용한 정보를 얻기 위한 것이다. k-근접 노드(KNN: K Nearest Neighbor) 탐색 질의는 특정 위치에서 지리적으로 근접한 k개의 이웃 객체를 찾기 위한 질의로서, 센서 네트워크 환경에서도 중요한 어플리케이션 중 하나이다. 그러나 이전 방법들은 센서 네트워크 환경에서 사용하기 부적합하거나 에너지 효율성 문제를 가지고 있었다. 본 논문에서는 센서 네트워크 환경의 특성을 고려하면서, k개의 근접 노드를 에너지 효율적으로 탐색할 수 있는 방법을 제안한다. 제안하는 방법은 k개의 근접 노드를 찾을 때까지 탐색 영역을 점진적으로 확장하고, 영역 내 센서들을 선별적으로 방문하여 원하는 위치 정보를 얻어내는 것이다. 이를 통해 원하는 k개의 근접 노드를 찾아내면서도 에너지 소모를 줄일 수 있다 본 논문에서는 제안하는 방법이 기존의 방법보다 효율적이라는 것을 다양한 조건의 실험을 통해 설명한다.

WiFi 핑거프린트 위치추정 방식에서 W-KNN의 가중치에 관한 연구 (A Study on the Weight of W-KNN for WiFi Fingerprint Positioning)

  • 오종택
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.105-111
    • /
    • 2017
  • 본 논문에서는 최근 들어 활발하게 연구되고 있는 WiFi fingerprint를 이용한 실내 위치 인식 기술에서, Weighted K-Nearest Neighbour 방식을 적용할 때 사용되는 가중치에 대한 분석 결과를 보이고 있다. W-KNN 방식은 그 간결함에도 불구하고 WiFi fingerprint를 이용하는 다른 복잡한 방식들과 유사한 성능을 보이고 있어, 실제적으로 실내 위치 인식 기술로 많이 사용되고 있다. 또한 사전 데이터 처리 방식이나 이 방식에서 사용되는 가중치에 따라 성능 차이를 보이고 있으므로, 이에 대한 연구 및 분석은 중요한 의미가 있다. 여기서는 실제로 측정된 WiFi fingerprint 데이터를 기반으로, 데이터 사전처리 경우와 가중치에 측정값의 분산 및 거리를 적용하는 경우, 지점 위치 평균 개수 K를 사용하는 경우 등에 대해 위치 추정 오차를 분석하고 성능을 비교한다. 이 연구 결과는 실제로 실내 위치 인식 시스템을 구축할 때에 실용적으로 활용될 수 있다.

암시적 피드백 데이터의 행렬 분해 기반 누락 데이터 모델링 (Missing Data Modeling based on Matrix Factorization of Implicit Feedback Dataset)

  • 기가기;정영지
    • 한국정보통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.495-507
    • /
    • 2019
  • 데이터 희소성은 추천 시스템의 주요 과제 중 하나이다. 추천 시스템에서는, 일부분만 관찰된 데이터이고 다른 부분은 데이터가 누락된 대용량 데이터를 포함하고 있다. 대부분의 연구에서는, 데이터 세트에서 무작위로 데이터가 누락되었다고 가정하고, 관찰된 데이터만을 사용하여 추천 모델을 학습함으로써 사용자에게 항목을 추천하고 있다. 그러나, 실제로는 누락된 데이터는 무작위로 손실되었다고 볼 수 없다. 본 연구에서는, 누락 된 데이터를 사용자적 관심의 부정적인 예라고 간주하였다. 또한, 3가지 샘플 접근 방식을 SVD++ 알고리즘과 결합하여 SVD++_W, SVD++_R 그리고 SVD++_KNN 알고리즘을 제안하였다. 실험결과를 통하여, 제안한 3가지 샘플 접근 방식이 기존의 기본적인 알고리즘 보다 Top-N 추천에서 정확성과 회수율을 효과적으로 향상시킬 수 있다는 것을 보였다. 특히, SVD++_KNN 가 가장 우수한 성능을 보였는데, 이는 KNN 샘플 접근 방식이 사용자적 관심의 부정적인 예를 추출하는데 가장 효율적인 방법이라는 것을 보여주었다.

DGR-Tree : u-LBS에서 POI의 검색을 위한 효율적인 인덱스 구조 (DGR-Tree : An Efficient Index Structure for POI Search in Ubiquitous Location Based Services)

  • 이득우;강홍구;이기영;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.55-62
    • /
    • 2009
  • 유비쿼터스 컴퓨팅 환경에서의 LBS, 즉 u-LBS는 실세계의 수많은 객체가 위치정보와 밀접히 연관된 대용량 데이타를 대상으로 한다. 특히, 사용자의 위치 정보와 관련하여 검색하려고 하는 객체인 POI에 대한 빠른 검색이 중요하다. 따라서 u-LBS에서 POI의 효율적인 검색을 위한 인덱스 구조에 대한 연구가 필요하다. 본 논문에서는 u-LBS에서 정적 POI를 대상으로 이를 효율적으로 검색하기 위한 DGR-Tree를 제시한다. DGR-Tree는 변형된 R-Tree를 기본 인덱스로 하고 동적 레벨 그리드를 보조 인덱스로 사용하는 구조이다. DGR-Tree는 점 데이타에 적합하도록 최적화하고 있으며 리프 노드 간 겹침 문제를 해결한다. DGR-Tree에서 동적 레벨 그리드는 점 데이타의 밀집도에 따라 동적으로 구성되며, 각 셀은 DGR-Tree의 리프 노드와 연계를 위한 포인터를 저장하여 리프 노드를 직접 접근하도록 함으로써 인덱스 접근 성능을 향상시킨다. 또한, 본 논문에서는 DGR-Tree를 위한 KNN 검색 알고리즘을 제시한다. 이 알고리즘에서는 KNN 검색 시 후보 셀에 빠르게 접근하기 위하여 동적 레벨 그 리드를 활용하며, 후보를 노드별로 구분하여 저장함으로써 후보 리스트 내에서의 정렬 비용을 감소시킨다. 마지막으로 실험을 통해 DGR-Tree의 우수성을 입증하였다.

  • PDF

음성 신호를 사용한 GMM기반의 감정 인식 (GMM-based Emotion Recognition Using Speech Signal)

  • 서정태;김원구;강면구
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.235-241
    • /
    • 2004
  • 본 논문은 화자 및 문장 독립적 감정 인식을 위한 특징 파라메터와 패턴인식 알고리즘에 관하여 연구하였다. 본 논문에서는 기존 감정 인식 방법과의 비교를 위하여 KNN을 이용한 알고리즘을 사용하였고, 화자 및 문장 독립적 감정 인식을 위하여 VQ와 GMM을 이용한 알고리즘을 사용하였다. 그리고 특징으로 사용한 음성 파라메터로 피치, 에너지, MFCC, 그리고 그것들의 1, 2차 미분을 사용하였다. 실험을 통해 피치와 에너지 파라메터를 사용하였을 때보다 MFCC와 그 미분들을 특징 파라메터로 사용하였을 때 더 좋은 감정 인식 성능을 보였으며, KNN과 VQ보다 GMM을 기반으로 한 인식 알고리즘이 화자 및 문장 독립적 감정 인식 시스템에서 보다 적합하였다.

도심지역 LTE 측위를 위한 Fingerprinting 기법의 W-KNN Correlation 기술에 따른 성능 분석 (Performance Analysis of Fingerprinting Method for LTE Positioning according to W-KNN Correlation Techniques in Urban Area)

  • 권재욱;조성윤
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1059-1068
    • /
    • 2021
  • 도심지역에서 GPS(Global Positioning System)/GNSS(Global Navigation Satellite System) 신호는 건물과 같은 구조물에 의해 차단되거나 왜곡되어 위치추정에 한계가 존재한다. 이 문제를 보완하기 위해 본 논문에서는 LTE 신호의 RSRP(Reference Signal Received Power) 정보를 사용한 Fingerprinting 기법으로 측위를 수행하고자 한다. Fingerprinting의 측위 단계에서 많이 사용되는 W-KNN(Weighted - K Nearest Neighbors) 기법은 Correlation 시 사용되는 유사도 거리 계산 방법과 가중치 적용 방법 등에 따라 다른 측위 성능의 결과를 생성한다. 본 논문에서는 Correlation 시 사용되는 기법들에 따른 Fingerprinting 측위 성능을 실 데이터 기반으로 비교 분석하고자 한다.

안드로이드 모바일 악성 앱 탐지를 위한 확률적 K-인접 이웃 분류기 (Probabilistic K-nearest neighbor classifier for detection of malware in android mobile)

  • 강승준;윤지원
    • 정보보호학회논문지
    • /
    • 제25권4호
    • /
    • pp.817-827
    • /
    • 2015
  • 현대인은 스마트폰과 매우 밀접한 관계를 가지고 있으며 이로 인한 수 많은 보안 위협에 노출되어 있다. 실제로 해커들은 스마트폰에 악성 프로그램을 은밀하게 설치하여 장치 이용 제한 및 개인정보 유출 등의 보안 위협을 야기하고 있다. 그리고 그러한 악성 프로그램은 일반적인 프로그램과 다르게 필요 이상의 권한을 요구한다. 본 논문에서는 이 같은 문제를 바탕으로 사용되는 안드로이드 기반 앱들이 요구하는 권한 데이터를 이용하여 주성분 분석(Principle Component Analysis:PCA)과 확률적 K-인접 이웃(Probabilistic K-Nearest Neighbor:PKNN) 방식을 사용하여 효과적으로 악성 프로그램과 일반 프로그램을 분류하고자 한다. 이뿐 아니라 이를 k-묶음 교차 검증(K-fold Croos Validation)을 통해 PKNN의 정확도를 측정하였다. 그리고 일반적으로 사용되는 K-인접 이웃(K-Nearest Neighbor:KNN) 방식과 비교하여, KNN이 분류하기 힘든 부분을 확률적으로 해결하는 PKNN방법을 제안한다. 최종적으로 제안한 방식을 최적화하는 ${\kappa}$${\beta}$ 파라미터를 구하는 것을 목표로 한다. 본 논문에서 사용된 악성 앱 샘플은 Contagio에 요청하여 이용하였다.