• 제목/요약/키워드: k nearest neighbor

검색결과 650건 처리시간 0.035초

안드로이드 모바일 악성 앱 탐지를 위한 확률적 K-인접 이웃 분류기 (Probabilistic K-nearest neighbor classifier for detection of malware in android mobile)

  • 강승준;윤지원
    • 정보보호학회논문지
    • /
    • 제25권4호
    • /
    • pp.817-827
    • /
    • 2015
  • 현대인은 스마트폰과 매우 밀접한 관계를 가지고 있으며 이로 인한 수 많은 보안 위협에 노출되어 있다. 실제로 해커들은 스마트폰에 악성 프로그램을 은밀하게 설치하여 장치 이용 제한 및 개인정보 유출 등의 보안 위협을 야기하고 있다. 그리고 그러한 악성 프로그램은 일반적인 프로그램과 다르게 필요 이상의 권한을 요구한다. 본 논문에서는 이 같은 문제를 바탕으로 사용되는 안드로이드 기반 앱들이 요구하는 권한 데이터를 이용하여 주성분 분석(Principle Component Analysis:PCA)과 확률적 K-인접 이웃(Probabilistic K-Nearest Neighbor:PKNN) 방식을 사용하여 효과적으로 악성 프로그램과 일반 프로그램을 분류하고자 한다. 이뿐 아니라 이를 k-묶음 교차 검증(K-fold Croos Validation)을 통해 PKNN의 정확도를 측정하였다. 그리고 일반적으로 사용되는 K-인접 이웃(K-Nearest Neighbor:KNN) 방식과 비교하여, KNN이 분류하기 힘든 부분을 확률적으로 해결하는 PKNN방법을 제안한다. 최종적으로 제안한 방식을 최적화하는 ${\kappa}$${\beta}$ 파라미터를 구하는 것을 목표로 한다. 본 논문에서 사용된 악성 앱 샘플은 Contagio에 요청하여 이용하였다.

A KD-Tree-Based Nearest Neighbor Search for Large Quantities of Data

  • Yen, Shwu-Huey;Hsieh, Ya-Ju
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권3호
    • /
    • pp.459-470
    • /
    • 2013
  • The discovery of nearest neighbors, without training in advance, has many applications, such as the formation of mosaic images, image matching, image retrieval and image stitching. When the quantity of data is huge and the number of dimensions is high, the efficient identification of a nearest neighbor (NN) is very important. This study proposes a variation of the KD-tree - the arbitrary KD-tree (KDA) - which is constructed without the need to evaluate variances. Multiple KDAs can be constructed efficiently and possess independent tree structures, when the amount of data is large. Upon testing, using extended synthetic databases and real-world SIFT data, this study concludes that the KDA method increases computational efficiency and produces satisfactory accuracy, when solving NN problems.

PCA와 개선된 k-Nearest Neighbor를 이용한 모델 기반형 물체 인식 (Model-Based Object Recognition using PCA & Improved k-Nearest Neighbor)

  • 정병수;김병기
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.53-62
    • /
    • 2006
  • 주성분 분석법을 사용한 물체 인식 기술은 영상의 조명 변화가 있을 때 인식률이 떨어지는 경향이 있다. 본 논문에서는 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터 베이스안의 물체인지 가려내는 새로운 PCA 분석방법을 사용한 물체 인식 기술을 제안하는데 그 목적이 있다. 그리고 개선된 k-nearest neighbor를 이용하여 물체 인식률을 향상 시켰다. 본 논문에서 제안된 물체 인식 알고리즘은 히스토그램 이퀄라이제이션과 미디언 필터를 이용하여 영상을 전처리하고 그것을 학습시켜서 물체 공간을 생성한다. 이때 히스토그램 이퀄라이제이션를 사용하여 히스토그램을 펼침으로써 조명 변화에 영향을 감소시키는 결과를 나았고, 이것은 기본적인 주성분 분석방법과 휘도치 정규화를 한 방법 등과 비교해 본 결과 조명 변화의 영향을 최소화하여 좋은 인식률을 유지할 수 있었다. 그리고 모델 영상내의 각각의 물체의 대표 값을 만든다. 그런 후 테스트영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 기존의 방식으로는 거리 계산오차가 많기 때문에 본 논문에서는 개선된 k-Nearest Neighbpr 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델 영상들을 인식의 단위로 이용하였다.

Adaptive Nearest Neighbors를 활용한 결측치 대치

  • 전명식;정형철
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.185-190
    • /
    • 2004
  • 비모수적 결측치 대치 방법으로 널리 사용되는 k-nearest neighbors(KNN) 방법은 자료의 국소적(local) 특징을 고려하지 않고 전체 자료에 대해 균일한 이웃의 개수 k를 사용하는 단점이 있다. 본 연구에서는 KNN의 대안으로 자료의 국소적 특징을 고려하는 adaptive nearest neighbors(ANN) 방법을 제안하였다. 나아가 microarray 자료의 경우에 대하여 결측치 대치를 통해 KNN과 ANN의 성능을 비교하였다.

  • PDF

실내에서 Wi-Fi를 이용한 위치 정보 시스템의 설계 및 구현 (The Design and Implementation of Location Information System using Wireless Fidelity in Indoors)

  • 권오병;김경수
    • 디지털융복합연구
    • /
    • 제11권4호
    • /
    • pp.243-249
    • /
    • 2013
  • 본 논문에서는 GPS(Global Positioning System)를 사용할 수 있는 실외와 GPS(Global Positioning System)를 사용할 수 없는 실내에서 Wi-Fi(Wireless Fidelity)를 이용한 안드로이드 기반의 위치 정보 시스템을 설계 및 구현하였다. 보행자의 위치를 실내에서 추정하기 위해서는, 보행자의 위치에 상관없이 절대위치를 구하는 것이 필요하고, 보행자의 움직임에 따라서 상대위치를 연속적으로 추정하는 것이 필요하다. 보행자의 초기위치를 추정하기 위해서 Wi-Fi fingerprinting을 사용하였다. 기존의 Wi-Fi fingerprinting에서 가장 위치 오차가 작은 WKNN(Weighted K Nearest Neighbor) 알고리즘의 단점을 보완한 EWKNN(Enhanced Weighted K Nearest Neighbor) 알고리즘을 사용해 위치의 정확도를 높였다. 그리고 보행자의 상대위치를 추정하기 위해서는, 스마트폰에 탑재되어 있는 IMU(Inertial Measurement Unit)를 사용하였기 때문에 추가적인 장비가 필요하지 않았다.

개선된 k-Nearest Neighbor를 이용한 물체 인식 (Object Recognition using Improved k-Nearest Neighbor)

  • 정병수;위승정;김종혁;김병기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.799-801
    • /
    • 2005
  • 모델 영상내의 각각의 물체의 대표 값을 만든 후에 실험 영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 그러나 단순히 기존의 방법인 Point to Point 방식인 단순 거리 계산은 오차가 많기 때문에 된 논문에서는 개선된 Class to Class방식인 k-Nearest Neighbor를 이용하여 몇 개의 연속적인 입력영상에 대해 각각의 모델영상들을 인식의 단위로 이용하였다.

  • PDF

텍스트 분류 기법의 발전 (Enhancement of Text Classification Method)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.155-156
    • /
    • 2019
  • Classification and Regression Tree (CART), SVM (Support Vector Machine) 및 k-nearest neighbor classification (kNN)과 같은 기존 기계 학습 기반 감정 분석 방법은 정확성이 떨어졌습니다. 본 논문에서는 개선 된 kNN 분류 방법을 제안한다. 개선 된 방법 및 데이터 정규화를 통해 정확성 향상의 목적이 달성됩니다. 그 후, 3 가지 분류 알고리즘과 개선 된 알고리즘을 실험 데이터에 기초하여 비교 하였다.

  • PDF

An Approach of Dimension Reduction in k-Nearest Neighbor Based Short-term Load Forecasting

  • Chu, FaZheng;Jung, Sung-Hwan
    • 한국멀티미디어학회논문지
    • /
    • 제20권9호
    • /
    • pp.1567-1573
    • /
    • 2017
  • The k-nearest neighbor (k-NN) algorithm is one of the most widely used benchmark algorithm in classification. Nowadays it has been further applied to predict time series. However, one of the main concerns of the algorithm applied on short-term electricity load forecasting is high computational burden. In the paper, we propose an approach of dimension reduction that follows the principles of highlighting the temperature effect on electricity load data series. The results show the proposed approach is able to reduce the dimension of the data around 30%. Moreover, with temperature effect highlighting, the approach will contribute to finding similar days accurately, and then raise forecasting accuracy slightly.

K-Nearest Neighbor를 이용한 물체인식 (Object Recognition using K-Nearest Neighbor)

  • 정재영;김종민;양환석;이웅기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.735-738
    • /
    • 2005
  • 기존의 주성분 분석을 이용한 물체 인식 기술은 모델 영상내의 각각의 물체의 대표 값을 만든 후에 실험 영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 그러나 단순히 기존의 방법인 point to point 방식인 단순 거리 계산은 오차가 많기 때문에 본 논문에서는 개선된 Class to Class방식인 k-Nearest Neighbor을 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델영상들을 인식의 단위로 이용하였다. 또한, 물체 인식을 하는데 있어 본 논문에서 제안한 주성분 분석법을 물체 영상 자체를 계산하여 인식하는 게 아니라 물체 영상 공간이라는 고유 공간을 구성한 후에 단지 기여도가 큰 8개의 벡터로만 인식을 수행하기 때문에 자원 축소의 효과까지 얻을 수 있었다.

  • PDF

Fuzzy Learning Vector Quantization based on Fuzzy k-Nearest Neighbor Prototypes

  • Roh, Seok-Beom;Jeong, Ji-Won;Ahn, Tae-Chon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권2호
    • /
    • pp.84-88
    • /
    • 2011
  • In this paper, a new competition strategy for learning vector quantization is proposed. The simple competitive strategy used for learning vector quantization moves the winning prototype which is the closest to the newly given data pattern. We propose a new learning strategy based on k-nearest neighbor prototypes as the winning prototypes. The selection of several prototypes as the winning prototypes guarantees that the updating process occurs more frequently. The design is illustrated with the aid of numeric examples that provide a detailed insight into the performance of the proposed learning strategy.