• 제목/요약/키워드: K-NN(K-Nearest Neighbor)

검색결과 202건 처리시간 0.028초

안드로이드 모바일 단말기를 위한 효율적인 악성앱 감지법 (Efficient Malware Detector for Android Devices)

  • 이혜림;장수희;윤지원
    • 정보보호학회논문지
    • /
    • 제24권4호
    • /
    • pp.617-624
    • /
    • 2014
  • 스마트폰 사용이 급증하였고 스마트폰에 탑재되는 OS 중 안드로이드가 차지하는 비중이 가장 높아졌다. 그러나 오픈소스로 제공되는 안드로이드의 특성이 악의적인 사용자들에게 유용하게 사용되어 스마트폰 사용자들의 프라이버시를 위협하고 있다. 이 논문에서 우리는 안드로이드 앱에서 요구하는 권한 정보를 사용하여 효율적인 악성앱 감지법을 제안한다. 이를 위하여 주성분 분석과 kNN 분류자를 사용하였으며, 새로운 앱들의 특성들을 분류자에 실시간으로 반영하기 위한 incremental kNN 분류자를 제안한다. 또한 이 분류자들의 정확률을 측정하기 위하여 k-묶음 교차 검증법을 사용하였다. 실험에 사용된 실제 악성앱 샘플을 얻기 위하여 Contagio에 요청하였으며 이를 이용하여 분류자의 정확률을 측정하였다.

대용량 위치 데이터에서 효율적인 k-최근접 질의 처리 기법 (Efficient k-Nearest Neighbor Query Processing Method for a Large Location Data)

  • 최도진;임종태;유승훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제17권8호
    • /
    • pp.619-630
    • /
    • 2017
  • 스마트 기기의 대중화로 다양한 위치 기반 서비스가 제공되고 있다. 최근에는 소셜 서비스와 결합한 위치 기반 소셜 서비스들이 생겨나고 있다. 이러한 위치 기반 소셜 네트워크 서비스에서는 사용자 중심의 가장 가까운 위치를 검색하는 k-최근접 질의 처리의 요구가 증가된다. 본 논문에서는 대규모 사용자 환경에서 질의를 효율적으로 처리하기 위한 근사 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 빅데이터 분산 처리기술을 활용하여 효율적인 스트림 처리를 수행한다. 본 논문에서는 대량의 위치 데이터에 대한 색인을 위해 전통적인 그리드 색인 기법을 변형한 색인 기법을 제안한다. 제안하는 질의 처리기법은 사용자의 진행방향을 고려하여 해당 셀을 우선적으로 탐색한다. 이를 통해 k개의 근사 결과 집합을 생성할 수 있다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과 다양한 성능 평가를 수행한다.

SOSiM: 형태 특징 기술자를 사용한 형태 기반 객체 유사성 매칭 (SOSiM: Shape-based Object Similarity Matching using Shape Feature Descriptors)

  • 노충호;이석룡;정진완;김상희;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.73-83
    • /
    • 2009
  • 본 논문에서는 영상 내의 객체의 형태(shape)에 기반한 객체 유사성 매칭(matching) 방법을 제안한다. 제안한 방법에서는 객체의 윤곽선(edge)에서 점들(edge points)을 추출하고, 추출된 점들의 위치 관계를 나타내기 위하여 각 점을 기준으로 로그 원형 히스토그램(log polar histogram)을 생성하였다. 객체의 윤곽을 따라가며 각 점에 대한 원형 히스토그램을 순차적으로 비교함으로써 객체간의 매칭이 이루어지며, 데이타베이스로부터 유사한 객체를 검색하기 위하여 사용한 매칭 방식은 널리 알려진 k-NN(nearest neighbor) 질의 방식을 사용하였다. 제안한 방법을 검증하기 위하여 기존의 형태 문맥 기법(Shape Context method)과 제안한 방법을 비교하였으며, 객체 유사성 매칭 실험에서 k=5일 때 기존 방법의 정확도가 0.37, 제안한 방법이 0.75-0.90이며, k=10일 때 기존 방법이 0.31, 제안한 방법이 0.61-0.80로서 기존의 방법에 비해 정확한 매칭 결과를 보여 주었다. 또한 영상의 회전 변형 실험에서 기존 방법의 정확도가 0.30, 제안한 방법이 0.69로서 기존 방법보다 회전 변형에 강인한(robust) 특성을 가짐을 관찰할 수 있었다.

음성 신호를 이용한 화자의 5가지 감성 인식 (Recognizing Five Emotional States Using Speech Signals)

  • 강봉석;한철희;우경호;양태영;이충용;윤대희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.101-104
    • /
    • 1999
  • 본 논문에서는 음성 신호를 이용해서 화자의 감정을 인식하기 위해 3가지 시스템을 구축하고 이들의 성능을 비교해 보았다. 인식 대상으로 하는 감정은 기쁨, 슬픔, 화남, 두려움, 지루함, 평상시의 감정이고, 각 감정에 대한 감정 음성 데이터베이스를 직접 구축하였다. 피치와 에너지 정보를 감성 인식의 특징으로 이용하였고, 인식 알고리듬은 MLB(Maximum-Likelihood Bayes)분류기, NN(Nearest Neighbor)분류기 및 HMM(Hidden Markov Model)분류기를 이용하였다. 이 중 MLB 분류기와 NN 분류기에서는 특징벡터로 피치와 에너지의 평균과 표준편차, 최대값 등 통계적인 정보를 이용하였고, TMM 분류기에서는 각 프레임에서의 델타 피치와 델타델타 피치, 델타 에너지와 델타델타 에너지 등 시간적 정보를 이용하였다. 실험은 화자종속, 문장독립형 방식으로 하였고, 인식 실험 결과는 MLB를 이용해서 $68.9\%, NN을 이용해서 $66.7\%를 얻었고, HMM 분류기를 이용해서 $89.30\%를 얻었다.

  • PDF

k-NN 분류 알고리즘과 객체 기반 시소러스를 이용한 자동 문서 분류 (Automatic Document Classification Based on k-NN Classifier and Object-Based Thesaurus)

  • 방선이;양재동;양형정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1204-1217
    • /
    • 2004
  • 기존의 통계적인 기법과 기계학습 기법 등을 이용한 자동 문서 분류는 주로 문서 벡터만으로 분류기를 학습하여 분류를 행하기 때문에 특정 범주로 문서를 분류하는데 명확치 않은 경우가 빈번히 발생하여 일정 수준 이상의 정확도를 얻는 데에는 한계를 보이고 있다. 이러한 문제를 해결하기 위해 본 논문에서는 기존 문서 분류 알고리즘에 범주 간의 관련성을 반영하여 분류를 시행하는 방법을 제안한다. 이 방법은 간단한 알고리즘에 비해 좋은 성능을 보이고 있는 k-NN 분류 알고리즘을 이용하여 일차적인 문서 분류를 수행한 후 특정 범주로 분류하기가 명확치 않을 경우, 객체 기반 시소러스에서 제공되는 범주들 간의 일반화 관계, 집성화 관계, 연관화 관계 그리고 인스턴스 관계를 이용하여 문서가 할당될 범주를 결정함으로써 자동 문서 분류의 정확도를 향상시킬 수 있다. 본 논문에서 제안된 방법으로 실험한 결과 k-NN 분류 알고리즘의 분류 결과에 비해 재현율은 유지되면서 최고 13.86% 까지 정확률이 향상되었다.

단어선택과 SMOTE 알고리즘을 이용한 불균형 텍스트 데이터의 소수 범주 예측성능 향상 기법 (Improving minority prediction performance of support vector machine for imbalanced text data via feature selection and SMOTE)

  • 김종찬;장성준;손원
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.395-410
    • /
    • 2024
  • 텍스트 데이터는 일반적으로 많은 다양한 단어들로 구성되어 있다. 평범한 텍스트 데이터의 경우에도 수만 개의 서로 다른 단어들을 포함하고 있는 경우를 흔히 관찰할 수 있으며 방대한 양의 텍스트 데이터에서는 수십만 개에 이르는 고유한 단어들이 포함되어 있는 경우도 있다. 텍스트 데이터를 전처리하여 문서-단어 행렬을 만드는 경우 고유한 단어를 하나의 변수로 간주하게 되는데 이렇게 많은 단어들을 각각 하나의 변수로 간주한다면 텍스트 데이터는 매우 많은 변수를 가진 데이터로 볼 수 있다. 한편, 텍스트 데이터의 분류 문제에서는 분류의 목표변수가 되는 범주의 비중에 큰 차이가 나는 불균형 데이터 문제를 자주 접하게 된다. 이렇게 범주의 비중에 큰 차이가 있는 불균형 데이터의 경우에는 일반적인 분류모형의 성능이 크게 저하될 수 있다는 사실이 잘 알려져 있다. 따라서 불균형 데이터에서의 분류 성능을 개선하기 위해 소수집단의 관측값들을 합성하여 소수집단에 포함되는 새로운 관측값을 생성하는 합성과표집기법(synthetic over-sampling technique; SMOTE) 등의 알고리즘을 적용할 수 있다. SMOTE는 k-최근접이웃(k-nearset neighbor; kNN) 알고리즘을 이용하여 새로운 합성 데이터를 생성하는데 텍스트 데이터와 같이 많은 변수를 가진 데이터의 경우에는 오차가 누적되어 kNN의 성능에 문제가 생길 수 있다. 이 논문에서는 변수선택을 통해 변수가 많은 불균형 텍스트 데이터를 오차가 축소된 공간에 표현하고 이 공간에서 새로운 합성 관측값을 생성하여 불균형 텍스트 데이터에서 소수 범주에 대한 SVM 분류모형의 예측 성능을 향상시키는 방법을 제안한다.

도로 네트워크 환경에서 암호화된 공간데이터를 위한 K-최근접점 질의 처리 알고리즘 (A K-Nearest Neighbour Query Processing Algorithm for Encrypted Spatial Data in Road Network)

  • 장미영;장재우
    • Spatial Information Research
    • /
    • 제20권3호
    • /
    • pp.67-81
    • /
    • 2012
  • 최근 클라우드 컴퓨팅의 발전에 따라, 데이터베이스 아웃소싱(Outsourcing)에 대한 연구가 활발히 진행되고 있다. 또한 무선 통신 기술 및 모바일 기기의 발전으로 인해 위치 기반 서비스를 이용하는 사용자의 수가 증가하였다. 따라서 개인 또는 소규모의 사업자는 데이터 저장 및 관리 비용을 줄이기 위해 그들의 공간 데이터를 위치 기반 서비스 제공자에게 아웃소싱 한다. 그러나 사용자의 위치 정보는 시간대별 방문 장소 및 개인 정보를 지니고 있기 때문에, 이에 대한 허용되지 않은 접근 시 개인 정보 유출 문제가 발생한다. 따라서 위치 정보 아웃소싱을 위한 개인 정보 보호 연구가 필요하다. 이러한 문제를 해결하기 위해, 본 논문에서는 아웃소싱 환경에서 도로네트워크를 고려한 암호화된 공간 데이터베이스 기반 k-최근접점 질의 처리 알고리즘을 제안하였다. 제안하는 기법은 데이터베이스 아웃소싱을 위해 위치 데이터를 네트워크 거리 정보로 변환 및 암호화한 가공데이터를 생성하여 이를 서비스 제공자에게 전송한다. 또한, 전처리 과정을 통해 네트워크 노드와 POI 거리를 미리 저장하여 네트워크 탐색을 빠르게 수행하며, 질의 수행 시 최근접 대표 POI 및 암호화된 거리 정보를 이용하여 질의 결과 후보 집합을 탐색한다. 마지막으로, 질의 영역 재설정 과정을 통해 불필요한 후보 탐색을 줄임으로써 효율적으로 POI를 탐색한다. 마지막으로, 성능평가를 통해 제안하는 기법이 기존 방법에 비해 우수함을 보인다.

근전도 신호 기반 손목 움직임 패턴 분류 알고리즘에 대한 연구 (Pattern Classification Algorithm for Wrist Movements based on EMG)

  • 최항적;김유현;심현민;윤광섭;이상민
    • 재활복지공학회논문지
    • /
    • 제7권2호
    • /
    • pp.69-74
    • /
    • 2013
  • 본 연구에서는 손목 움직임의 추정을 위한 근전도 신호 기반 동작 분류 알고리즘을 제안한다. 근전도의 특징점을 추출하기 위하여 절대차분표준편차(DASDV)과 제곱평균제곱근(RMS)을 사용하며, 측정 된 근전도 신호를 이용하여 동작 마다 30개의 특징점(RMS, DASDV)을 추출한다. 근전도 신호를 특정한 패턴으로 나타내어 적용시키기 위하여 평균값을 기준으로 집단을 두 부분으로 나누고, 패턴분류 방법인 k-NN으로 패턴을 학습시킨 후, 집단을 나누지 않은 방법을 사용한 기존의 연구와 비교하여 제안한 알고리즘의 성능을 검증한다. 실험결과 제안한 알고리즘은 92.59%의 인식률을 보였으며, 이전 연구 결과보다 0.84% 포인트의 성능 개선을 보였다.

  • PDF

A Study on Data Classification of Raman OIM Hyperspectral Bone Data

  • Jung, Sung-Hwan
    • 한국멀티미디어학회논문지
    • /
    • 제14권8호
    • /
    • pp.1010-1019
    • /
    • 2011
  • This was a preliminary research for the goal of understanding between internal structure of Osteogenesis Imperfecta Murine (OIM) bone and its fragility. 54 hyperspectral bone data sets were captured by using JASCO 2000 Raman spectrometer at UMKC-CRISP (University of Missouri-Kansas City Center for Research on Interfacial Structure and Properties). Each data set consists of 1,091 data points from 9 OIM bones. The original captured hyperspectral data sets were noisy and base-lined ones. We removed the noise and corrected the base-lined data for the final efficient classification. High dimensional Raman hyperspectral data on OIM bones was reduced by Principal Components Analysis (PCA) and Linear Discriminant Analysis (LDA) and efficiently classified for the first time. We confirmed OIM bones could be classified such as strong, middle and weak one by using the coefficients of their PCA or LDA. Through experiment, we investigated the efficiency of classification on the reduced OIM bone data by the Bayesian classifier and K -Nearest Neighbor (K-NN) classifier. As the experimental result, the case of LDA reduction showed higher classification performance than that of PCA reduction in the two classifiers. K-NN classifier represented better classification rate, compared with Bayesian classifier. The classification performance of K-NN was about 92.6% in case of LDA.

시멘틱개념과 에지탐지 기반의 적응형 이미지 분류기법 (Adaptive Scene Classification based on Semantic Concepts and Edge Detection)

  • ;;김강석;강상길
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.1-13
    • /
    • 2009
  • 개념 기반 이미지풍경 분류 기법은 데이터베이스에 있는 대량의 이미지 를 카테고리별로 구분하는 많이 적용되는 응용분야이다. 풍경이 속하는 카테고리를 알면 데이터베이스에서 해변, 산, 숲, 필드와 같은 필요한 풍경사진을 찾고자 할 때 불필요한 이미지를 필터링하여 신속하고 정확하게 찾을 수 있다. 본 논문에서는 이미지 분류를 위한 시멘틱 모델링 기반의 적응 세그멘테이션 기법을 제안 한다. 잔디, 물, 하늘과 같은 시멘틱 개념에 따른 이미지를 서브구역으로 나누어 세그멘테이션을 한다. 세그멘테이션은 에지탐색을 이용하고 또한 K-Nearest(K-NN)를 이용하여 세그멘테이션을 한다. 세그멘테이션 과정에서 이미지의 복잡도에 따라 적응적으로 서브구역으로 나눈다. 실험에서는 Vosel과 schiele가 제안한 방법과의 비교를 통해서 정확도면에서 제안된 연구의 우수성을 보여준다.

  • PDF