• 제목/요약/키워드: K-Nearest Neighbor 알고리즘

검색결과 204건 처리시간 0.027초

효율적인 실내 측위를 위한 최적화된 KNN/IFCM 알고리즘 (Optimized KNN/IFCM Algorithm for Efficient Indoor Location)

  • 이장재;송익호;김종화;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.125-133
    • /
    • 2011
  • WLAN 환경하에서 알고리즘 기반의 패턴 매칭을 위해 training 단계에서는 여러 개의 AP에서 신호 잡음비의 특성값을 데이터베이스에 만들어 활용하고 estimation 단계에서는 단말기(MU)의 2차원 좌표값을 단말기로부터 새롭게 얻은 SNR과 데이터베이스에 저장된 fingerprint을 비교함으로써 추정한다. Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은 k 개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 PFCM 군집화를 적용한 KNN과 PFCM을 혼합한 알고리즘을 제안하였다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여 k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 PFCM에 적용하여 k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/IFCM 알고리즘이 KNN, KNN/FCM, KNN/PFCM 알고리즘보다 성능이 우수하다.

실내 위치기반서비스를 위한 KNN/ANN Hybrid 측위 결정 알고리즘 (KNN/ANN Hybrid Location Determination Algorithm for Indoor Location Base Service)

  • 이장재;정민아;이성로;송익호
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.109-115
    • /
    • 2011
  • Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은 k 개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 ANN 군집화를 적용한 KNN과 ANN을 혼합한 알고리즘을 제안하였다. WLAN 환경하에서 알고리즘 기반의 패턴 매칭을 위해 training 단계에서는 여러 개의 AP에서 신호 잡음비의 특성값을 데이터베이스에 만들어 활용하고 estimation 단계에서는 단말기(MU)의 2차원 좌표값을 단말기로부터 새롭게 얻은 SNR과 데이터베이스에 저장된 fingerprint을 비교함으로써 추정한다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여 k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 ANN에 적용하여 k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/ANN 알고리즘이 KNN 알고리즘보다 성능이 우수하다.

대용량 멀티미디어 데이터의 내용-기반 검색을 위한 근사 k-최근접 데이터 탐색 알고리즘 (Approximate k-Nearest Neighbor Search Algorithms for Content-Based Retrieval of Multimedia Data)

  • 송광택;심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.256-258
    • /
    • 1998
  • 대용량의 멀티미디어 자료를 기반으로 하는 내용-기반 멀티미디어 검색 시스템에서 k-최근접 탐색 질의는 사용자의 매우 중요한 검색 질의 중에 하나이다. 하지만, 방대한 양의 멀티미디어 데이터베이스를 기반으로하는 경우에는 적중 에러 없는 정확(exact) k-최근접 데이터 탐색을 위해서 상당히 많은 디스크 접근 횟수가 요구된다. 본 논문에서는 X-트리에서의 정확 k-최근접 탐색 질의를 개선하고, 또한 사용자의 빠른 검색 성능을 위해 다소의 적중 에러는 허용한다 하더라도 디스크 접근 횟수를 줄이는 근사(approximate) k-최근접 탐색 알고리즘을 제안한다.

K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측 (Classification of Heart Disease Using K-Nearest Neighbor Imputation)

  • 박평우;이석원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.742-745
    • /
    • 2017
  • 본 논문은 심장질환 도메인에 데이터 마이닝 기법을 적용한 연구로, 기존 환자의 정보에 대하여 K-최근접 이웃 알고리즘을 통해 결측 값을 대체하고, 대표적인 예측 분류기인 나이브 베이지안, 소포트 벡터 머신, 그리고 다층 퍼셉트론을 적용하여 각각 결과를 비교 및 분석한다. 본 연구의 실험은 K 최적화 과정을 포함하고 10-겹 교차 검증 방식으로 수행되었으며, 비교 및 분석은 정확도와 카파 통계치를 통해 판별한다.

미세먼지 수치 예측 모델 구현을 위한 데이터마이닝 알고리즘 개발 (Development of Data Mining Algorithm for Implementation of Fine Dust Numerical Prediction Model)

  • 차진욱;김장영
    • 한국정보통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.595-601
    • /
    • 2018
  • 최근 미세먼지 수치가 급격히 상승함에 따라 이에 대한 관심도가 굉장히 높아지고 있다. 미세먼지의 노출은 호흡기 및 심혈관계 질환의 발생과 관련이 있으며, 사망률도 증가시키는 것으로 보고되고 있다. 뿐만 아니라, 산업현장에서도 미세먼지에 대한 피해가 속출한다. 그러나 현대인의 삶에서 미세먼지 노출은 불가피하다. 그러므로 미세먼지를 예측하여, 이에 대한 노출을 최소화하는 것이 건강 및 산업 피해축소에 가장 효율적인 방법일 것이다. 기존의 미세먼지 예측 모델은 농도 수치가 아닌 미세먼지의 농도 범위에 따라 좋음, 보통, 나쁨, 매우 나쁨으로만 나누어 예보하고 있다. 본 논문은 기존의 실제 기상 및 대기 질 데이터를 이용, 기계학습 알고리즘인 Artificial Neural Network (ANN)알고리즘과 K-Nearest Neighbor (K-NN)알고리즘을 상호 응용하여 미세먼지 수치 (PM 10)를 예측하고자 하였다.

토너먼트 기반의 빅데이터 분석 알고리즘 (An Algorithms for Tournament-based Big Data Analysis)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권4호
    • /
    • pp.545-553
    • /
    • 2015
  • 모든 데이터는 그 자체로 가치를 가지고 있지만, 실세계에서 수집되는 데이터들은 무작위적이며 비구조화되어 있다. 따라서 이러한 데이터를 효율적으로 활용하기 위해서 데이터에서 유용한 정보를 추출하기 위한 데이터 변환과 분석 알고리즘들을 사용하게 된다. 이러한 목적으로 사용되는 것이 데이터 마이닝이다. 오늘날에는 데이터를 분석하기 위한 다양한 데이터 마이닝 기법뿐만 아니라, 대용량 데이터를 효율적으로 처리하기 위한 연산 요건과 빠른 분석 시간을 필요로 하고 있다. 대용량 데이터를 저장하기 위하여 하둡이 많이 사용되며, 이 하둡의 데이터를 분석하기 위하여 맵리듀스 프레임워크를 사용한다. 본 논문에서는 단일 머신에서 동작하는 알고리즘을 맵리듀스 프레임워크로 개발할 때 적용의 효율성을 높이기 위한 토너먼트 기반 적용 방안을 제안하였다. 본 방법은 다양한 알고리즘에 적용할 수 있으며, 널리 사용되는 데이터 마이닝 알고리즘인 k-means, k-근접 이웃 분류에 적용하여 그 유용성을 보였다.

WLAN 실내 측위 결정을 위한 KNN/PFCM Hybrid 알고리즘 (KNN/PFCM Hybrid Algorithm for Indoor Location Determination in WLAN)

  • 이장재;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.146-153
    • /
    • 2010
  • 무선 네트워크 기반 실내 측위는 측위를 위한 특수 장비를 필요로 하지 않고, Fingerprinting 방식은 무선 네트워크 기반 측위를 위한 기술 중에서 가장 정확도가 높기 때문에 무선 네트워크 Fingerprinting 방식이 가장 적당한 실내 측위 방법이다. Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은k개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 PFCM 군집화를 적용한 KNN과 PFCM을 혼합한 알고리즘을 제안하였다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 PFCM에 적용하여k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/PFCM 알고리즘이 KNN과 KNN/FCM 알고리즘보다 성능이 우수하다.

k-Nearest Neighbors 분류기를 이용한 복합 지표 산불피해 영역 탐지 (Mapping Burned Forests Using a k-Nearest Neighbors Classifier in Complex Land Cover)

  • 이한나;윤공현;김기홍
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.883-896
    • /
    • 2023
  • 인간 활동 영역이 산지 곳곳에 퍼져 있는 한국에서는 산불이 주거지역이나 각종 시설물을 위협하는 경우가 잦다. 따라서 산불 이후 대책 마련과 피해 복구를 위해 피해 범위를 빠르게 파악할 필요가 있으며, 이러한 경우 원격탐사가 유용한 도구가 될 수 있다. 본 연구에서는 2019년 4월에 발생한 고성·속초 산불 피해지역에 k-nearest neighbor (kNN) 알고리즘을 적용하여 피해 범위를 탐지하는 실험을 수행하였다. 다양한 인공지물을 포함하는 지표와 숲이 혼재된 지역 특성을 고려하여 적절한 공간 해상도와 시간 해상도를 제공하는 Sentinel-2 multispectral instrument (MSI) 자료를 사용하였다. Sentinel-2 MSI의 여섯 밴드와 정규식생지수(NDVI), 정규탄화지수(NBR)를 분류 특성으로 사용하였다. 산불 피해지역과 비피해 지역에서 무작위로 추출된 2,000개 지점 정보를 이용하여 kNN 분류기를 훈련시켰다. 분류 성능을 높이기 위해 데이터에서 특이값을 제거하고 임상도를 병용하였다. 다양한 이웃(neighbor) 수와 분류 특성 조합을 적용하여 산불 후 데이터를 이용한 실험과 산불 전후 데이터 차이를 이용한 실험을 수행하였다. 산불 전후 데이터 차이를 이용하였을 때 더 우수한 분류 성과를 얻을 수 있었지만, 산불 후 데이터만을 이용한 경우에도 피해지역의 범위를 파악할 수 있었다.

보로노이 다이어그램의 경계지점 최소거리 행렬 기반 k-최근접점 탐색 알고리즘 (k-NN Query Processing Algorithm based on the Matrix of Shortest Distances between Border-point of Voronoi Diagram)

  • 엄정호;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-114
    • /
    • 2009
  • 최근 사용자에게 자신과 가장 가까운 k 개의 주유소, 레스토랑, 은행 등의 POI(Point Of Interest) 정보를 추천해주는 위치 기반 서비스가 텔레매틱스, ITS(Intelligent Transport Systems), 키오스크(kiosk)등의 어플리케이션에서 필요로 하고 있다. 이를 위해, 보로노이 다이어그램 k-최근접점 탐색 알고리즘이 제안되었다. 이는 보로노이 다이어그램에서 각 POI의 네트워크의 거리를 미리 계산한 파일을 이용하여 k-최근접점 탐색을 수행한다. 그러나 이 알고리즘은 보로노이 다이어그램 확장에 따른 비용 문제를 야기한다. 따라서 본 논문에서는 보로노이 다이어그램의 경계지점마다 각각에 대하여 최소거리 행렬을 생성하는 알고리즘을 제안한다. 또한 k 개의 POI를 탐색하기 위해, 최소거리 행렬을 이용한 k-최근접점 탐색 알고리즘을 제안한다. 제안하는 알고리즘은 미리 계산된 경계 지점 간 최소거리 행렬을 통해 탐색하므로, k-최근 접점 탐색 시 보로노이 다이어그램의 확장비용을 최소화한다. 아울러 기존 연구와의 성능비교를 통해 제안하는 알고리즘이 기존 알고리즘에 비해 검색시간 측면에서 성능이 우수함을 보인다.

  • PDF

MapReduce 환경에서 재그룹핑을 이용한 Locality Sensitive Hashing 기반의 K-Nearest Neighbor 그래프 생성 알고리즘의 개선 (An Improvement in K-NN Graph Construction using re-grouping with Locality Sensitive Hashing on MapReduce)

  • 이인희;오혜성;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.681-688
    • /
    • 2015
  • k-Nearest Neighbor(k-NN)그래프는 모든 노드에 대한 k-NN 정보를 나타내는 데이터 구조로써, 협업 필터링, 유사도 탐색과 여러 정보검색 및 추천 시스템에서 k-NN그래프를 활용하고 있다. 이러한 장점에도 불구하고 brute-force방법의 k-NN그래프 생성 방법은 $O(n^2)$의 시간복잡도를 갖기 때문에 빅데이터 셋에 대해서는 처리가 곤란하다. 따라서, 고차원, 희소 데이터에 효율적인 Locality Sensitive Hashing 기법을 (key, value)기반의 분산환경인 MapReduce환경에서 사용하여 k-NN그래프를 생성하는 알고리즘이 연구되고 있다. Locality Sensitive Hashing 기법을 사용하여 사용자를 이웃후보 그룹으로 만들고 후보내의 쌍에 대해서만 brute-force하게 유사도를 계산하는 two-stage 방법을 MapReduce환경에서 사용하였다. 특히, 그래프 생성과정 중 유사도 계산하는 부분이 가장 많은 시간이 소요되므로 후보 그룹을 어떻게 만드는 것인지가 중요하다. 기존의 방법은 사이즈가 큰 후보그룹을 방지하는데 한계점이 있다. 본 논문에서는 효율적인 k-NN 그래프 생성을 위하여 사이즈가 큰 후보그룹을 재구성하는 알고리즘을 제시하였다. 실험을 통해 본 논문에서 제안한 알고리즘이 그래프의 정확성, Scan Rate측면에서 좋은 성능을 보임을 확인하였다.