• 제목/요약/키워드: K-Nearest Neighbor 알고리즘

검색결과 204건 처리시간 0.025초

최근접 이웃 규칙 기반 프로토타입 선택과 편의-분산을 이용한 성능 평가 (Nearest-neighbor Rule based Prototype Selection Method and Performance Evaluation using Bias-Variance Analysis)

  • 심세용;황두성
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.73-81
    • /
    • 2015
  • 이 논문은 프로토타입 선택 방법을 제안하고, 편의-분산 분해를 이용하여 최근접 이웃 알고리즘과 프로토타입 기반 분류 학습의 일반화 성능 비교 평가에 있다. 제안하는 프로토타입 분류기는 클래스 영역 내에서 가변 반지름을 이용한 다차원 구를 정의하고, 적은 수의 프로토타입으로 구성된 새로운 훈련 데이터 집합을 생성한다. 최근접 이웃 분류기는 새 훈련 집합을 이용하여 테스트 데이터의 클래스를 예측한다. 평균 기대 오류의 편의와 분산 요소를 분해하여 최근접 이웃 규칙, 베이지안 분류기, 고정 반지름을 이용한 프로토타입 선택 방법, 제안하는 프로토타입 선택 방법의 일반화 성능을 비교한다. 실험에서 제안하는 프로토타입 분류기의 편의-분산 변화 추세는 모든 훈련 데이터를 사용하는 최근접 이웃 알고리즘과 비슷한 편의-분산 추세를 보였으며, 프로토타입 선택 비율은 전체 데이터의 평균 약 27.0% 이하로 나타났다.

가시광 통신을 이용한 실내 사용자 단말 탐지 시스템 (Performance of Indoor Positioning using Visible Light Communication System)

  • 박영식;황유민;송유찬;김진영
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권1호
    • /
    • pp.129-136
    • /
    • 2014
  • Wi-Fi fingerprinting 시스템은 실내에서 사용되는 위치 측위 방법이며 AP(Access Point)에서 발생하는 RSS(Received Signal Strength)에 의존한다. AP로부터의 RSS는 벽, 장애물 그리고 사람에 의한 간섭과 다중경로 페이딩 효과에 의하여 변할 수 있기 때문에 Wi-Fi fingerprinting 시스템은 낮은 측위 정확도를 갖는다. 또한, Wi-Fi 신호는 벽을 통과하기 때문에 기존의 시스템은 사용자가 현재 위치해 있는 층을 구분하기 어렵다. 이러한 단점을 극복하기 위하여 본 논문은 정확한 실내 측위를 위한 LED fingerprinting 시스템을 제안한다. 제안된 시스템은 LED로부터 발생하는 LED-ID와 LED의 광 파워를 사용한다. 본 시스템의 Training 단계에서는 각 장소에 해당하는 Fingerprinting을 데이터베이스에 기록한다. Serving 단계에서는 K-NN(K-Nearest Neighbor) 알고리즘을 적용하여 기존의 데이터와 새롭게 수신되는 사용자의 데이터를 비교한다. 컴퓨터 시뮬레이션을 통해 CDF(Cumulative Distribution Function) 형태로 본 시스템의 성능을 나타내었고, 시뮬레이션 결과로부터 제안된 시스템은 평균 측위 정확도보다 8.6% 높은 정확도를 얻을 수 있다.

Balanced Canopy Clustering에 기반한 일반적 k-인접 이웃 그래프 생성 알고리즘 (A Generic Algorithm for k-Nearest Neighbor Graph Construction Based on Balanced Canopy Clustering)

  • 박영기;황혜수;이상구
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.327-332
    • /
    • 2015
  • k-인접 이웃 그래프는 모든 정점에 대한 k-NN 정보를 나타내는 데이터 구조로서, 많은 정보검색 및 추천 시스템에서 k-인접 이웃 그래프를 활용하고 있다. 현재까지 k-인접 이웃 그래프를 생성하는 다양한 방법들이 제안되었지만, 다음의 두 조건을 동시에 만족하는 알고리즘은 제안되지 못했다: (1) 특정유사도 척도를 가정하지 않는다. (2) 정점 또는 차원의 수가 증가하더라도 정확도가 감소하지 않는다. 본 논문에서는 balanced canopy clustering을 이용하여 위 두 조건을 모두 만족하는 k-NN 그래프 생성 알고리즘을 제안한다. 실험 결과, 정점과 차원의 수에 상관없이 기본 알고리즘에 비해 5배 이상 빠르면서 약 92%의 정확도를 유지했다. 본 알고리즘은 새로운 유사도 척도를 사용하거나, 높은 정확도를 보장해야 할 경우 효과적으로 사용될 수 있다.

도로 네트워크 데이타베이스에서 근사 색인을 이용한 k-최근접 질의 처리 (k-Nearest Neighbor Querv Processing using Approximate Indexing in Road Network Databases)

  • 이상철;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.447-458
    • /
    • 2008
  • 본 논문에서는 도로 네트워크 데이타베이스에서 정적 객체의 k-최근접 이웃 질의를 효율적으로 처리하기 위한 방안을 논의한다. 기존의 여러 기법들은 인덱스를 사용하지 못했는데, 이는 네트워크 거리가 순서화 된 거리함수가 아니며 삼각 부등식(triangular inequality) 성질 또한 만족하지 못하기 때문이다. 이러한 기존 기법들은 질의 처리 시 심각한 성능 저하의 문제를 가진다. 선계산된 네트워크 거리를 이용하는 또 다른 기법은 저장 공간의 오버헤드가 크다는 문제를 갖는다. 본 논문에서는 이러한 두 가지 문제점들을 동시에 해결하기 위하여 객체들 간의 네트워크 거리를 근사하여 객체들에 대한 인덱스를 구축하고, 이를 이용하여 k-최근접 이웃 질의를 처리하는 새로운 기법을 제안한다. 이를 위하여 본 논문에서는 먼저 네트워크 공간상의 객체를 유클리드 공간상으로 사상하기 위한 체계적인 방법을 제시한다. 특히, 삼각 부등식 성질을 만족시키기 위하여 평균 네트워크 거리라는 새로운 거리 개념을 제시하고, 유클리드 공간으로의 사상을 위하여 FastMap 기법을 사용한다. 다음으로, 평균 네트워크 거리와 FastMap을 사용하여 네트워크 공간상의 객체들로 인덱스를 구축하는 근사 색인 알고리즘을 제시한다. 또한, 구축한 인덱스를 사용하여 k-최근접 이웃 질의를 효과적으로 수행하는 알고리즘을 제안한다. 마지막으로, 실제 도로 네트워크를 이용한 다양한 실험을 통하여 제안된 기법의 우수성을 규명한다.

분산 그리드 기법을 위한 연속 k-최근접 질의처리 알고리즘 (Countinuous k-Nearest Neighbor Query Processing Algorithm for Distributed Grid Scheme)

  • 김영창;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.9-18
    • /
    • 2009
  • 최근 GPS 및 무선 이동 컴퓨팅 기술의 발달로 인해, 텔레매틱스(telematics) 및 위치기반 서비스(LBS) 응용이 활발하게 연구되고 있다. 이러한 위치 기반 서비스 응용에서는 이동객체의 위치 정보가 시간의 흐름에 따라 계속적으로 변하기 때문에, 이를 위한 빈번한 업데이트 연산은 시스템에 많은 부하를 가중시키며 이로 인해 검색 성능의 저하를 초래한다. 이를 해결하기 위해 공간 네트워크에서 대용량 이동객체의 위치정보를 분산 처리하기 위한 DS-GRID(distributed S-GRID) 및 이를 위한 k-최근접 질의처리 알 고리즘이 제안되었다[1]. 그러나 k-최근접 질의처리 기법은 질의점 및 이동객체의 위치가 변경되면 그 결과 가 유효하지 않기 때문에, 연속 k-최근접(CKNN:continuous k-nearest neighbor) 질의처리 알고리즘의 연구가 필요하다. 본 연구에서는 DS-GRID를 위한 MCE-CKNN 알고리즘 및 MBP-CKNN 알고리즘을 제안한다. MCE-CKNN 알고리즘은 주어진 경로를 셀 단위로 분할하여 각 셀에서 질의 처리를 병렬적으로 수행하여 검색 성능을 향상시킨다. 아울러 MBP-CKNN 알고리즘은 그리드 셀의 각 경계점에서 가까운 POI를 미리 저장하여 인접셀 탐색 횟수를 줄임으로써 검색 성능을 향상시킨다. 마지막으로, 제안하는 알고리즘의 성능 분석을 통해, 기존 알고리즘보다 15-53% 검색 성능이 우수함을 나타내었다.

  • PDF

PCA와 개선된 k-Nearest Neighbor를 이용한 모델 기반형 물체 인식 (Model-Based Object Recognition using PCA & Improved k-Nearest Neighbor)

  • 정병수;김병기
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.53-62
    • /
    • 2006
  • 주성분 분석법을 사용한 물체 인식 기술은 영상의 조명 변화가 있을 때 인식률이 떨어지는 경향이 있다. 본 논문에서는 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터 베이스안의 물체인지 가려내는 새로운 PCA 분석방법을 사용한 물체 인식 기술을 제안하는데 그 목적이 있다. 그리고 개선된 k-nearest neighbor를 이용하여 물체 인식률을 향상 시켰다. 본 논문에서 제안된 물체 인식 알고리즘은 히스토그램 이퀄라이제이션과 미디언 필터를 이용하여 영상을 전처리하고 그것을 학습시켜서 물체 공간을 생성한다. 이때 히스토그램 이퀄라이제이션를 사용하여 히스토그램을 펼침으로써 조명 변화에 영향을 감소시키는 결과를 나았고, 이것은 기본적인 주성분 분석방법과 휘도치 정규화를 한 방법 등과 비교해 본 결과 조명 변화의 영향을 최소화하여 좋은 인식률을 유지할 수 있었다. 그리고 모델 영상내의 각각의 물체의 대표 값을 만든다. 그런 후 테스트영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 기존의 방식으로는 거리 계산오차가 많기 때문에 본 논문에서는 개선된 k-Nearest Neighbpr 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델 영상들을 인식의 단위로 이용하였다.

유전알고리즘을 이용한 최적 k-최근접이웃 분류기 (Optimal k-Nearest Neighborhood Classifier Using Genetic Algorithm)

  • 박종선;허균
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2010
  • 분류분석에 사용되는 k-최근접이웃 분류기에 유전알고리즘을 적용하여 의미 있는 변수들과 이들에 대한 가중치 그리고 적절한 k를 동시에 선택하는 알고리즘을 제시하였다. 다양한 실제 자료에 대하여 기존의 여러 방법들과 교차타당성 방법을 통하여 비교한 결과 효과적인 것으로 나타났다.

kNN 알고리즘에서의 속성 가중치 자동계산 방법 (an Automatic Calculation Method of Feature Weights in k Nearest Neighbor Algorithms)

  • 이강일;이창환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.423-426
    • /
    • 2005
  • 기억기반학습의 일종인 최근접 이웃(k nearest neighbor) 알고리즘은 과거의 데이터들 중에서 새로운 개체와 유사한 데이터들을 이용해서 새로운 개체의 목적 값을 예측하는 것이다. 이 경우 속성의 가중치를 계산하는 방식은 kNN의 성능을 결정하는 중요한 요소가 된다. 본 논문에서는 기존의 다른 이론들과 달리 정보이론에서 사용되는 엔트로피 개념을 이용해서 속성의 가중치를 이론적이고, 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목적속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN의 성능을 향상시킨다. 마지막으로 이러한 방식의 성능을 다수의 실험을 통해 비교하였다.

  • PDF

대규모 데이터를 위한 k-최근접 이웃 학습 기반의 효율적인 협력적 여과 기법 (An Efficient Collaborative Filtering Method Based on k-Nearest Neighbor Learning for Large-Scale Data)

  • 전광성;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.376-380
    • /
    • 2008
  • 사회의 복잡화와 인터넷의 성장으로 폭발적으로 늘어나고 있는 정보들을 사용자가 모두 검토한 후 여과하기는 어려운 일이다. 이러한 문제를 보완하기 위해서 자동화된 정보 여과 기술이 사용되는데, k-최근접 이웃(k-nearest neighbor) 알고리즘은 그 구현이 간단하며 비교적 정확하여 가장 널리 쓰이고 있는 알고리즘 중 하나이다. k 개의 최근접 이웃들로부터 평가값을 계산하는 데 흔히 쓰이는 방법은 상관계수를 이용한 가중치에 기반하는 것이다. 본 논문에서는 이를 보완하여 대규모 데이터에 대해서도 속도는 크게 저하되지 않으며 정확도는 대폭 향상시킬 수 있는 방법을 적용하였다. 또한, 최근접 이웃을 구하는 거리함수로 다양한 방법을 시도하였다. 영화추천을 위한 실제 데이터에 대한 실험 결과, 속도의 저하는 미미하였으나 정확도에 있어서는 크게 향상된 결과를 가져올 수 있었다.

  • PDF

시야각으로 한정된 최근접 질의 (View Field Nearest Neighbor Queries)

  • 이성민;정하림;박준표;정연돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.153-156
    • /
    • 2011
  • 최근 많은 관심을 받고 있는 증강현실 위치기반 서비스와 같이 사용자의 한정된 시야각이 존재하는 상황에서 사용자가 원하는 데이터를 효과적으로 제공하기 위하여 본 논문에서는 새로운 위치기반 질의인 시야 최근접 질의 (VFNN: View Field Nearest Neighbor Queries)를 소개한다. VFNN 질의는 사용자의 시야각내에 위치하는 가장 가까운 데이터를 검색한다. 본 논문에서 제안하는 VFNN 질의 처리 알고리즘은 가장 널리 활용되고 있는 공간 데이터 색인 구조인 $R^*$-tree를 사용한다. 특히, 질의 점과 MBR 사이의 최소거리인 MINDIST뿐만 아니라, 질의 점과 MBR 사이의 최대 각, 최소 각을 정의한다. 이를 활용하여 $R^*$-tree 탐색 시 질의 결과 값을 포함하지 않는 노드들을 연산에서 제외함으로써 질의 처리의 효율성을 향상시킨다. 마지막으로 실험을 통하여 VFNN 질의 처리 알고리즘의 성능을 평가한다.