• 제목/요약/키워드: Nearest neighbor algorithm

검색결과 334건 처리시간 0.025초

추가 학습이 빈번히 필요한 비포장도로에서 주행로 탐색에 적합한 GLSL 기반 ALNN Algorithm (GLSL based Additional Learning Nearest Neighbor Algorithm suitable for Locating Unpaved Road)

  • 구본우;김준겸;이은주
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.29-36
    • /
    • 2019
  • 국방 분야에서 무인 차량의 주행로는 포장 도로 뿐만 아니라, 자주 다양한 변화를 갖는 야지의 비포장 도로 등이 포함된다. 이 무인 차량은 주로 험지나 오지에서 감시 및 정찰, 진지 방어 등을 수행하므로 자율 주행을 위해서 예측하지 못했던 다양한 주행로와 환경을 수시로 접하게 되며, 이에 따라 추가 학습이 필요하다. 본 논문에서는 'Forgetting' 문제를 피하면서 거리 비교와 Class 비교를 통해 빠르게 추가 학습이 가능하도록 Approximate Nearest Neighbor를 수정한 GPU 기반 Additional Learning Nearest Neighbor(ALNN) 알고리즘을 제안한다. 또 ALNN 알고리즘은 학습 데이터가 누적될수록 연산 속도가 저하되는 문제가 있고, 본 연구에서는 OpenGL Shading Language 기반의 GPU 병렬 처리를 사용하여 이를 해결하였다. ALNN 알고리즘은 기존의 학습 데이터에 영향을 주지 않으면서 빠르게 추가 학습이 가능하여, 빈번히 실시간으로 재학습이 필요한 국방 등의 분야에 활용될 수 있다.

제약을 가진 최소근접을 찾는 이동질의의 효율적인 수행 (A Efficient Query Processing of Constrained Nearest Neighbor Search for Moving Query Point)

  • 반재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1429-1432
    • /
    • 2003
  • This paper addresses the problem of finding a constrained nearest neighbor for moving query point(we call it CNNMP) The Nearest neighbor problem is classified by existence of a constrained region, the number of query result and movement of query point and target. The problem assumes that the query point is not static, as 1-nearest neighbor problem, but varies its position over time to the constrained region. The parameters as NC, NCMBR, CQR and QL for the algorithm are also presented. We suggest the query optimization algorithm in consideration of topological relationship among them

  • PDF

지역적 k값을 사용한 k-Nearest Neighbor Classifier (k-Nearest Neighbor Classifier using Local Values of k)

  • 이상훈;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.193-195
    • /
    • 2003
  • 본 논문에서는 k-Nearest Neighbor(k-NN) 알고리즘을 최적화하기 위해 지역적으로 다른 k(고려할 neighbor의 개수)를 사용하는 새로운 방법을 제안한다. 인스턴스 공간(instance space)에서 노이즈(noise)의 분포가 지역적(local)으로 다를 경우, 각 지점에서 고려해야 할 최적의 이웃 인스턴스(neighbor)의 수는 해당 지점에서의 국부적인 노이즈 분포에 따라 다르다. 그러나 기존의 방법은 전체 인스턴스 공간에 대해 동일한 k를 사용하기 때문에 이러한 인스턴스 공간의 지역적인 특성을 고려하지 못한다. 따라서 본 논문에서는 지역적으로 분포가 다른 노이즈 문제를 해결하기 위해 인스턴스 공간을 여러 개의 부분으로 나누고, 각 부분에 최적화된 k의 값을 사용하여 kNN을 수행하는 새로운 방법인 Local-k Nearest Neighbor 알고리즘(LkNN Algorithm)을 제안한다. LkNN을 통해 생성된 k의 집합은 인스턴스 공간의 각 부분을 대표하는 값으로, 해당 지역의 인스턴스가 고려해야 할 이웃(neighbor)의 수를 결정지어준다. 제안한 알고리즘에 적합한 데이터의 도메인(domain)과 그것의 향상된 성능은 UCI ML Data Repository 데이터를 사용한 실험을 통해 검증하였다.

  • PDF

커널 기반의 퍼지 K-Nearest Neighbor 알고리즘 (Fuzzy K-Nearest Neighbor Algorithm based on Kernel Method)

  • 최병인;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.267-270
    • /
    • 2005
  • 커널 함수는 데이터를 high dimension 상의 속성 공간으로 mapping함으로써 복잡한 분포를 가지는 데이터에 대하여 기존의 선형 분류 알고리즘들의 성능을 향상시킬 수 있다. 본 논문에서는 기존의 유클리디안 거리측정방법 대신에 커널 함수에 의한 속성 공간의 거리측정방법을 fuzzy K-nearest neighbor 알고리즘에 적용한 fuzzy kernel K-nearest neighbor(FKKNN) 알고리즘을 제안한다. 제시한 알고리즘은 데이터에 대한 적절한 커널 함수의 선택으로 기존 알고리즘의 성능을 향상 시킬 수 있다. 제시한 알고리즘의 타당성을 보이기 위하여 여러 데이터 집합에 대한 실험결과를 분석한다.

  • PDF

장애물이 존재하는 검색공간에서 역최대근접질의 처리방법에 관한 연구 (The Processing Method for a Reverse Nearest Neighbor Queries in a Search Space with the Presence of Obstacles)

  • 선휘준;김홍기
    • 융합보안논문지
    • /
    • 제17권2호
    • /
    • pp.81-88
    • /
    • 2017
  • 암호화된 공간데이터베이스와 같은 최근의 여러 응용에서는 질의 기준이 최대근접객체가 되는 객체들을 찾는 역최대 근접질의가 자주 발생한다. 실세계의 검색공간에는 강, 호수 그리고 고속도로 등과 같은 다양한 장애물이 존재하며, 이러한 환경에서 검색성능을 높이기 위해서는 장애물을 고려한 검색거리 측도가 반드시 필요하다. 본 연구에서는 장애물이 존재하는 검색공간에서 역최대근접질의 처리를 최적화하기 위한 검색거리 측도들과 질의처리 알고리즘을 제시한다.

최적탐색거리를 이용한 최근접질의의 처리 방법 (The Method to Process Nearest Neighbor Queries Using an Optimal Search Distance)

  • 선휘준;황부현;류근호
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2173-2184
    • /
    • 1997
  • 공간 데이타베이스 시스템에서 취급되는 여러 유형의 공간질의들 중 주어진 위치에서 가장 가까운 공간객체를 찾는 최근접질의는 매우 빈번히 발생한다. 최근접질의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 기존의 방법은 이차원 검색공간에서 최근접질의의 처리만을 고려하였으며, 검색되는 노드의 수를 정확히 줄이지 못하였다. 본 논문에서는 최적탐색거리를 제안하고 그 특성을 정리하였었다. 제안된 최적탐색거리는 최근접질의 처리시 검색될 노드들을 정확히 선정하기 위한 새로운 검색거리 측도이다. 우리는 최적탐색거리를 R-트리에 적용한 최근접질의 처리 알고리즘을 제안하고 기존의 방법에 비해 질의처리의 결과가 더 정확함을 증명하였다.

  • PDF

공간 네트워크 데이터베이스에서 실체화 기법을 이용한 범위 및 k-최근접 질의처리 알고리즘 (Range and k-Nearest Neighbor Query Processing Algorithms using Materialization Techniques in Spatial Network Databases)

  • 김용기;니하드 카림 초우더리;이현조;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.67-79
    • /
    • 2007
  • 최근 LBS(location-based service) 및 텔레매틱스(telematics) 응용의 효율적인 지원을 위해, 유클리디언(Euclidean) 공간을 대신하여 실제 도로나 철도와 같은 공간 네트워크(network)를 고려한 연구가 활발하게 수행중이다. 그러나 기존 연구에서의 범위 질의 및 k-최근접 질의 처리 알고리즘은 범위나 k 값의 증가에 따라 검색에 필요한 노드 검색 및 거리 계산의 비용 증가로 인하여 선형적인 성능 감소를 보인다. 따라서, 본 논문에서는 공간 네트워크를 위한 기존 질의처리 알고리즘의 성능을 향상시키기 위해, 실체화 기법을 이용한 효율적인 범위 및 k-최근접 질의처리 알고리즘을 제안한다. 아울러, 기존 알고리즘과의 성능 비교를 통하여 제안하는 알고리즘이 우수함을 보인다.

  • PDF

정보이론을 이용한 K-최근접 이웃 알고리즘에서의 속성 가중치 계산 (Calculating Attribute Weights in K-Nearest Neighbor Algorithms using Information Theory)

  • 이창환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.920-926
    • /
    • 2005
  • 최근접 이웃(k nearest neighbor) 알고리즘은 새로운 개체의 목표값을 예측하기 위하여 과거의 유사한 데이타를 이용하여 그 값을 예측하는 것이다. 이 방법은 기계학습의 여러 분야에서 그 유용성을 검증받아 널리 사용되고 있다. 이러한 kNN 알고리즘에서 목표값을 예측할 때 각 속성의 가중치를 동일하게 고려하는 것은 좋은 성능을 보장할 수 없으며 따라서 kNN에서 각 속성에 대한 가중치를 적절히 계산하는 것은 kNN 알고리즘의 성능을 결정하는 중요한 요소중의 하나이다. 본 논문에서는 정보이론을 이용하여 kNN 에서의 속성의 가중치를 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목표 속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN 방법의 성능을 향상시킨다. 개발된 알고리즘은 다수의 실험 데이타를 이용하여 그 성능을 비교하였다.

An Approach of Dimension Reduction in k-Nearest Neighbor Based Short-term Load Forecasting

  • Chu, FaZheng;Jung, Sung-Hwan
    • 한국멀티미디어학회논문지
    • /
    • 제20권9호
    • /
    • pp.1567-1573
    • /
    • 2017
  • The k-nearest neighbor (k-NN) algorithm is one of the most widely used benchmark algorithm in classification. Nowadays it has been further applied to predict time series. However, one of the main concerns of the algorithm applied on short-term electricity load forecasting is high computational burden. In the paper, we propose an approach of dimension reduction that follows the principles of highlighting the temperature effect on electricity load data series. The results show the proposed approach is able to reduce the dimension of the data around 30%. Moreover, with temperature effect highlighting, the approach will contribute to finding similar days accurately, and then raise forecasting accuracy slightly.

프로토타입 선택을 이용한 최근접 분류 학습의 성능 개선 (Performance Improvement of Nearest-neighbor Classification Learning through Prototype Selections)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 최근접 이웃 분류에서 입력 데이터의 클래스는 선택된 근접 학습 데이터들 중에서 가장 빈번한 클래스로 예측된다. 최근접분류 학습은 학습 단계가 없으나, 준비된 데이터가 모두 예측 분류에 참여하여 일반화 성능이 학습 데이터의 질에 의존된다. 그러므로 학습 데이터가 많아지면 높은 기억 장치 용량과 예측 분류 시 높은 계산 시간이 요구된다. 본 논문에서는 분리 경계면에 위치한 학습 데이터들로 구성된 새로운 학습 데이터를 생성시켜 분류 예측을 수행하는 프로토타입 선택 알고리즘을 제안한다. 제안하는 알고리즘에서는 분리 경계 영역에 위치한 데이터를 Tomek links와 거리를 이용하여 선별하며, 이미 선택된 데이터와 클래스와 거리 관계 분석을 이용하여 프로토타입 집합에 추가 여부를 결정한다. 실험에서 선택된 프로토타입의 수는 원래 학습 데이터에 비해 적은 수의 데이터 집합이 되어 최근접 분류의 적용 시 기억장소의 축소와 빠른 예측 시간을 제공할수 있다.