• 제목/요약/키워드: K-Nearest Neighbor

검색결과 640건 처리시간 0.031초

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

Robust Similarity Measure for Spectral Clustering Based on Shared Neighbors

  • Ye, Xiucai;Sakurai, Tetsuya
    • ETRI Journal
    • /
    • 제38권3호
    • /
    • pp.540-550
    • /
    • 2016
  • Spectral clustering is a powerful tool for exploratory data analysis. Many existing spectral clustering algorithms typically measure the similarity by using a Gaussian kernel function or an undirected k-nearest neighbor (kNN) graph, which cannot reveal the real clusters when the data are not well separated. In this paper, to improve the spectral clustering, we consider a robust similarity measure based on the shared nearest neighbors in a directed kNN graph. We propose two novel algorithms for spectral clustering: one based on the number of shared nearest neighbors, and one based on their closeness. The proposed algorithms are able to explore the underlying similarity relationships between data points, and are robust to datasets that are not well separated. Moreover, the proposed algorithms have only one parameter, k. We evaluated the proposed algorithms using synthetic and real-world datasets. The experimental results demonstrate that the proposed algorithms not only achieve a good level of performance, they also outperform the traditional spectral clustering algorithms.

일반적인 그림 데이터에서의 빠른 최인접 검색 (Fast Nearest Neighbor Search on General Size Images)

  • 황윤호;안희갑
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.417-418
    • /
    • 2012
  • 우리는 유클리드 공간에서 그림 데이터의 평균화 분산을 이용한 비선형 변환을 이용하여, 그림 데이터에서 최인접검색(nearest neighbor search)을 빠르게 할 수 있는 알고리즘을 제시한다. 기존의 평균과 분산을 이용한 최인접검색 알고리즘은 고차원 그림 데이터를 그보다 낮은 차원의 유클리드 공간의 데이터로 변환하고, 낮은 차원에서의 비교를 통해 최인접검색의 해가 될 수 없는 그림 데이터를 빠르게 제외하는 방법을 사용한다. 우리는 기존의 방법이 균일하게 나누어지는 크기의 그림 데이터에서만 가능하던 기존방법에 대한 해결책을 이 논문에서 제시하여 일반적인 그림 데이터에서도 평균과 분산을 이용하는 최인접검색을 가능하게 한다.

머신러닝을 활용한 모돈의 생산성 예측모델 (Forecasting Sow's Productivity using the Machine Learning Models)

  • 이민수;최영찬
    • 농촌지도와개발
    • /
    • 제16권4호
    • /
    • pp.939-965
    • /
    • 2009
  • The Machine Learning has been identified as a promising approach to knowledge-based system development. This study aims to examine the ability of machine learning techniques for farmer's decision making and to develop the reference model for using pig farm data. We compared five machine learning techniques: logistic regression, decision tree, artificial neural network, k-nearest neighbor, and ensemble. All models are well performed to predict the sow's productivity in all parity, showing over 87.6% predictability. The model predictability of total litter size are highest at 91.3% in third parity and decreasing as parity increases. The ensemble is well performed to predict the sow's productivity. The neural network and logistic regression is excellent classifier for all parity. The decision tree and the k-nearest neighbor was not good classifier for all parity. Performance of models varies over models used, showing up to 104% difference in lift values. Artificial Neural network and ensemble models have resulted in highest lift values implying best performance among models.

  • PDF

이동객체 방향정보를 이용한 연속궤적최근접질의 (Continuous Trajectory Nearest Neighbor Query using the Direction Information of Moving Objects)

  • 조진연;이언배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.59-62
    • /
    • 2006
  • 최근접 질의 (NN: Nearest Neighbor Query)는 질의 요청자와 가장 가까운 곳에 위치한 대상 객체를 검색하기 위한 질의로서, 이 질의 방법을 실세계 이동 객체에 바로 적용하였을 경우, 실세계의 도로정보를 고려하지 않아 적절한 결과를 제공하지 못한다. 예를 들어, 사용자의 이동 방향과는 반대 방향에 위치한 객체가 질의 결과로 반환 될 경우, 사용자가 검색된 객체에 접근하기 위한 시간과 비용이 증가하는 문제가 발생한다. 또한 질의 객체와 대상 객체가 모두 이동할 경우에는 일정시점에서 질의한 결과는 조금만 시간이 지나면 유효하지 않게 된다. 이러한 문제를 해결하기 위하여 질의 객체와 데이터 객체가 모두 이동 객체인 경우에 적합하게 사용될 수 있도록 이동체의 궤적 정보를 방향정보 가중치로 환산한 근접 질의처리 방법을 제안한다.

  • PDF

방범용 CCTV를 위한 배회행위 탐지 솔루션 (Loitering Detection Solution for CCTV Security System)

  • 강주형;곽수영
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.15-25
    • /
    • 2014
  • 본 논문에서는 지능형 감시 시스템을 위해 공간적 확률 분포와 방향 서술자를 이용하여 다양한 배회행위를 검출하는 방법을 제안한다. 적응적 배경 모델링 기법을 이용하여 움직이는 객체를 검출하고, 검출된 객체로부터 움직임의 정보를 추출한다. 추출된 객체의 움직임 정보는 이동 궤적과 방향에 대해 특징벡터를 생성한다. 생성된 특징벡터는 k-Nearest Neighbor를 통해 최종적으로 배회행위를 검출하게 된다. 제안한 방법을 실내외 다양한 환경에서 테스트하여 배회 행위를 검출하는 결과를 나타내었으며 이는 실시간으로 검출되는 것을 확인하였다.

Client-Side Caching for Nearest Neighbor Queries

  • Park Kwangjin;Hwang Chong-Sun
    • Journal of Communications and Networks
    • /
    • 제7권4호
    • /
    • pp.417-428
    • /
    • 2005
  • The Voronoi diagram (VD) is the most suitable mechanism to find the nearest neighbor (NN) for mobile clients. In NN query processing, it is important to reduce the query response time, since a late query response may contain out-of-date information. In this paper, we study the issue of location dependent information services (LDISs) using a VD. To begin our study, we first introduce a broadcast-based spatial query processing methods designed to support NN query processing. In further sections, we introduce a generic method for location-dependent sequential prefetching and caching. The performance of this scheme is studied in different simulated environments. The core contribution of this research resides in our analytical proof and experimental results.

순회 판매원 문제를 위한 하이브리드 병렬 유전자 알고리즘 (Hybrid Parallel Genetic Algorithm for Traveling Salesman Problem)

  • 김기태;전건욱
    • 대한안전경영과학회지
    • /
    • 제13권3호
    • /
    • pp.107-114
    • /
    • 2011
  • Traveling salesman problem is to minimize the total cost for a traveling salesman who wants to make a tour given finite number of cities along with the cost of travel between each pair them, visiting each cities exactly once before returning home. Traveling salesman problem is known to be NP-hard, and it needs a lot of computing time to get the optimal solution, so that heuristics are more frequently developed than optimal algorithms. This study suggests a hybrid parallel genetic algorithm(HPGA) for traveling salesman problem The suggested algorithm combines parallel genetic algorithm, nearest neighbor search, and 2-opt. The suggested algorithm has been tested on 7 problems in TSPLIB and compared the results of existing methods(heuristics, meta-heuristics, hybrid, and parallel). Experimental results shows that HPGA could obtain good solution in total travel distance minimization.

가중치 자동 조절을 이용한 매칭 에이전트 (Matching Agent using Automatic Weight-Control)

  • 김동조;박영택
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.439-445
    • /
    • 2000
  • 다차원의 속성들을 포함한 대용량의 데이터베이스 또는 점보 저장소의 데이터로부터 지식을 추출하고 이를 활용하기 위해서는 데이터 마이닝의 인공지능 기법 중 기계학습을 활용할 수 있다. 본 논문은 질의어를 바탕으로 각 작성들에 가중치를 적용하여 사용자가 원하는 데이터 집합을 분류하고, 사용자 피드백을 통하여 속성 가중치를 동적으로 변화시킴으로써 검색결과를 향상시키는 방법을 제안한다. 본 논문에서는 데이터 집합을 분류해내기 위해서 각 속성간의 거리에 가중치를 적용하는 k-nearest neighbor 분류법을 사용하였고, 속성 가중치를 동적으로 변화시키는 규칙을 추출하기 위한 방법으로는 결정 트리 생성에 의한 규칙(decision rule) 생성 방법을 적용하였다. 검색결과 향상을 \ulcorner이기 위한 실험으로써 온라인 커플매칭(online couple-matching) 시스템의 핵심부문을 구현하고 이를 적용하였다.

  • PDF

Nearest Neighbor Based Prototype Classification Preserving Class Regions

  • Hwang, Doosung;Kim, Daewon
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1345-1357
    • /
    • 2017
  • A prototype selection method chooses a small set of training points from a whole set of class data. As the data size increases, the selected prototypes play a significant role in covering class regions and learning a discriminate rule. This paper discusses the methods for selecting prototypes in a classification framework. We formulate a prototype selection problem into a set covering optimization problem in which the sets are composed with distance metric and predefined classes. The formulation of our problem makes us draw attention only to prototypes per class, not considering the other class points. A training point becomes a prototype by checking the number of neighbors and whether it is preselected. In this setting, we propose a greedy algorithm which chooses the most relevant points for preserving the class dominant regions. The proposed method is simple to implement, does not have parameters to adapt, and achieves better or comparable results on both artificial and real-world problems.