• 제목/요약/키워드: Nearest Neighbor Method

검색결과 414건 처리시간 0.028초

멀티미디어 데이터베이스 시스템에서 최대거리를 이용한 K-최대근접질의 처리 방법 (The Method to Process Nearest Neighbor Queries using Maximun Distance in Multimedia Database Systems)

  • 선휘준;신성철
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1025-1030
    • /
    • 2004
  • 멀티미디어 데이타베이스 시스템에서 k-최대근접질의는 매우 빈번히 발생하며, 다른유형의 공간질의에 비하여 처리비용이 많이 요구된다. K-최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있어야한다. 본 논문에서는 최적검색거리[1]의 연산시간을 줄일 수 있는 새로운 검색거리를 제안하고 그 특성을 보인다.

  • PDF

Singular Value Decomposition 기반 고차원 인덱스 구조 (A High-Dimensional Index Structure Based on Singular Value Decomposition)

  • 김상욱
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.213-218
    • /
    • 2000
  • The nearest neighbor query is an important operation widely used in multimedia databases for finding the object that is most similar to a given query object. Most of techniques for processing nearest neighbor queries employ multidimensional indexes for effective indexing of objects. However, the performance of previous multidimensional indexes, which use N-dimensional rectangles or spheres for representing the capsule of the object cluster, deteriorates seriously as the number of dimensions gets higher. This paper proposes a new index structure based singular value decomposition resolving this problem and the query processing method using it. We also verify the superiority of our approach through performance evaluation by performing extensive experiments.

  • PDF

Locality-Sensitive Hashing for Data with Categorical and Numerical Attributes Using Dual Hashing

  • Lee, Keon Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제14권2호
    • /
    • pp.98-104
    • /
    • 2014
  • Locality-sensitive hashing techniques have been developed to efficiently handle nearest neighbor searches and similar pair identification problems for large volumes of high-dimensional data. This study proposes a locality-sensitive hashing method that can be applied to nearest neighbor search problems for data sets containing both numerical and categorical attributes. The proposed method makes use of dual hashing functions, where one function is dedicated to numerical attributes and the other to categorical attributes. The method consists of creating indexing structures for each of the dual hashing functions, gathering and combining the candidates sets, and thoroughly examining them to determine the nearest ones. The proposed method is examined for a few synthetic data sets, and results show that it improves performance in cases of large amounts of data with both numerical and categorical attributes.

클래스 초월구를 이용한 프로토타입 기반 분류 (Prototype-Based Classification Using Class Hyperspheres)

  • 이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권10호
    • /
    • pp.483-488
    • /
    • 2016
  • 본 논문은 최근접 이웃 규칙을 이용한 프로토타입을 이용하는 분류 학습을 제안한다. 훈련 데이터가 대표하는 클래스 영역을 초월구로 분할하는데 최근접 이웃규칙을 적용시키며, 초월구는 동일 클래스 데이터들만 포함시킨다. 초월구의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용한다. 제안하는 선택 방법은 클래스 별 프로토타입을 선택하는 그리디 알고리즘으로 설계되며, 대규모 훈련 데이터에 대한 병렬처리가 가능하다. 분류 예측은 최근접 이웃 규칙을 이용하며, 새로운 훈련 데이터는 프로토타입 집합이다. 실험에서 제안하는 방법은 기 연구된 학습 방법에 비해 일반화 성능이 우수하다.

조기 화재 경보 시스템을 위한 비디오 기반 연기 감지 방법 (A Smoke Detection Method based on Video for Early Fire-Alarming System)

  • 퉁트룽;김종면
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.213-220
    • /
    • 2011
  • 본 논문은 조기 화재 경보 시스템에서 예측하지 못한 위험요소들의 이벤트에 즉각 응답하는 비디오 기반의 효과적인 4단계 연기 감지 방법을 제안한다. 첫 번째 단계에서는 근사 미디언(approximate median) 방법을 사용하여 비디오의 현재 프레임에서 움직이는 영역들을 분리한다. 두 번째 단계에서는 연기의 칼라 기반 분리 기법을 사용하여 이러한 움직이는 영역들로부터 후보 연기 영역을 선택한다. 세 번째 단계에서는 특징추출 알고리즘을 사용하여 연기의 움직임이나 지역 불규칙성과 같은 후보 연기 영역들의 특징을 분석하여 연기의 다섯 가지 특징 파라미터를 추출한다. 네 번째 단계에서는 추출된 다섯 가지 특징 파라미터를 K-nearest neighbor (KNN) 알고리즘의 입력으로 사용하여 후보 연기 영역이 연기인지 아닌지를 구분한다. 모의실험 결과, 제안하는 4 단계 연기 감지 방법은 기존의 연기 감지 알고리즘들과 비교하여 연기감지의 정확도에서 우수한 성능을 보였고, 또한 오픈된 넓은 공간에서도 높은 신뢰성과 낮은 오류 경보율을 보였다.

Case-Based Reasoning Cost Estimation Model Using Two-Step Retrieval Method

  • Lee, Hyun-Soo;Seong, Ki-Hoon;Park, Moon-Seo;Ji, Sae-Hyun;Kim, Soo-Young
    • 토지주택연구
    • /
    • 제1권1호
    • /
    • pp.1-7
    • /
    • 2010
  • Case-based reasoning (CBR) method can make estimators understand the estimation process more clearly. Thus, CBR is widely used as a methodology for cost estimation. In CBR, the quality of case retrieval affects the relevance of retrieved cases and hence the overall quality of the reminding capability of CBR system. Thus, it is essential to retrieve relevant past cases for establishing a robust CBR system. Case retrieval needs the following tasks to obtain appropriate case(s); indexing, search, and matching (Aamodt and Plaza 1994). However, the previous CBR researches mostly deal with matching process that has limits such as accuracy and efficiency of case retrieval. In order to address this issue, this research presents a CBR cost model for building projects that has two-step retrieval process: decision tree and nearest neighbor methods. Specifically, the proposed cost model has indexing, search and matching modules. Features in the model are divided into shape-based and scale-based attributes. Based on these, decision tree is established for facilitating the search task and nearest neighbor method was utilized for matching task. In regard to applying nearest neighbor method, attribute weights are assigned using GA optimization and similarity is calculated using the principle of distance measuring. Thereafter, the proposed CBR cost model is developed using 174 cases and validated using 12 test cases.

Nearest L- Neighbor Method with De-crossing in Vehicle Routing Problem

  • Kim, Hwan-Seong;Tran-Ngoc, Hoang-Son
    • 한국항해항만학회지
    • /
    • 제33권2호
    • /
    • pp.143-151
    • /
    • 2009
  • The field of vehicle routing is currently growing rapidly because of many actual applications in truckload and less than truckload trucking, courier services, door to door services, and many other problems that generally hinder the optimization of transportation costs in a logistics network. The rapidly increasing number of customers in such a network has caused problems such as difficulty in cost optimization in terms of getting a global optimum solution in an acceptable time. Fast algorithms are needed to find sufficient solutions in a limited time that can be used for real time scheduling. In this paper, the nearest L-method (NLNM) is proposed to obtain a vehicle routing solution. String neighbors of different lengths were chosen, tested and compared. The applied de crossing procedure is meant to solve the routes by NLNM by giving a better solution and shorter computation time than that of NLNM with long string neighbors.

최근접 이웃 규칙 기반 프로토타입 선택과 편의-분산을 이용한 성능 평가 (Nearest-neighbor Rule based Prototype Selection Method and Performance Evaluation using Bias-Variance Analysis)

  • 심세용;황두성
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.73-81
    • /
    • 2015
  • 이 논문은 프로토타입 선택 방법을 제안하고, 편의-분산 분해를 이용하여 최근접 이웃 알고리즘과 프로토타입 기반 분류 학습의 일반화 성능 비교 평가에 있다. 제안하는 프로토타입 분류기는 클래스 영역 내에서 가변 반지름을 이용한 다차원 구를 정의하고, 적은 수의 프로토타입으로 구성된 새로운 훈련 데이터 집합을 생성한다. 최근접 이웃 분류기는 새 훈련 집합을 이용하여 테스트 데이터의 클래스를 예측한다. 평균 기대 오류의 편의와 분산 요소를 분해하여 최근접 이웃 규칙, 베이지안 분류기, 고정 반지름을 이용한 프로토타입 선택 방법, 제안하는 프로토타입 선택 방법의 일반화 성능을 비교한다. 실험에서 제안하는 프로토타입 분류기의 편의-분산 변화 추세는 모든 훈련 데이터를 사용하는 최근접 이웃 알고리즘과 비슷한 편의-분산 추세를 보였으며, 프로토타입 선택 비율은 전체 데이터의 평균 약 27.0% 이하로 나타났다.

Opcode와 Windows API를 사용한 멀웨어 탐지 (Malware Detection Method using Opcode and windows API Calls)

  • 안태현;오상진;권영만
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.11-17
    • /
    • 2017
  • 본 논문에서는 멀웨어 탐지 방법으로 Opcode (operation code)와 실행 파일에서 추출한 Windows API Call로 구성된 특징 벡터를 사용하는 방법을 제안한다. 먼저 PE 파일에서 추출한 opcode와 windows API로 특징 벡터를 구성하고 Bernoulli Naïve Bayes과 K-Nearest Neighbor 분류기 알고리즘을 사용하여 성능을 각각 측정하였다. 실험결과, 제안한 방법과 KNN 분류기를 사용하여 분류하면 95.21%의 멀웨어 탐지 정확도를 얻을 수 있었다. 결과적으로 기존의 Opcode 또는 Windows API 호출 중 하나만 사용하는 방법보다 제안한 방법이 멀웨어 탐지 정확도에서 높은 성능을 보인다.

회전 기계 고장 진단을 위한 최근접 이웃 분류기의 기각 전략 (Rejection Scheme of Nearest Neighbor Classifier for Diagnosis of Rotating Machine Fault)

  • 최영일;박광호;기창두
    • 한국정밀공학회지
    • /
    • 제19권3호
    • /
    • pp.52-58
    • /
    • 2002
  • The purpose of condition monitoring and fault diagnosis is to detect faults occurring in machinery in order to improve the level of safety in plants and reduce operational and maintenance costs. The recognition performance is important not only to gain a high recognition rate bur a1so to minimize the diagnosis failures error rate by using off effective rejection module. We examined the problem of performance evaluation for the rejection scheme considering the accuracy of individual c1asses in order to increase the recognition performance. We use the Smith's method among the previous studies related to rejection method. Nearest neighbor classifier is used for classifying the machine conditions from the vibration signals. The experiment results for the performance evaluation of rejection show the modified optimum rejection method is superior to others.