• 제목/요약/키워드: k-nearest neighbor method

검색결과 313건 처리시간 0.032초

데이터 분포에 기반한 유사 군집 선택법 (Neighborhood Selection with Intrinsic Partitions)

  • 김계현;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.428-432
    • /
    • 2007
  • We present a novel method for determining k nearest neighbors, which accurately recognizes the underlying clusters in a data set. To this end, we introduce the "tiling neighborhood" which is constructed by tiling a number of small local circles rather than a single circle, as existing neighborhood schemes do. Then we formulate the problem of determining the tiling neighborhood as a minimax optimization, leading to an efficient message passing algorithm. For several real data sets, our method outperformed the k-nearest neighbor method. The results suggest that our method can be an alternative to existing for general classification tasks, especially for data sets which have many missing values.

  • PDF

도로망에서 움직이는 k-최원접 이웃 질의를 위한 일괄 처리 알고리즘 (Batch Processing Algorithm for Moving k-Farthest Neighbor Queries in Road Networks)

  • 조형주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.223-224
    • /
    • 2021
  • Recently, k-farthest neighbor (kFN) queries have not as much attention as k-nearest neighbor (kNN) queries. Therefore, this study considers moving k-farthest neighbor (MkFN) queries for spatial network databases. Given a positive integer k, a moving query point q, and a set of data points P, MkFN queries can constantly retrieve k data points that are farthest from the query point q. The challenge with processing MkFN queries in spatial networks is to avoid unnecessary or superfluous distance calculations between the query and associated data points. This study proposes a batch processing algorithm, called MOFA, to enable efficient processing of MkFN queries in spatial networks. MOFA aims to avoid dispensable distance computations based on the clustering of both query and data points. Moreover, a time complexity analysis is presented to clarify the effect of the clustering method on the query processing time. Extensive experiments using real-world roadmaps demonstrated the efficiency and scalability of the MOFA when compared with a conventional solution.

  • PDF

통합 주차관제를 위한 실시간 제약 조건을 고려한 최근접 주차장 (A Method of Searching Nearest Neighbor Parking Lot to Consider Realtime Constrains for Integrated Parking Control)

  • 강구안;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.887-890
    • /
    • 2007
  • 상권 내에 존재하는 여러 개의 주차장을 통합 관리하는 시스템에서는 주차장의 실시간 현황 및 접근 경로를 변화 등과 같은 다양한 실시간 제약 조건을 고려한 최근접 주차장에 대한 경로 안내가 필요하다. 이 논문에서는 실시간 제약 조건을 고려한 통합 주차관제 시스템의 최적 경로 탐색 기법을 제안 하고자 한다. 구체적으로 고객이 지정한 주차장의 여러 가지 상황(주차거부, 휴업, 공사 중, 도로 통행 금지 등)을 고려한 인접 지역의 경로 재탐색 방법을 상황별로 알아보고, 각 상황에 맞는 최적의 주차장 접근 경로 탐색 기법을 자세히 다룬다.

  • PDF

HD-Tree: 고성능 Lock-Free NNS KD-Tree (HD-Tree: High performance Lock-Free Nearest Neighbor Search KD-Tree)

  • 이상기;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.53-64
    • /
    • 2020
  • KD-Tree에서 NNS의 구현은 다차원 데이터를 다루는 응용 프로그램에서 필수적이다. 본 논문에서는 자료구조의 동시 수정, 검색이 일어나는 멀티스레드 상황에서 NNS를 지원하는 고성능 Lock-Free KD-Tree인 HD-Tree를 제안한다. HD-Tree는 동기화에 사용되는 노드 수를 최소화하고, 사용하는 원자 연산자의 수를 감소시켜 성능을 개선하였다. 실험 결과 HD-Tree는 8코어 16스레드의 멀티코어 시스템에서 기존의 NNS보다 성능이 최대 95% 향상되었고, 삽입/삭제연산은 코어보다 스레드가 많은 상황에서 기존 알고리즘보다 최대 15%향상된 성능을 보여준다.

전립선암의 정확한 진단을 위한 질감 특성 분석 및 등급 분류 (Analysis of Texture Features and Classifications for the Accurate Diagnosis of Prostate Cancer)

  • 김초희;소재홍;박현균;;;;최흥국
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.832-843
    • /
    • 2019
  • Prostate cancer is a high-risk with a high incidence and is a disease that occurs only in men. Accurate diagnosis of cancer is necessary as the incidence of cancer patients is increasing. Prostate cancer is also a disease that is difficult to predict progress, so it is necessary to predict in advance through prognosis. Therefore, in this paper, grade classification is attempted based on texture feature extraction. There are two main methods of classification: Uses One-way Analysis of Variance (ANOVA) to determine whether texture features are significant values, compares them with all texture features and then uses only one classification i.e. Benign versus. The second method consisted of more detailed classifications without using ANOVA for better analysis between different grades. Results of both these methods are compared and analyzed through the machine learning models such as Support Vector Machine and K-Nearest Neighbor. The accuracy of Benign versus Grade 4&5 using the second method with the best results was 90.0 percentage.

Image Tracking Algorithm using Template Matching and PSNF-m

  • Bae, Jong-Sue;Song, Taek-Lyul
    • International Journal of Control, Automation, and Systems
    • /
    • 제6권3호
    • /
    • pp.413-423
    • /
    • 2008
  • The template matching method is used as a simple method to track objects or patterns that we want to search for in the input image data from image sensors. It recognizes a segment with the highest correlation as a target. The concept of this method is similar to that of SNF (Strongest Neighbor Filter) that regards the measurement with the highest signal intensity as target-originated among other measurements. The SNF assumes that the strongest neighbor (SN) measurement in the validation gate originates from the target of interest and the SNF utilizes the SN in the update step of a standard Kalman filter (SKF). The SNF is widely used along with the nearest neighbor filter (NNF), due to computational simplicity in spite of its inconsistency of handling the SN as if it is the true target. Probabilistic Strongest Neighbor Filter for m validated measurements (PSNF-m) accounts for the probability that the SN in the validation gate originates from the target while the SNF assumes at any time that the SN measurement is target-originated. It is known that the PSNF-m is superior to the SNF in performance at a cost of increased computational load. In this paper, we suggest an image tracking algorithm that combines the template matching and the PSNF-m to estimate the states of a tracked target. Computer simulation results are included to demonstrate the performance of the proposed algorithm in comparison with other algorithms.

K번째 최근접 표본 재추출 방법에 의한 일 강우량의 추계학적 분해에 대한 연구 (Stochastic disaggregation of daily rainfall based on K-Nearest neighbor resampling method)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제49권4호
    • /
    • pp.283-291
    • /
    • 2016
  • 산업의 발전에 따라 기반시설 및 인구 등이 대도시에 밀집되어, 도시홍수방어는 인명피해 뿐만 아니라 재산피해 저감 차원에서도 매우 중요한 문제가 되었다. 요즘은 이러한 도시유역의 유출해석을 보다 정확하게 하기 위해 시강우나 분단위의 강우자료를 활용하고 있다. 하지만 기후변화 시나리오와 같은 미래 강우시나리오는 현재 일단위 수준으로 제공되므로 미래 강우에 대한 확률빈도 해석에 제한이 있다. 이에 본 연구에서는 추계학적 기법을 이용해 일강우 자료를 시강우 자료로 분해하고자 하였다. 일자료를 시자료로 분해하기 위해 과거 시강우 자료를 기반으로 Gram Schmidt 변환과 K개의 최근접 표본 중 하나를 재추출하는 비모수적인 기법(KNNR)을 적용하였다. 이 방법은 연유출량을 월유출량으로 분해하기 위해 개발된 것이다. 하지만 강우자료는 유출량 자료와 달리 확률밀도가 작아 일강우를 시강우로 분해하는 데 직접 적용하는 경우 결과가 실제와 유사한 통계 패턴을 갖는다고 보기 어려웠다. 이를 보완하기 위해 본 연구에서는 분해하고자 하는 일자의 전일과 후일을 포함한 3일 강우패턴을 7개로 구분하고 동일 패턴을 가진 자료들만 분해에 이용하도록 하여 강우자료에 대한 적용성을 높였다. 과거 52년간의 서울기상관측소 시강우 자료를 이용하여 강우자료의 분해에 대한 결과를 분석한 결과, 분해된 시강우 자료가 관측된 시강우자료와 통계적으로 매우 유사한 것을 확인하였다. 향후 기후변화자료의 시강우 분해 등에 활용하여 보다 정확한 도시유출에 대한 빈도해석 등에 적용할 수 있을 것으로 판단된다.

태양광 발전 이상감지를 위한 아웃라이어 추정 방법에 대한 연구 (A study on the outlier data estimation method for anomaly detection of photovoltaic system)

  • 서종관;이태일;이휘성;박점배
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.403-408
    • /
    • 2020
  • 태양광 발전은 특성상 간헐성과 불확실성이 항상 존재하기 때문에 정확한 예측은 어려우며, 실시간 발전량 진단을 위한 이상감지 기술이 중요하다. 본 논문에서는 다양한 파라미터의 상관관계를 도출하고 최근접 이웃 알고리즘을 적용하여 정상데이터와 비정상데이터를 분류한다. 두 분류의 결과는 발전 시스템의 결함에 의한 아웃라이어와 구름 등에 의해 단기간 동안 발생하는 부분 음영 및 전체 음영의 일시적인 전력손실을 보여준다. 100kW 발전소 데이터를 대상으로 머신러닝 분석을 수행하여 테스트 결과를 산출하였으며 실제 이상치와 이상치 후보지를 검증하였다.

키스트로크 인식을 위한 패턴분류 방법 (Pattern Classification Methods for Keystroke Identification)

  • 조태훈
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.956-961
    • /
    • 2006
  • 키스트로크 시간간격은 컴퓨터사용자의 검증 및 인식에서 분별적인 특징이 될 수 있다. 본 논문은 키스트로크 시간간격을 특징으로, 신경망의 역전파 알고리즘과 Bayesian 분류기, 그리고 k-NN을 이용한 분류기의 사용자 인식 성능을 비교 실험하였다. 실험 결과, 사용자당 샘플의 개수가 작을 경우에는 k-NN 알고리즘이 가장 성능이 좋았고, 사용자당 샘플의 개수가 많을 경우에는 Bayesian 분류기의 성능이 가장 뛰어난 결과를 보였다. 따라서 웹기반 온라인 사용자인식을 위해서는 사용자별 키스트로크 샘플의 수에 따라 k-NN이나 Bayesian 분류기를 선택적으로 사용하는 것이 바람직할 것으로 보인다.

칼라 이미지 스케일의 보간 (Interpolation of Color Image Scales)

  • 김성환;정성환;이준환
    • 감성과학
    • /
    • 제10권3호
    • /
    • pp.289-297
    • /
    • 2007
  • 칼라 이미지 스케일은 칼라 전문가들의 지식에 의해 획득되고, 형용사와 대응되는 칼라(들)을 선택하기 위해 동일한 형용사 이미지 스케일들에서 형용사들과 칼라를 표현한다. 이들은 이미지 스케일을 얻기 위한 실험과 통계분석의 어려움 때문에 일반적으로, 단지 제한된 수의 칼라들만이 이미지 스케일에 위치한다. 이는 칼라를 선택하는 과정을 비전문가에게 어렵게 만든다. 본 논문에서는 이미지 스케일에 따라 연속적인 칼라를 제공하는 퍼지 K-근접 이웃 보간 방법에 기초를 둔 칼라 이미지 스케일의 보간 방법을 제안한다. 실험의 결과들은 보간된 이미지 스케일은 칼라 선택 과정에 있어 실용적으로 유용하게 사용될 수 있을 것이라 본다.

  • PDF