• 제목/요약/키워드: k-nearest neighbor method

검색결과 313건 처리시간 0.024초

대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조 (A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data)

  • 최현화;이미영;김영창;장재우;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.228-237
    • /
    • 2010
  • 고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree외 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file용 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검씩 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.

Statistical Approach to Noisy Band Removal for Enhancement of HIRIS Image Classification

  • Huan, Nguyen Van;Kim, Hak-Il
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 춘계학술대회 논문집
    • /
    • pp.195-200
    • /
    • 2008
  • The accuracy of classifying pixels in HIRIS images is usually degraded by noisy bands since noisy bands may deform the typical shape of spectral reflectance. Proposed in this paper is a statistical method for noisy band removal which mainly makes use of the correlation coefficients between bands. Considering each band as a random variable, the correlation coefficient measures the strength and direction of a linear relationship between two random variables. While the correlation between two signal bands is high, existence of a noisy band will produce a low correlation due to ill-correlativeness and undirectedness. The application of the correlation coefficient as a measure for detecting noisy bands is under a two-pass screening scheme. This method is independent of the prior knowledge of the sensor or the cause resulted in the noise. The classification in this experiment uses the unsupervised k-nearest neighbor algorithm in accordance with the well-accepted Euclidean distance measure and the spectral angle mapper measure. This paper also proposes a hierarchical combination of these measures for spectral matching. Finally, a separability assessment based on the between-class and within-class scatter matrices is followed to evaluate the performance.

  • PDF

Simulation of 27Al MQMAS NMR Spectra of Mordenites Using Point Charge Model with First Layer Only and Multiple Layers of Atoms

  • Chae, Seen-Ae;Han, Oc-Hee;Lee, Sang-Yeon
    • Bulletin of the Korean Chemical Society
    • /
    • 제28권11호
    • /
    • pp.2069-2074
    • /
    • 2007
  • The 27Al multiple quantum magic angle spinning (MQMAS) nuclear magnetic resonance (NMR) spectra of mordenite zeolites were simulated using the point charge model (PCM). The spectra simulated by the PCM considering nearest neighbor atoms only (PCM-n) or including atoms up to the 3rd layer (PCM-m) were not different from those generated by the Hartree-Fock (HF) molecular orbital calculation method. In contrast to the HF and density functional theory methods, the PCM method is simple and convenient to use and does not require sophisticated and expensive computer programs along with specialists to run them. Thus, our results indicate that the spectral simulation of the 27Al MQMAS NMR spectra obtained with the PCM-n is useful, despite its simplicity, especially for porous samples like zeolites with large unit cells and a high volume density of pores. However, it should be pointed out that this conclusion might apply only for the atomic sites with small quadrupole coupling constants.

IMU 원신호 기반의 기계학습을 통한 충격전 낙상방향 분류 (Classification of Fall Direction Before Impact Using Machine Learning Based on IMU Raw Signals)

  • 이현빈;이창준;이정근
    • 센서학회지
    • /
    • 제31권2호
    • /
    • pp.96-101
    • /
    • 2022
  • As the elderly population gradually increases, the risk of fatal fall accidents among the elderly is increasing. One way to cope with a fall accident is to determine the fall direction before impact using a wearable inertial measurement unit (IMU). In this context, a previous study proposed a method of classifying fall directions using a support vector machine with sensor velocity, acceleration, and tilt angle as input parameters. However, in this method, the IMU signals are processed through several processes, including a Kalman filter and the integration of acceleration, which involves a large amount of computation and error factors. Therefore, this paper proposes a machine learning-based method that classifies the fall direction before impact using IMU raw signals rather than processed data. In this study, we investigated the effects of the following two factors on the classification performance: (1) the usage of processed/raw signals and (2) the selection of machine learning techniques. First, as a result of comparing the processed/raw signals, the difference in sensitivities between the two methods was within 5%, indicating an equivalent level of classification performance. Second, as a result of comparing six machine learning techniques, K-nearest neighbor and naive Bayes exhibited excellent performance with a sensitivity of 86.0% and 84.1%, respectively.

다중 스케일 커널화 상관 필터를 이용한 견실한 객체 추적 (Robust Object Tracking based on Kernelized Correlation Filter with multiple scale scheme)

  • 윤준한;김진헌
    • 전기전자학회논문지
    • /
    • 제22권3호
    • /
    • pp.810-815
    • /
    • 2018
  • 커널 상관 필터 알고리듬은 객체 추적에 대해 정확도에서 의미 있는 성과를 거두었다. 그러나 고정된 크기의 템플릿을 사용하기 때문에 추적 대상의 스케일 변화에 대처할 수 없었다. 본 논문에서는 최근접 보간법과 표준 가우시안 정규화를 이용한 다중 스케일에서의 상관 필터링 응답 값을 이용하여 프레임별로 가장 적합한 스케일을 찾아 객체를 추적하는 방식을 제안한다. 다음 프레임의 스케일 값들은 이전 프레임의 최적 스케일 값을 이용해 갱신하고 다시 해당 프레임에서의 최적의 스케일 값을 찾는다. 정확도 비교를 위해 기존 커널 상관 필터 알고리듬에서 사용된 VOT2014 데이터를 사용하여 제안된 방법의 유효성을 검증한다.

NN 필터 추적을 위한 최적 신호 강도 및 검출 문턱값 선택 (Selection of Signal Strength and Detection Threshold for Optimal Tracking with Nearest Neighbor Filter)

  • 정영헌;권일환;홍순목
    • 전자공학회논문지SC
    • /
    • 제37권3호
    • /
    • pp.1-8
    • /
    • 2000
  • 이 논문에서는 NN 필터를 이용한 표적추적을 위한 최적의 신호 강도 및 표적 검출 문턱값을 구하였다. 이를 위하여 먼저 HYCA 방식을 이용하여 NN 필터의 추적성능을 예측할 수 있도록 하고, 이것에 기초하여 예측된 추적성능과 신호 강도 및 표적 검출 문턱값 사이의 관계를 나타내었다. 그리고 이러한 관계를 이용하여 다음과 같은 다양한 비용에 대한 최적 파라미터를 얻었다: (1)위치 추정 오차 분산 합을 최소화하는 최적의 표적 검출 문턱값 순열(sequence); (2)유효 게이트 면적 합을 최소화하는 최적의 표적 검출 문턱값 순열; (3)표적 신호 강도 합을 최소화하는 최적 표적 신호 강도 및 표적 검출 문턱값 순열.

  • PDF

Identification of Differentially Expressed Genes Using Tests Based on Multiple Imputations

  • Kim, Sang Cheol;Yu, Donghyeon
    • Quantitative Bio-Science
    • /
    • 제36권1호
    • /
    • pp.23-31
    • /
    • 2017
  • Datasets from DNA microarray experiments, which are in the form of large matrices of expression levels of genes, often have missing values. However, the existing statistical methods including the principle components analysis (PCA) and Hotelling's t-test are not directly applicable for the datasets having missing values due to the fact that they assume the observed dataset is complete in general. Many methods have been proposed in previous literature to impute the missing in the observed data. Troyanskaya et al. [1] study the k-nearest neighbor (kNN) imputation, Kim et al. [2] propose the local least squares (LLS) method and Rubin [3] propose the multiple imputation (MI) for missing values. To identify differentially expressed genes, we propose a new testing procedure when the missing exists in the observed data. The proposed procedure uses the Stouffer's z-scores and combines the test results of individual imputed samples, which are dependent to each other. We numerically show that the proposed test procedure based on MI performs better than the existing test procedures based on single imputation (SI) by comparing their ROC curves. We apply the proposed method to analyzing a public microarray data.

강우사상의 지속기간별 분포 특성을 고려한 일강우 모의 기법 개발 (Development of methodology for daily rainfall simulation considering distribution of rainfall events in each duration)

  • 정재원;김수전;김형수
    • 한국수자원학회논문집
    • /
    • 제52권2호
    • /
    • pp.141-148
    • /
    • 2019
  • 기존의 Markov Chain 모형으로 일강우량 모의시에 강우의 발생여부를 모의하고 강우일의 강우량은 Monte Carlo 시뮬레이션을 통해 일강우 분포 특성에 맞는 분포형에서 랜덤으로 강우량을 추정하는 것이 일반적이다. 이때 강우 지속기간에 따른 강도 및 강우의 시간별 분포 등의 강우 사상의 특성을 반영할 수 없다는 한계가 있다. 본 연구에서는 이를 개선하기 위해 강우 사상을 1일 지속강우, 2일 지속강우, 3일 지속강우, 4일이상 지속강우로 구분하여 강우의 지속기간에 따라 강우량을 추정하였다. 즉 강우 사상의 강우 지속일별로 총강우량의 분포형을 비매개변수 추정이 가능한 핵밀도추정(Kernel Density Estimation, KDE)를 적용하여 각각 추정하였고, 강우가 지속될 경우에 지속일별로 해당하는 분포형에서 강우량을 구하였다. 각 강우사상에 대해 추정된 총 강우량은 k-최근접 이웃 알고리즘(k-Nearest Neighbor algorithm, KNN)을 통해 관측 강우자료에서 가장 유사한 강우량을 가지는 강우사상의 강우량 일분포 형태에 따라 각 일강우량으로 분배하였다. 본 연구는 기존의 강우량 추정 방법의 한계점을 개선하고자 하였으며, 연구 결과는 미래 강우에 대한 예측에도 활용될 수 있으며 수자원 설계에 있어서 기초자료로 활용될 수 있을 것으로 기대된다.

이동 P2P 환경에서 연속적인 k-최근접 질의 처리 기법 (A Continuous k-Nearest Neighbor Query Processing Method in Mobile P2P Environments)

  • 이현정;복경수;박용훈;임종태;이상규;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.15-16
    • /
    • 2012
  • 본 논문에서는 이동 P2P 환경에서 연속적인 서비스 제공을 위한 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 질의 피어와 근접한 k개의 피어를 효율적으로 모니터링하기 위하여 MR(Monitoring-Region)을 배포한다. MR은 주변 피어들의 이동 벡터를 이용하여 시간 범위 내에서 최소 k개의 질의 결과를 보장하기 위해 만들어진 영역이다. 제안하는 기법은 주변 피어들의 벡터를 이용하여 MR을 계산하기 때문에 장시간 유효하며 MR 영역의 무효화에 따른 질의 재수행 비용을 절약한다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과의 성능평가를 수행한다.

  • PDF

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.