• 제목/요약/키워드: t-Nearest Neighbor

검색결과 46건 처리시간 0.015초

Nearest neighbor and validity-based clustering

  • Son, Seo H.;Seo, Suk T.;Kwon, Soon H.
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권3호
    • /
    • pp.337-340
    • /
    • 2004
  • The clustering problem can be formulated as the problem to find the number of clusters and a partition matrix from a given data set using the iterative or non-iterative algorithms. The author proposes a nearest neighbor and validity-based clustering algorithm where each data point in the data set is linked with the nearest neighbor data point to form initial clusters and then a cluster in the initial clusters is linked with the nearest neighbor cluster to form a new cluster. The linking between clusters is continued until no more linking is possible. An optimal set of clusters is identified by using the conventional cluster validity index. Experimental results on well-known data sets are provided to show the effectiveness of the proposed clustering algorithm.

Singular Value Decomposition 기반 고차원 인덱스 구조 (A High-Dimensional Index Structure Based on Singular Value Decomposition)

  • 김상욱
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.213-218
    • /
    • 2000
  • The nearest neighbor query is an important operation widely used in multimedia databases for finding the object that is most similar to a given query object. Most of techniques for processing nearest neighbor queries employ multidimensional indexes for effective indexing of objects. However, the performance of previous multidimensional indexes, which use N-dimensional rectangles or spheres for representing the capsule of the object cluster, deteriorates seriously as the number of dimensions gets higher. This paper proposes a new index structure based singular value decomposition resolving this problem and the query processing method using it. We also verify the superiority of our approach through performance evaluation by performing extensive experiments.

  • PDF

프로토타입 선택을 이용한 최근접 분류 학습의 성능 개선 (Performance Improvement of Nearest-neighbor Classification Learning through Prototype Selections)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 최근접 이웃 분류에서 입력 데이터의 클래스는 선택된 근접 학습 데이터들 중에서 가장 빈번한 클래스로 예측된다. 최근접분류 학습은 학습 단계가 없으나, 준비된 데이터가 모두 예측 분류에 참여하여 일반화 성능이 학습 데이터의 질에 의존된다. 그러므로 학습 데이터가 많아지면 높은 기억 장치 용량과 예측 분류 시 높은 계산 시간이 요구된다. 본 논문에서는 분리 경계면에 위치한 학습 데이터들로 구성된 새로운 학습 데이터를 생성시켜 분류 예측을 수행하는 프로토타입 선택 알고리즘을 제안한다. 제안하는 알고리즘에서는 분리 경계 영역에 위치한 데이터를 Tomek links와 거리를 이용하여 선별하며, 이미 선택된 데이터와 클래스와 거리 관계 분석을 이용하여 프로토타입 집합에 추가 여부를 결정한다. 실험에서 선택된 프로토타입의 수는 원래 학습 데이터에 비해 적은 수의 데이터 집합이 되어 최근접 분류의 적용 시 기억장소의 축소와 빠른 예측 시간을 제공할수 있다.

최근접 질의를 위한 고차원 인덱싱 방법

  • 김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.632-642
    • /
    • 2001
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이타베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과 적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 사각형 혹은 원을 사용하여 객체 클러스터의 캡슐 표현하는 기존의 다차원 인덱스들은 타원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 단순한 캡슐 표현 방식이 최근접 질의 처리의 성능을 저하시키는 주요 원인임을 지적하고, (1) 클러스터에 적합한 새로운 축 시스템(axis system)의 채택, (2) 원과 사각형의 조합 에 의한 다양한 캡슐 형태의 표현. (3) 아웃 라이어(outlier)의 별도 관리 등의 해결 방안을 제안한다. 또한, 이러한 개념들을 채택하는 인덱싱 구조를 제시하고. 이를 이용하는 최근접 질의 처리 방안을 제안한다. 끝으 로, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF

고차원 공간에서 최근접 질의를 효과적으로 처리하기 위한 새로운 인덱싱 기법 (A New Indexing Technique for Processing Nearest Neighbor Queries in High Dimensional Space)

  • 김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.83-85
    • /
    • 2000
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이터베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 시각형 혹은 원을 사용하여 객체 클러스터의 캡슐을 표현하는 기존의 다차원 인덱스들은 차원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 문제를 해결하는 새로운 인덱스 구조를 제시하고, 이를 이용하는 최근접 질의 처리 방안을 제안한다. 또한, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF

비부정 행렬 인수분해 차원 감소를 이용한 최근 인접 협력적 여과 (Nearest-Neighbor Collaborative Filtering Using Dimensionality Reduction by Non-negative Matrix Factorization)

  • 고수정
    • 정보처리학회논문지B
    • /
    • 제13B권6호
    • /
    • pp.625-632
    • /
    • 2006
  • 협력적 여과는 사용자 선호도를 예측하기 위해 그 사용자의 유형을 학습하는 데 목적을 둔 기술이다. 협력적 여과 시스템이 전자상거래에서 성공적인 기술일지라도 그들은 데이터의 고차원성과 희박성이라는 문제점을 갖는다. 본 논문에서는 이와 같은 문제점을 해결하기 위하여 비부정 행렬 인수분해(NNMF, Non-negative Matrix Factorization) 방법을 이용한 최근 인접 협력적 여과 방법을 제안한다. 행렬을 분해하기 위한 전처리로서 사용자 변동 계수를 이용하여 사용자-아이템 행렬의 결측치를 채우고, 이를 대상으로 비부정 분해 방식을 적용하여 행렬을 인수분해 한다. 비부정 분해 방식을 적용한 긍정 분해는 사용자들을 의미를 갖는 벡터로써 표현함으로써 사용자들을 의미 관계를 갖는 그룹으로 표현한다. 이와 같이 벡터로 표현된 사용자들은 벡터 유사도에 의해 그들간의 유사도를 계산한다. 계산된 유사도의 정도에 의해 이웃을 결정하고, 이웃들이 평가한 아이템에 대한 흥미도를 기반으로 새로운 사용자가 평가하지 않은 아이템에 대한 결측치를 예측한다.

디지털 스캔 이미지의 보간방법에 관한 연구 (A study on the Interpolation method of Digital scan image)

  • 이성형;조가람;구철희
    • 한국인쇄학회지
    • /
    • 제16권3호
    • /
    • pp.81-95
    • /
    • 1998
  • If a image doesn't include sufficient data of output size and resolution, we will scan again the image. Interpolation generates a new pixel by methematical average of processing. In the interpolation method, there are nearest neighbor interpolation, bilinear interpolation and bicubic interpolation etc. This study was carried out for the purpose of researching compatible method to digital scan image caused by only different interpolation methods. Nearest neighbor interpolation show superior effect in the drawing image. Bilinear interpolation show reduction in detail and contrast. Bicubic interpolation show superior effect in the digital photo image USM(Unsharp Mask) application after extension by interpolation show better than extension by interpolation after USM(unsharp mask) application.

  • PDF

Guitar Tab Digit Recognition and Play using Prototype based Classification

  • Baek, Byung-Hyun;Lee, Hyun-Jong;Hwang, Doosung
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.19-25
    • /
    • 2016
  • This paper is to recognize and play tab chords from guitar musical sheets. The musical chord area of an input image is segmented by changing the image in saturation and applying the Grabcut algorithm. Based on a template matching, our approach detects tab starting sections on a segmented musical area. The virtual block method is introduced to search blanks over chord lines and extract tab fret segments, which doesn't cause the computation loss to remove tab lines. In the experimental tests, the prototype based classification outperforms Bayesian method and the nearest neighbor rule with the whole set of training data and its performance is similar to that of the support vector machine. The experimental result shows that the prediction rate is about 99.0% and the number of selected prototypes is below 3.0%.

A Hybrid Index of Voronoi and Grid Partition for NN Search

  • Seokjin Im
    • International journal of advanced smart convergence
    • /
    • 제12권1호
    • /
    • pp.1-8
    • /
    • 2023
  • Smart IoT over high speed network and high performance smart devices explodes the ubiquitous services and applications. Nearest Neighbor(NN) query is one of the important type of queries that have to be supported for ubiquitous information services. In order to process efficiently NN queries in the wireless broadcast environment, it is important that the clients determine quickly the search space and filter out NN from the candidates containing the search space. In this paper, we propose a hybrid index of Voronoi and grid partition to provide quick search space decision and rapid filtering out NN from the candidates. Grid partition plays the role of helping quick search space decision and Voronoi partition providing the rapid filtering. We show the effectiveness of the proposed index by comparing the existing indexing schemes in the access time and tuning time. The evaluation shows the proposed index scheme makes the two performance parameters improved than the existing schemes.

ENVIRONMENT DEPENDENCE OF DISK MORPHOLOGY OF SPIRAL GALAXIES

  • Ann, Hong Bae
    • 천문학회지
    • /
    • 제47권1호
    • /
    • pp.1-13
    • /
    • 2014
  • We analyze the dependence of disk morphology (arm class, Hubble type, bar type) of nearby spiral galaxies on the galaxy environment by using local background density (${\Sigma}_n$), projected distance ($r_p$), and tidal index (T I) as measures of the environment. There is a strong dependence of arm class and Hubble type on the galaxy environment, while the bar type exhibits a weak dependence with a high frequency of SB galaxies in high density regions. Grand design fractions and early-type fractions increase with increasing ${\Sigma}_n$, $1/r_p$, and T I, while fractions of flocculent spirals and late-type spirals decrease. Multiple-arm and intermediate-type spirals exhibit nearly constant fractions with weak trends similar to grand design and early-type spirals. While bar types show only a marginal dependence on ${\Sigma}_n$, they show a fairly clear dependence on $r_p$ with a high frequency of SB galaxies at small $r_p$. The arm class also exhibits a stronger correlation with $r_p$ than ${\Sigma}_n$ and T I, whereas the Hubble type exhibits similar correlations with ${\Sigma}_n$ and $r_p$. This suggests that the arm class is mostly affected by the nearest neighbor while the Hubble type is affected by the local densities contributed by neighboring galaxies as well as the nearest neighbor.