• 제목/요약/키워드: k-NN query

검색결과 63건 처리시간 0.03초

이동객체 방향정보를 이용한 연속궤적최근접질의 (Continuous Trajectory Nearest Neighbor Query using the Direction Information of Moving Objects)

  • 조진연;이언배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.59-62
    • /
    • 2006
  • 최근접 질의 (NN: Nearest Neighbor Query)는 질의 요청자와 가장 가까운 곳에 위치한 대상 객체를 검색하기 위한 질의로서, 이 질의 방법을 실세계 이동 객체에 바로 적용하였을 경우, 실세계의 도로정보를 고려하지 않아 적절한 결과를 제공하지 못한다. 예를 들어, 사용자의 이동 방향과는 반대 방향에 위치한 객체가 질의 결과로 반환 될 경우, 사용자가 검색된 객체에 접근하기 위한 시간과 비용이 증가하는 문제가 발생한다. 또한 질의 객체와 대상 객체가 모두 이동할 경우에는 일정시점에서 질의한 결과는 조금만 시간이 지나면 유효하지 않게 된다. 이러한 문제를 해결하기 위하여 질의 객체와 데이터 객체가 모두 이동 객체인 경우에 적합하게 사용될 수 있도록 이동체의 궤적 정보를 방향정보 가중치로 환산한 근접 질의처리 방법을 제안한다.

  • PDF

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

셀룰라 네트워크에서 위치 정보 관리 비용을 최소화하는 서버의 중복도 (Server Replication Degree Reducing Location Management Cost in Cellular Networks)

  • 김재훈;임성화
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권3호
    • /
    • pp.265-275
    • /
    • 2002
  • 셀룰라 기반의 이동컴퓨팅 환경에서 이동 호스트의 위치 및 상태관리를 위하여 디폴트 서버(default sever)기법이 널리 사용되나 이동 호스트로의 호 요청이 많은 경우나 호를 요청한 클라이언트가 디볼트서버와 멀리 떨어진 경우 통신 오버 헤드가 커지며, 디폴트서버에 결함이 발생할 경우 해당 이동 호스트에 대한 연결이 불가능해 진다. 디폴트 서버를 여러 개로 중복 시키면 위와 같은 문제점을 경감시키고 디폴트 서버와의 통신비용을 줄일 수 있다. 그러나 디폴트 서버를 중복 시킬 경우 전체 통신비용은 이동 호스트의 이동 성향과 질의(query) 요청의 빈도, 중복 디폴트 서버의 할당 위치와 중복 개수에 영향을 받는다. 본 논문에서는 디폴트 서버를 통신 환경에 따라 최적의 위치에 할당 시켰을 때 nn grid네트워크 환경과 이진트리 네트워크 환경에서 각각의 최적 디폴트 서버 중복 개수를 구하는 방법을 제시하였고, 시뮬레이션을 통하여 수학적 방법이 유용함을 보였다.

거리 기반 유사도 측정을 통한 유방 초음파 영상의 내용 기반 검색 컴퓨터 보조 진단 시스템에 관한 연구 (A Study of CBIR(Content-based Image Retrieval) Computer-aided Diagnosis System of Breast Ultrasound Images using Similarity Measures of Distance)

  • 김민정;조현종
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1272-1277
    • /
    • 2017
  • To assist radiologists for the characterization of breast masses, Computer-aided Diagnosis(CADx) system has been studied. The CADx system can improve the diagnostic accuracy of radiologists by providing objective information about breast masses. Morphological and texture features were extracted from the breast ultrasound images. Based on extracted features, the CADx system retrieves masses that are similar to a query mass from a reference library using a k-nearest neighbor (k-NN) approach. Eight similarity measures of distance, Euclidean, Chebyshev(Minkowski family), Canberra, Lorentzian($F_2$ family), Wave Hedges, Motyka(Intersection family), and Cosine, Dice(Inner Product family) are evaluated by ROC(Receiver Operating Characteristic) analysis. The Inner Product family measure used with the k-NN classifier provided slightly higher performance for classification of malignant and benign masses than those with the Minkowski, $F_2$, and Intersection family measures.

위치 기반 서비스를 위한 데이타 전달 모델 (A Data Dissemination Model for Location-based Services)

  • 박광진;송문배;황종선
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.405-415
    • /
    • 2005
  • 인덱싱 기법은 무선 환경에서 클라이언트의 선별적인 청취를 지원하기 위하여 사용된다. 즉, 서버는 브로드캐스트 채널을 통해 데이타와 인덱스를 함께 전달함으로써 클라이언트의 선택적인 청취를 지원할 수 있다. 그러나 부가적인 인덱스 정보는 브로드캐스트 주기를 증가시키는 단점이 있다. 위치기반 서비스에서의 질의에 대한 응답지연은 잘못된 결과의 전달이라는 문제점을 가져올 수 있다. 본 논문에서 우리는 무선 브로드캐스트 환경에서 k-인접질의 서비스를 지원하기 위한 BBS(Broadcast Based LDIS Scheme) 기법을 제안한다. BBS 기법에서 서버는 전달하고자 하는 데이타를 위치에 기반을 두어 정렬하며 이를 인덱스 정보와 함께 클라이언트들에게 전달한다. 또한 클라이언트의 질의 처리 수행시간을 단축시키기 위하여 프리패칭과 OBC(Object Boundary Circle)기법을 새로이 제안한다. 제안 논문에 대한 성능평가는 데이타의 분포, 클라이언트의 이동 속도 그리고 서비스 영역의 크기 등 다양한 환경에서 이루어 졌다.

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

Using Skylines on Wavelet Synopses for CKNN Queries over Distributed Streams Processing

  • Wang, Ling;Zhou, TieHua;Kim, Kwang-Deuk;Lee, Yang-Koo;Ryu, Keun-Ho
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.7-12
    • /
    • 2009
  • In this paper, we discuss the problem of continuous k.nearest neighbors (CKNN) monitoring over distributed streams wavelet synopses, which also considered sliding window structure under stream based kNN query. We developed traditional skylines techniques and propose a new method which called DR.skylines to process CKNN queries as a bandwidth.efficient approach. It tries to process CKNN queries on synopses for optimized sliding window time and space computation.

  • PDF

Uncertainty for Privacy and 2-Dimensional Range Query Distortion

  • Sioutas, Spyros;Magkos, Emmanouil;Karydis, Ioannis;Verykios, Vassilios S.
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.210-222
    • /
    • 2011
  • In this work, we study the problem of privacy-preservation data publishing in moving objects databases. In particular, the trajectory of a mobile user in a plane is no longer a polyline in a two-dimensional space, instead it is a two-dimensional surface of fixed width $2A_{min}$, where $A_{min}$ defines the semi-diameter of the minimum spatial circular extent that must replace the real location of the mobile user on the XY-plane, in the anonymized (kNN) request. The desired anonymity is not achieved and the entire system becomes vulnerable to attackers, since a malicious attacker can observe that during the time, many of the neighbors' ids change, except for a small number of users. Thus, we reinforce the privacy model by clustering the mobile users according to their motion patterns in (u, ${\theta}$) plane, where u and ${\theta}$ define the velocity measure and the motion direction (angle) respectively. In this case, the anonymized (kNN) request looks up neighbors, who belong to the same cluster with the mobile requester in (u, ${\theta}$) space: Thus, we know that the trajectory of the k-anonymous mobile user is within this surface, but we do not know exactly where. We transform the surface's boundary poly-lines to dual points and we focus on the information distortion introduced by this space translation. We develop a set of efficient spatiotemporal access methods and we experimentally measure the impact of information distortion by comparing the performance results of the same spatiotemporal range queries executed on the original database and on the anonymized one.