• 제목/요약/키워드: Similarity search

검색결과 530건 처리시간 0.029초

SIFT를 이용한 유사 위성 영상 검색 (Similar Satellite Image Search using SIFT)

  • 김정범;정진완;김덕환;김상희;이석룡
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.379-390
    • /
    • 2008
  • 영상 데이타의 증가로 인해 여러 분야에 걸쳐 유사 영상 검색에 대한 수요는 계속해서 증가하고 있으며, 좀 더 정확한 유사 영상 검색을 위해 내용기반영상검색 기술 분야에 대한 많은 연구가 이루어지고 있다. 내용기반영상검색에서는 유사한 영상을 검색하기 위해 색상, 모양, 질감 등의 영상 자체의 내용을 사용한다. 하지만 위성 사진과 같이 색상 정보의 사용이 어렵고 영상 자체가 매우 복잡한 영상의 경우는 내용기반영상검색 기술을 이용해도 유사성 검색이 쉽지 않다. 그 이유는 색상 정보의 사용이 어려워 모양 정보를 이용하려면 영상 세그멘테이션을 통해 물체의 모양을 분리해내야 하는데 영상이 매우 복잡한 경우 영상 세그멘테이션의 결과가 좋지 않기 때문이다. 따라서 본 논문에서는 영상 세그멘테이션을 사용하지 않고 유사성 검색을 하는 방법을 제안하여 유사 위성 영상을 검색하고자 한다. 이를 위해 영상 세그멘테이션을 사용하지 않는 모양 기술자인 SIFT keypoint descriptor를 기반으로 영상의 유사도를 정의하여 유사성 검색을 한다. 실험을 통해 제안한 방법을 이용함으로써 색상 정보의 사용이 어렵고 영상 자체가 매우 복잡한 위성 영상의 유사성 검색의 정확성을 향상 시킬 수 있음을 보인다.

A METHOD OF IMAGE DATA RETRIEVAL BASED ON SELF-ORGANIZING MAPS

  • Lee, Mal-Rey;Oh, Jong-Chul
    • Journal of applied mathematics & informatics
    • /
    • 제9권2호
    • /
    • pp.793-806
    • /
    • 2002
  • Feature-based similarity retrieval become an important research issue in image database systems. The features of image data are useful to discrimination of images. In this paper, we propose the highspeed k-Nearest Neighbor search algorithm based on Self-Organizing Maps. Self-Organizing Maps (SOM) provides a mapping from high dimensional feature vectors onto a two-dimensional space. The mapping preserves the topology of the feature vectors. The map is called topological feature map. A topological feature map preserves the mutual relations (similarity) in feature spaces of input data. and clusters mutually similar feature vectors in a neighboring nodes. Each node of the topological feature map holds a node vector and similar images that is closest to each node vector. In topological feature map, there are empty nodes in which no image is classified. We experiment on the performance of our algorithm using color feature vectors extracted from images. Promising results have been obtained in experiments.

포스트의 구조 유사성과 일일 발행수를 이용한 스플로그 탐지 (Splog Detection Using Post Structure Similarity and Daily Posting Count)

  • 백지현;조정식;김성권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.137-147
    • /
    • 2010
  • 블로그는 웹과 로그의 합성어로, 개개인의 생각이나 관심사 등을 일기처럼 기록할 수 있는 웹 서비스이다. 블로그에는 문자 외에, 그림이나 비디오 파일 등 다양한 컨텐츠를 올릴 수 있다. 일반적으로 블로그의 포스트는 시간상의 역순으로 정렬되어 표현된다. 블로그 검색 엔진은 웹 검색 엔진처럼 블로그를 대상으로 사용자의 질의에 따라 정보를 찾아주는 서비스이다. 블로그 검색 엔진은 때때로 만족스럽지 못한 결과를 내곤 하는데, 이것은 스플로그라고 불리는 블로그 스팸에 의해 발생한다. 스플로그는 다른 블로그나 웹 페이지를 무단 도용하거나 자동으로 생성된 컨텐츠로 구성된 스팸 포스트를 가지고 있다. 스플로그는 검색 엔진의 검색 순위를 높이거나, 회원 가입 사이트로 보다 많은 사람들을 유치하기 위해 사용된다. 본 논문은 스플로그 탐지를 목적으로 한다. 본 논문에서 제안하는 스플로그 탐지 기법은 블로그 포스트의 구조 유사성과 일일 포스트 발행수에 따른 분석으로 토대로 이루어진다. 본 논문에서 제안하는 기법을 바탕으로 한 실험의 결과, 스플로그 탐지에 있어 90% 이상의 높은 정확도를 가지며, 만족할만한 수준을 보여준다.

디지털 도서관 이용자의 검색행태 연구 - 검색 로그 데이터의 네트워크 분석을 중심으로 - (A Study on the Search Behavior of Digital Library Users: Focus on the Network Analysis of Search Log Data)

  • 이수상;위성광
    • 한국도서관정보학회지
    • /
    • 제40권4호
    • /
    • pp.139-158
    • /
    • 2009
  • 본 논문에서는 검색로그 데이터의 네트워크 분석방법을 통해 검색자들의 검색행위에 나타난 다양한 특성을 살펴보았다. 이러한 작업을 통해 얻어진 결과는 다음과 같다. 첫째, 검색자들은 검색어의 유사성에 따라 네트워크라는 연결구조를 나타내었다. 둘째, 특정한 검색자 네트워크에서 중심적인 위치를 차지하는 검색자들이 존재하였다. 셋째, 중심 검색자들은 다른 검색자들과 검색 키워드를 공유하고 있었다. 넷째, 전체 검색자들은 다수의 하위 집단으로 군집되어 있다. 이 연구의 결과는 네트워크 분석 방법에 의한 연관된 검색자와 검색어를 추천하는 알고리즘을 개발하는데 활용이 가능할 것이다.

  • PDF

내용 기반 멀티미디어 정보 검색을 위한 근사 k-최근접 데이타 탐색 알고리즘 (An Approximate k-Nearest Neighbor Search Algorithm for Content- Based Multimedia Information Retrieval)

  • 송광택;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.199-208
    • /
    • 2000
  • 내용 기반 멀티미디어 정보 검색에서 유사성에 기반한 k-최근접 데이타 탐색 질의는 매우 중요한 질의이다 일반적으로 멀티미디어 데이타는 고차원 특정 벡터로 표현되기 때문에 기존의 k-최근접 탐색 알고리즘은 멀티미디어 정보 검색에 효율적이지 못하다. 따라서 이러한 응용을 위해서는 다소 근사적 검색 결과를 가져오더라도 빠른 검색 성능을 제공하는 근사 k-최근접 탐색 알고리즘이 요구된다. 이를 위해 본 논문에서는 고차원 데이타를 위한 새로운 근사 k-최근접 탐색 알고리즘을 제안한다. 아울러, 제안하는 근사 k-최근접 탐색 알고리즘을 기존의 알고리즘과 검색 성능변에서 성능 평가를 수행한다. 성능 평가 결과, 기존 알고리즘의 검색 성능을 크게 개선할 수 있었다.

  • PDF

이미지 유사도를 이용한 와인라벨 인식 시스템 (Wine Label Recognition System using Image Similarity)

  • 정종문;양형정;김수형;이귀상;김선희
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.125-137
    • /
    • 2011
  • 최근 휴대폰 카메라로 촬영한 영상을 입력으로 사용하는 시스템에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 와인라벨의 문자를 인식한 후, 데이터베이스내의 와인이미지들 중에서 입력 와인라벨 이미지와 유사한 순서대로 사용자에게 보여주는 시스템을 제안한다. 이미지의 유사도 계산을 위해 본 논문에서는 이미지의 각 영역별 대표색상, 텍스트 영역의 텍스트 색상과 배경색상, 그리고 특징점의 분포를 특징으로 사용한다. 이미지의 색상차를 계산하기 위해 RGB색상을 CIE-Lab색상으로 변환하여 사용하고, 특징점은 해리스코너 검출 알고리즘을 사용하여 추출한다. 각 셀의 대표 색상차와 텍스트 색상차 및 배경 색상차는 가중치를 적용하여 색상차 유사도를 계산하고 색상차 유사도와 특징점 분포 유사도를 정규화하여 최종 이미지 유사도를 구한다. 본 논문에서는 입력 이미지와 데이터베이스내의 이미지 간의 유사도를 계산하여 유사도 순으로 사용자에게 검색 결과를 보여줌으로써 검색 결과로부터 다시 최대 유사 와인라벨을 수동으로 찾는 노력을 줄일 수 있다.

다중해상도 개념을 이용한 기계 부품의 유사성 비교 (Similarity Comparison of Mechanical Parts)

  • 홍태식;이건우;김성찬
    • 한국CDE학회논문집
    • /
    • 제11권4호
    • /
    • pp.315-325
    • /
    • 2006
  • It is very often necessary to search for similar parts during designing a new product because its parts are often easily designed by modifying existing similar parts. In this way, the design time and cost can be reduced. Thus it would be nice to have an efficient similarity comparison algorithm that can be used anytime in the design process. There have been many approaches to compare shape similarity between two solids. In this paper, two parts represented in B-Rep is compared in two steps: one for overall appearances and the other for detail features. In the first step, geometric information is used in low level of detail for easy and fast pre-classification by the overall appearance. In the second step, feature information is used to compare the detail shape in high level of detail to find more similar design. To realize the idea above, a multi resolution algorithm is proposed so that a given solid is described by an overall appearance in a low resolution and by detail features in high resolution. Using this multi-resolution representation, parts can be compared based on the overall appearance first so that the number of parts to be compared in high resolution is reduced, and then detail features are investigated to retrieve the most similar part. In this way, computational time can be reduced by the fast classification in the first step while reliability can be preserved by detail comparison in the second step.

A Study on Finding the Rail Space in Elevators Using Matched Filter

  • Song, Myong-Lyol
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.57-65
    • /
    • 2019
  • In this paper, we study on finding the rail space in elevators by analyzing each image captured with CCD camera. We propose a method that applies one-dimensional matched filter to the pixels of a selected search space in the vertical line at a horizontal position and decides the position with the thickness of the space being represented by a black thick line in captured images. The pattern similarity representing how strongly the associated image pixels resemble with the thick line is defined and calculated with respect to each position along the vertical line of pixels. The position and thickness of the line are decided from the point having the maximum in pattern similarity graph. In the experiments of the proposed method under different illuminational conditions, it is observed that all the pattern similarity graphs show similar shape around door area independent of the conditions and the method can effectively detect the rail space if the rails are illuminated with even weak light. The method can be used for real-time embedded systems because of its simple algorithm, in which it is implemented in simple structure of program with small amount of operations in comparison with the conventional approaches using Canny edge detection and Hough transform.

Cluster-Based Similarity Calculation of IT Assets: Method of Attacker's Next Targets Detection

  • Dongsung Kim;Seon-Gyoung Shon;Dan Dongseong Kim;Huy-Kang Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.1-10
    • /
    • 2024
  • 공격자들은 공격 대상인 IT 자산을 찾을 때 자신이 가지고 있는 유사한 취약점을 사용하는 경향이 있다. 따라서 IT 자산 중 표적이 될 수 있는 유사한 운영체제, 애플리케이션이 있을 때 이를 사전에 찾아내는 것이 중요하다. 본 논문은 효율적인 취약자산 관리 및 제로데이 대응을 위한 새로운 접근 방식을 제안한다. 해당 방법론은 클러스터링과 유사도 계산 결과를 기반으로 새로운 취약점이나 이미 발견된 취약점에 의해 감염될 가능성이 있는 IT 자산을 탐지하는 기능을 제공한다. 실험 결과, 수집된 전체 자산의 86%의 정확도로 클러스터의 목적에 맞게 분류되었으며, 무작위 자산을 선정하여 유사성 계산 실험을 한 결과 동일한 운영체제 및 서비스를 사용하는 자산이 나열됐다.

MPEG-7 시각 정보 기술자의 인덱싱 및 결합 알고리즘 (Algorithms for Indexing and Integrating MPEG-7 Visual Descriptors)

  • 송치일;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.1-10
    • /
    • 2007
  • 본 논문에서는 MPEG-7 시각 정보 기술자인 Dominant Color와 Contour Shape 기술자에 대한 새로운 인덱싱 알고리즘을 제안한다. Dominant Color 기술자에서 사용되는 비교 연산 식은 가우스 혼합 모델에 기초하고 있기 때문에 기술자의 각 속성들을 하나의 칼라 히스토그램 형태로 변형시켜서 인덱스로 사용한다. Contour Shape 기술자는 두 단계 형태의 알고리즘을 사용하는데, 첫 번째 단계에서는 글로벌 변수인 Eccentricity와 Circularity를 사용한 대략적인 비교를 통해서 비슷하지 않은 이미지 오브젝트를 배제시키고 두 번째 단계에서 남겨진 오브젝트들과 질의 오브젝트들간의 Peak 변수를 사용한 비교 연산을 통해 인덱싱을 수행한다. 또한 본 논문은 효율적인 멀티미디어 데이타 검색을 위해서 두 가지의 MPEG-7 시각 정보 기술자 결합 알고리즘을 제안한다. 첫 번째 결합 알고리즘은 가중치를 확률로 변환해서 반영하는 것이고 두 번째는 가중치를 각 비교 연산 결과값의 중요도로 간주하는 방법이다. 실험을 통해서 결과를 분석해 보면 근사화를 통한 인덱스 생성으로 100%의 정확도를 유지 할 수는 없지만 논문에서 제안된 각 기술자의 인덱싱 알고리즘과 기술자들의 결합 알고리즘은 기본 검색 알고리즘과 비교했을 때 매우 빠른 속도 향상을 보여주었다. 본 논문에서 제안된 알고리즘은 MPEG-7을 사용하는 검색 시스템의 데이타베이스 구축에 효율적으로 사용될 수 있다.