• 제목/요약/키워드: Similar Search

검색결과 806건 처리시간 0.029초

비트맵 필터를 이용한 효율적인 역 리스트 탐색 기법 (Efficient Inverted List Search Technique using Bitmap Filters)

  • 권인택;김종익
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.415-422
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 Suffix 필터링 과정에서 역 리스트의 탐색 비용을 줄이기 위해 역 리스트의 통계 정보인 비트맵 필터를 사용하는 기법을 제안한다. 제안하는 기법은 비트맵 필터를 사용하여 Suffix 필터링 과정에서 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 Suffix 필터링 알고리즘보다 더 효율적임을 보인다.

근사적 확률을 이용한 표적 탐색 (A Faster Algorithm for Target Search)

  • 정성진;홍성필;조성진;박명주
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2006년도 추계학술대회
    • /
    • pp.57-59
    • /
    • 2006
  • The purpose of search problem is to maximize the probability of target detection as limited search capability. Especially, as elapsing of time at a point of time of initial information received the target detection rate for searching an expected location due to a moving target such that wrecked ship or submarine decrease in these problems. The algorithm of search problem to a moving target having similar property of above targets should solve the search route as quickly as possible. In existing studies, they have a limit of applying in practice due to increasing computation time required by problem size (i.e., number of search area, search time). In this study, we provide that it takes more reasonable computation time than preceding studies even though extending a problem size practically using an approximate computation of probability.

  • PDF

A Hybrid of Evolutionary Search and Local Heuristic Search for Combinatorial Optimization Problems

  • Park, Lae-Jeong;Park, Cheol-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제1권1호
    • /
    • pp.6-12
    • /
    • 2001
  • Evolutionary algorithms(EAs) have been successfully applied to many combinatorial optimization problems of various engineering fields. Recently, some comparative studies of EAs with other stochastic search algorithms have, however, shown that they are similar to, or even are not comparable to other heuristic search. In this paper, a new hybrid evolutionary algorithm utilizing a new local heuristic search, for combinatorial optimization problems, is presented. The new intelligent local heuristic search is described, and the behavior of the hybrid search algorithm is investigated on two well-known problems: traveling salesman problems (TSPs), and quadratic assignment problems(QAPs). The results indicate that the proposed hybrid is able to produce solutions of high quality compared with some of evolutionary and simulated annealing.

  • PDF

의학용어 비교 검색을 지원하는 SNOMED CT 브라우저 설계 (Design of a SNOMED CT Browser Supporting Comparative Search of Clinical Terminology)

  • 류우석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.418-420
    • /
    • 2015
  • SNOMED CT 브라우저는 SNOMED CT 용어체계에 포함되어 있는 방대한 양의 의학용어들을 검색하고 브라우징하기 위한 검색 시스템이다. 기존의 브라우저는 검색 결과로 나타나는 유사한 용어들을 단순 나열식으로 제시함으로써 적합한 용어 선택에 대한 사용자의 혼란을 야기한다. 본 논문에서는 용어 검색 결과들을 효율적으로 비교 검색하기 위한 새로운 브라우저 시스템을 설계한다. 제안하는 시스템은 검색 결과 용어들 간 직관적인 비교 검색을 위해 용어 검색 모듈, 위상 관계 검색 모듈, 검색 결과 서브-그래프 생성 모듈을 포함하는 특징이 있다.

  • PDF

효율적인 소셜 검색을 위한 토픽기반 소셜 관계 랭크 알고리즘 (Topic Sensitive_Social Relation Rank Algorithm for Efficient Social Search)

  • 김영안;박건우
    • 한국통신학회논문지
    • /
    • 제38B권5호
    • /
    • pp.385-393
    • /
    • 2013
  • 지난 10여 년간, 정보기술 분야의 패러다임은 기계중심에서 인간중심으로, 기술기반에서 사용자가 쉽게 정보시스템에 참여하고 활용 할 수 있는 사용자 기반으로 변화되었다. 즉 소셜 네트워크를 이용하여 정보를 상호 공유하는 소셜 검색의 형태로 변화하고 있으며, 이와 같이 사람과 사람을 연결 해 주는 소셜 네트워크 서비스는 웹서비스와 융합을 통해 친구 맺기, 친구 찾기, 유사한 관심사를 갖고 있는 사람들과의 정보공유, 선호도 검색, 정보 추천시스템 등 다양한 분야에 활용되고 있다. 본 논문에서는 토픽 기반 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. 제안 알고리즘은 소셜 네트워크 서비스를 웹 검색 엔진과 통합하는 것을 목적으로 하며, 소셜 관계 지수, 즉 Social Relation Rank와 검색 결과에 대한 선호도 사이의 상관관계를 분석하였다. 실험 과정에서 소셜 네트워크 안에 존재하는 일반적인 사람들은 정보 공유시 특정 분야에 대해 관심사가 유사할 경우 잘 모르는 타인들에 비해 친밀도가 높은 친구를 더 신뢰한다는 것을 확인 할 수 있었다. 따라서 제안 알고리즘은 소셜 검색의 신뢰성을 향상 시킬 수 있을 것으로 판단된다.

온라인가나다를 위한 주제 분류 기반 유사 질문 검색 시스템 (Similar Question Search System for online Q&A for the Korean Language Based on Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 인지과학
    • /
    • 제26권3호
    • /
    • pp.263-278
    • /
    • 2015
  • 국립국어원의 온라인가나다 서비스는 한국어에 대한 질문을 등록하면 전문가가 답변을 작성하는 인터넷 서비스이다. 이러한 서비스는 유사한 질문이 자주 등록되는 문제점이 있다, 만일 새롭게 등록되는 질문과 유사한 질문을 자동으로 찾아 그 질문에 대한 답변을 등록 즉시 제공한다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 온라인가나다의 특성을 분석하여 자주 질문되는 다섯 개의 주제 분류를 설정하고, 주제 분류 유사도와 함께 음소와 음절단위 수열유사도와 벡터 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용하여 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 Mean Reciprocal Rank(MRR)가 0.756, 정답이 1위와 5위내에 검색될 확률은 각각 68.31%, 87.32%를 보였다.

Color Image Query Using Hierachical Search by Region of Interest with Color Indexing

  • Sombutkaew, Rattikorn;Chitsobhuk, Orachat
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.810-813
    • /
    • 2004
  • Indexing and Retrieving images from large and varied collections using image content as a key is a challenging and important problem in computer vision application. In this paper, a color Content-based Image Retrieval (CBIR) system using hierarchical Region of Interest (ROI) query and indexing is presented. During indexing process, First, The ROIs on every image in the image database are extracted using a region-based image segmentation technique, The JSEG approach is selected to handle this problem in order to create color-texture regions. Then, Color features in form of histogram and correlogram are then extracted from each segmented regions. Finally, The features are stored in the database as the key to retrieve the relevant images. As in the retrieval system, users are allowed to select ROI directly over the sample or user's submission image and the query process then focuses on the content of the selected ROI in order to find those images containing similar regions from the database. The hierarchical region-of-interest query is performed to retrieve the similar images. Two-level search is exploited in this paper. In the first level, the most important regions, usually the large regions at the center of user's query, are used to retrieve images having similar regions using static search. This ensures that we can retrieve all the images having the most important regions. In the second level, all the remaining regions in user's query are used to search from all the retrieved images obtained from the first level. The experimental results using the indexing technique show good retrieval performance over a variety of image collections, also great reduction in the amount of searching time.

  • PDF

내용기반 검색을 위한 SOMk-NN탐색 알고리즘 (SOMk-NN Search Algorithm for Content-Based Retrieval)

  • 오군석;김판구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권5호
    • /
    • pp.358-366
    • /
    • 2002
  • 특징정보를 기반으로 한 유사 이미지 검색은 이미지 데이타베이스에 있어서 중요한 과제의 하나이다. 이미지 데이타의 특징정보는 각 이미지를 식별하는데 유용한 정보이다. 본 논문에서는 자기 조직화 맵 기반의 고속 k-NN 탐색 알고리즘을 제안한다. 자기 조직화 맵은 고차원 특징벡터를 2차원 공간에 맵핑하여 위상특징 맵을 생성한다. 위상특징 맵은 입력 데이타의 특징공간과 상호관계(유사성)를 가지고 있으며, 인접노드에 서로 유사한 특징벡터가 클러스터링된다. 그러므로 위상특징 맵상의 각 노드에는 노드 벡터와 각 노드벡터에 가장 가까운 유사 이미지가 분류된다. 이러한 자기 조직화 맵에 의한 유사 이미지 분류결과에 대하여 k-NV 탐색을 구현하기 위하여, (1) 위상특징 맵에 대한 접근방법, (2) 고속탐색을 위한 pruning strategy의 적용을 실현하였다. 본 연구에서는 실험을 통하여 실제 이미지로부터 추출한 색상 특징을 사용하여 제안한 알고리즘의 성능을 평가함으로써 유사 이미지 검색에 유효한 견과를 얻을 수 있었다.

정규화된 분산을 이용한 프랙탈 압축방법 (A Fast Fractal Image Compression Using The Normalized Variance)

  • 김종구;함도용;위영철;김하진
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.499-502
    • /
    • 2001
  • 프랙탈 코딩은 높은 압축률을 포함한 여러 가지 장점을 가지고 있으나 유사블록 탐색에 긴 시간이 소요되는 문제점을 가지고 있다. 본 논문은 각 블록의 정규화 된 분산 값은 명도(contrast)와 밝기(brightness)에 독립적임을 발견하고, 이를 이용하여 d(key의 수)차원 공간에서 최근접부근탐색(nearest neighbor search)을 하여 효율적인 유사블록을 탐색하는 방법을 제안한다. 본 방법은 각 치역 블록 당 Ο(log N), (N : 정의역블록 수) 시간에 유사 정의역 블록 찾을 수 있음을 보였다. 압축처리 된 이미지는 각 치역 블록 당 Ο(N) 시간이 요구되는 전체탐색의 PSNR (Peak Signal Noise Ratio)과 거의 같은 값을 얻게 되었다. 또한, 본 방법은 에지가 많은 이미지에도 전체탐색과 거의 유사한 PSNR로 압축되는 장점을 가진다.

  • PDF

특허 정보 검색을 위한 대체어 후보 추출 방법 (Extracting Alternative Word Candidates for Patent Information Search)

  • 백종범;김성민;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.299-303
    • /
    • 2009
  • 특허 정보 검색은 연구 및 기술 개발에 앞서 선행연구의 존재 여부를 확인하기 위한 사전 조사 목적으로 주로 사용된다. 이러한 특히 정보 검색에서 원하는 정보를 얻지 못하는 원인은 다양하다. 그 중에서 본 연구는 키워드 불일치에 의한 정보 누락을 최소화하기 위한 대체어 후보 추출 방법을 제안한다. 본 연구에서 제안하는 대체어 후보 추출 방법은 문장 내에서 함께 쓰이는 단어들이 비슷한 두 단어는 서로 비슷한 의미를 지닐 것이다라는 직관적 가설을 전제로 한다. 이와 같은 가설을 만족하는 대체어를 추출하기 위해서 본 연구에서는 분류별 집중도, 신뢰도를 이용한 연관단어뭉치, 연관단어 뭉치간 코사인 유사도 및 순위 보정 기법을 제안한다. 본 연구에서 제안한 대체어 후보 추출 방법의 성능은 대체어 유형별로 작성된 평가지표를 이용하여 재현율을 측정함으로써 평가하였으며, 제안 방법이 문서 벡터공간 모델의 성능보다 더 우수한 것으로 나타났다.