• 제목/요약/키워드: Map Retrieval

검색결과 117건 처리시간 0.02초

음원 데이터베이스의 효율적 확장을 지원하는 내용 기반 음원 검색 시스템 (A Content-based Audio Retrieval System Supporting Efficient Expansion of Audio Database)

  • 박지훈;강현철
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권5호
    • /
    • pp.811-820
    • /
    • 2017
  • 음원 서비스의 주요 기능 중 하나인 내용 기반 검색을 위해 음원의 지문을 채취하여 데이타베이스에 저장하고 색인하여 검색에 활용하는 기법이 널리 사용되고 있다. 그런데 지속적으로 추가되는 신규 음원의 지문이 기존의 데이타베이스에 계속 삽입되면 공간 효율 및 음원 검색 성능의 저하가 점차 초래되는 문제점이 있다. 따라서 시스템 운용 비용의 증가를 가져오는 주기적인 데이터 베이스 재구성 없이 효율적인 음원 데이타베이스의 확장을 지원하는 기법이 요구된다. 본 논문에서는 샤잠의 지문 채취 알고리즘을 기반으로 클러스터 컴퓨팅 환경에서 맵리듀스 및 NoSQL 데이타베이스를 사용하여 이러한 문제를 해결하는 내용 기반 음원 검색 시스템의 설계를 제시하고 실제 음원 데이터를 이용한 다양한 실험을 통해 그 성능을 평가한다.

주제를 깊이 있게 다루는 블로그 피드 검색을 위한 위키피디아 기반 질의 확장 방법 (A Wikipedia-based Query Expansion Method for In-depth Blog Distillation)

  • 송우상;이예하;이종혁;양기주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권11호
    • /
    • pp.1121-1125
    • /
    • 2010
  • 본 논문에서는 질의로 주어진 주제를 깊이 있게 다루는 블로그 검색을 위한 위키피디아 기반 질의 확장 방법을 제안한다. 제안된 방법은 질의와 연관된 위키피디아 문서를 질의 확장에 사용한다. 실험을 위해 대규모 블로그 실험 데이터인 TREC Blogs08 collection과 영문 위키피디아 데이터를 사용하였다. 실험 결과 제안된 방법은 기존의 블로그 포스트 기반 질의 확장 방법에 비해 MAP을 비롯한 검색 성능을 콘 폭으로 향상시켰다.

PDFindexer: Distributed PDF Indexing system using MapReduce

  • Murtazaev, JAziz;Kihm, Jang-Su;Oh, Sangyoon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제4권1호
    • /
    • pp.13-17
    • /
    • 2012
  • Indexing allows converting raw document collection into easily searchable representation. Web searching by Google or Yahoo provides subsecond response time which is made possible by efficient indexing of web-pages over the entire Web. Indexing process gets challenging when the scale gets bigger. Parallel techniques, such as MapReduce framework can assist in efficient large-scale indexing process. In this paper we propose PDFindexer, system for indexing scientific papers in PDF using MapReduce programming model. Unlike Web search engines, our target domain is scientific papers, which has pre-defined structure, such as title, abstract, sections, references. Our proposed system enables parsing scientific papers in PDF recreating their structure and performing efficient distributed indexing with MapReduce framework in a cluster of nodes. We provide the overview of the system, their components and interactions among them. We discuss some issues related with the design of the system and usage of MapReduce in parsing and indexing of large document collection.

Optimization Driven MapReduce Framework for Indexing and Retrieval of Big Data

  • Abdalla, Hemn Barzan;Ahmed, Awder Mohammed;Al Sibahee, Mustafa A.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권5호
    • /
    • pp.1886-1908
    • /
    • 2020
  • With the technical advances, the amount of big data is increasing day-by-day such that the traditional software tools face a burden in handling them. Additionally, the presence of the imbalance data in big data is a massive concern to the research industry. In order to assure the effective management of big data and to deal with the imbalanced data, this paper proposes a new indexing algorithm for retrieving big data in the MapReduce framework. In mappers, the data clustering is done based on the Sparse Fuzzy-c-means (Sparse FCM) algorithm. The reducer combines the clusters generated by the mapper and again performs data clustering with the Sparse FCM algorithm. The two-level query matching is performed for determining the requested data. The first level query matching is performed for determining the cluster, and the second level query matching is done for accessing the requested data. The ranking of data is performed using the proposed Monarch chaotic whale optimization algorithm (M-CWOA), which is designed by combining Monarch butterfly optimization (MBO) [22] and chaotic whale optimization algorithm (CWOA) [21]. Here, the Parametric Enabled-Similarity Measure (PESM) is adapted for matching the similarities between two datasets. The proposed M-CWOA outperformed other methods with maximal precision of 0.9237, recall of 0.9371, F1-score of 0.9223, respectively.

Saliency Map을 이용한 대표 색상 기반의 영상 검색 (Dominant Color Based Image Retrieval using Saliency Map)

  • 안재현;이상화;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.213-216
    • /
    • 2013
  • 본 논문에서는 객체 위주의 컬러 영상 검색을 위하여 영상의 saliency map을 이용해 객체 중심의 영상을 생성하고, 객체와 그 주변 영역에서의 대표 색상이 가지는 통계적 특성과 공간적 분포 정보를 이용하는 방법을 제안한다. 먼저, 영상의 saliency map을 이진화하여 영상을 객체/배경으로 분할하고 객체를 중심으로 객체/배경의 비율이 일정한 일정 크기의 영상을 생성한다. 생성된 영상에서 대표 색상을 추출하고, 각 색상이 영상에서 어떻게 분포하는가를 나타내는 이진 공간분포 지도를 형성한다. 그 후 영상 간의 대표 색상마다 이진 공간분포의 차이를 비교함으로써, 색상의 통계적 특성과 공간적 분포가 동시에 반영된 특징으로 영상을 검색한다. 본 논문에서 제안한 saliency map을 이용한 대표 색상 기반의 영상 검색 기법은 기존의 대표 색상 기반의 영상 검색보다 우수한 성능을 보여준다.

  • PDF

MapReduce 기반 분산 이미지 특징점 추출을 활용한 빠르고 확장성 있는 이미지 검색 알고리즘 (A Fast and Scalable Image Retrieval Algorithms by Leveraging Distributed Image Feature Extraction on MapReduce)

  • 송환준;이진우;이재길
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1474-1479
    • /
    • 2015
  • IoT 시대를 맞아 모바일 기기의 급격한 성능 향상에 힘입어 폭발적으로 증가하는 멀티미디어 빅데이터의 빠른 처리가 요구되고 있다. 하지만, 이런 환경의 대격변 속에서도 이미지 검색 연구 분야에서는 정확도 향상에 주로 초점을 맞춘 나머지, 고해상도 멀티미디어 데이터 Query에 대한 빠른 처리 측면에서는 제대로 대응하지 못하고 있다. 이에 우리는 이미지 검색만을 분산화한 선행연구와 달리 MapReduce 기반 분산 이미지 특징점 추출 기법을 활용하여 정확도는 유지하면서 빠른 응답시간을 확보하며, BIRCH 인덱싱을 기반으로 메모리 확장성까지 해결한 새로운 분산 이미지 검색 알고리즘을 제안한다. 그리고 제안하는 분산 이미지 검색 알고리즘의 정확도, 처리시간, 확장성에 대한 실험을 통해 뛰어난 성능을 확인한다.

내용 기반 이미지 검색을 위한 개선된 SIM 방법 (Improved SIM Algorithm for Contents-based Image Retrieval)

  • 김광백
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.49-59
    • /
    • 2009
  • 내용기반 이미지 검색은 색상, 질감 등의 이미지 자체의 자질들을 이용하여 검색하므로 텍스트 기반 이미지 검색의 객관성 부족과 모든 이미지에 사람이 주석을 달아야 하는 단점을 보완할 수 있는 이미지 검색 방법이다. 이러한 내용 기반 이미지 검색에서 사용되는 방식 중 SIM(Self-organizing Image browsing Map) 방식은 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑하고 그 결과를 바탕으로 이미지를 검색하게 된다. 하지만 비슷한 이미지라 할지라도 이미지의 밝기, 피사체의 움직임 등에 의하여 색상 정보가 다르게 나타나게 되면 SOM 알고리즘의 학습 과정에서 유사한 이미지들을 그룹화한 노드를 BMU로 선택하지 못하고 떨어져 있는 다른 노드를 선택하게 된다. 이 경우 학습이 진행되면서 유사한 이미지들이 군집하는 과정을 거치지만 학습이 완료될 때까지 다른 유사 이미지들을 그룹화한 노드에 맵핑이 되지 못하는 경우가 발생한다. 그 결과, 검색 결과에 나타나지 못하여 적합 이미지 검색률이 낮아 질 수 있다. 따라서 본 논문에서는 HSV 색상모델을 이용하여 양자화하고 이미지의 색상 특징 벡터를 추출한 뒤 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑한다. 이때 SIM 방식의 문제점인 유사 이미지가 따로 맵핑되어 적합 이미지 검색률이 낮아지는 것을 줄이기 위하여 SOM을 두 개의 층으로 구성한다. 첫 번째 층에서 이미지의 색상 자질을 이용하여 학습을 완료한 후, 학습이 완료된 첫 번째 층 맵의 각 노드들의 연결 가중치를 이용하여 두 번째 층에서 다시 한번 학습을 수행한다. 두 개의 층으로 학습이 완료된 두 번째 층의 SOM에 질의 이미지의 특징 벡터를 입력하여 BMU를 선택하고 BMU와 연결된 첫 번째 층의 노드를 최종 선택하여 이미지를 검색한다. 실험결과, 제안된 이미지 검색 방법이 기존의 이미지 검색 방법 보다 적합 이미지의 검색 성공률이 높은 것을 확인 할 수 있었다.

  • PDF

부분 휘도 변화에 강인한 영상 촬영 기반 콘텐츠 검색 방법 (A Content Retrieval Method Using Pictures Taken from a Display Robust to Partial Luminance Change)

  • 이주영;김연희;남제호
    • 방송공학회논문지
    • /
    • 제16권3호
    • /
    • pp.427-438
    • /
    • 2011
  • 논문에서는 디스플레이 촬영 영상을 기반으로 하는 콘텐츠 검색 방법을 제안한다. 본 논문에서 제안한 알고리즘은 조명 등의 촬영 조건 변화에 영향을 최소화하기 위해 인접 블록 간 휘도의 증감 방향을 표현하는 이진 맵을 이용한다. 또한 본 논문에서 구현한 콘텐츠 검색 시스템은 제안 알고리즘의 효율성을 높이기 위해 스칼라 값을 이용한 인덱스 기반의 2단계 검색을 수행한다. 알고리즘 비교 실험을 통해 제안 알고리즘에 대한 검증을 수행하고 제안 알고리즘을 이용하여 구현한 콘텐츠 검색 시스템을 기술한다.

Information Strategy Planning for Digital Infrastructure Building with Geo-based Nonrenewable Resources Information in Korea: Conceptual Modeling Units

  • Chi, Kwang-Hoon;Yeon, Young-Kwang;Park, No-Wook;Lee, Ki-Won
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.191-196
    • /
    • 2002
  • From this year, KIGAM, one of Korean government-supported research institutes, has started new national program for digital geologic/natural resources infrastructure building. The goal of this program is to prepare digitally oriented infrastructure for practical digital database building, management, and public services of numerous types of paper maps related to geo-scientific resources or geologic thematic map sets: hydro-geologic map, applied geologic map, geo-chemical map, airborne radiometric/magnetic map, coal geologic map and off-shelf bathymetry map and so forth. As for digital infrastructure, several research issues in this topic are composed of: ISP (Information Strategy Planning), geo-framework modeling of each map set, pilot database building, cyber geo-mineral directory service system, and web based geologic information retrieval system upgrade which services Korean digital geologic maps scaled 1:50K. In this study, UML (Unified Modeling Language)-based data modeling of geo-data sets by and in KIGAM, among them, is mainly discussed, and its results are also presented in the viewpoint of digital geo-modeling ISP. It is expected this model is further progressed with the purpose of being a guidance or framework modeling for geologic thematic mapping and practical database building, as well as other types of national thematic map database building.

  • PDF

컬러에지의 벡터적 결합을 이용한 e-카탈로그 영상 검색 (e-Catalogue Image Retrieval Using Vectorial Combination of Color Edge)

  • 황의선;박상근;전준철
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.579-586
    • /
    • 2002
  • 영상의 에지정보를 이용한 내용기반 영상 검색 방법은 현재 MPEG-7(Moving Picture Experts Group) 에서 제안된 에지 서술자(edge descriptor)가 대표적인 방법이며, 이때 사용된 에지의 정보는 영상의 명암도에 따른 에지히스토그램을 이용하고 있다. 본 논문에서는 새로운 컬러 에지 추출 방법을 제시하고, 제안된 방법에 의해 컬러 에지히스토그램을 특징 값으로 하는 내용기반 영상검색 방법을 제시하였다. 아울러 제안된 방법에 기반하여 인터넷 쇼핑몰에서 사용되는 e-카탈로그 상품 영상 검색에 적용하였다. 성능평가를 위하여 기존 MPEG-7에서 제시된 에지히스토그램에 의한 영상검색 방법과 비교하여 보았으며 실험결과 제안된 방법이 검색에 있어서 우수함을 입증할 수 있었다. 컬러에지의 추출은 컬러 영상의 R,G,B 채널의 각 성분의 벡터적 결합방법과 에지 맵의 벡터 노름(norm) 특성화를 통하여 이루어진다. 결과적으로 내용기반 영상 검색은 생성된 최종 에지모델이 갖는 에지의 방향성을 이용한 컬러 에지히스토그램을 통하여 수행된다.