• Title/Summary/Keyword: 분산 데이터 색인

Search Result 48, Processing Time 0.024 seconds

Image Retrieval using Statistical Property of Projection Vector (투영벡터의 통계적성질을 이용한 영상 검색)

  • 권동현;김용훈;배성포;이태홍
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.7A
    • /
    • pp.1044-1049
    • /
    • 2000
  • Projection that can be used as a feature for image representation, includes much available informations such as approximated shape and location. But when we retrieve image using it, there are some disadvantage such as requiring much index data and making different length of projected vector for differenr image size. In order to overcome these problems, we propose a method of using block variance for the projected vector. We use block variance of the projection vector to localize the characteristics of image and to reduce the number of index data in database. Proposed algorithm can make use of statistical advantage through database including various size of images and be executed with fast response time in implementation.

  • PDF

The Distributed Management System of Moving Objects for LBS (LBS를 위한 이동객체의 분산관리 시스템설계)

  • Jang, In-Sung;Cho, Dae-Soo;Park, Jong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1847-1850
    • /
    • 2002
  • 최근에 이동통신기술의 발전과 무선인터넷 사용자의 급증 및 휴대 단말기 장치의 성능 향상으로 인하여 사용자의 위치 정보를 활용하여 부가 정보 서비스를 받을 수 있는 위치기반서비스(LBS Location Based Service)에 대한 관심이 급증하고 있다. 위치기반 서비스를 제공하기 위해서는 사용자의 위치정보를 관리하는 이동체 데이터베이스가 필수적으로 요구된다. 친구 찾기 서비스와 같은 초기 단계의 LBS 서비스에서는 현재위치만을 가지고 서비스할 수 있지만, 데이터 마이닝이나 CRM등과 같이 연동된 고급 서비스를 제공하기 위해서는 시시각각 변화는 사용자의 현재 위치정보뿐 아니라 과거위치정보를 관리할 수 있어야 한다. 본 논문에서는 이동체 데이터 베이스의 구성요소 중 대용량의 위치정보를 저장 및 검색하기 위한 분산 관리 시스템을 설계하고자 한다. 분산 관리 시스템은 현재위치 관리 컴포넌트와 과거위치 관리 컴포넌트, 분산위치관리 컴포넌트로 구성된다. 현재 위치 관리 컴포넌트와 과거위치 관리 컴포넌트는 공간색인을 제공하므로 데이터 검색의 성능을 향상시키고, 분산위치 관리 컴포넌트는 대용량의 데이터를 다양한 데이터베이스에 분산 저장 및 검색하므로 과부하를 조절하고 대용량의 위치정보를 효율적으로 관리하고자 한다.

  • PDF

A Scalable Index for Content-based Retrieval of Large Scale Multimedia Data (대용량 멀티미디어 데이터의 내용 기반 검색을 위한 고확장 지원 색인 기법)

  • Choi, Hyun-HWa;Lee, Mi-Young;Lee, Kyu-Chul
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.726-730
    • /
    • 2009
  • The proliferation of the web and digital photography has drastically increased multimedia data and has resulted in the need of the high quality internet service based on the moving picture like user generated contents(UGC). The keyword-based search on large scale images and video collections is too expensive and requires much manual intervention. Therefore the web search engine may provide the content-based retrieval on the multimedia data for search accuracy and customer satisfaction. In this paper, we propose a novel distributed index structure based on multiple length signature files according to data distribution. In addition, we describe how our scalable index technique can be used to find the nearest neighbors in the cluster environments.

  • PDF

Online Scaling Consious Online Reorganization of $CSB^+$ tree Index in a Database Cluster (클러스터링 데이터베이스에서 온라인 확장을 고려한 $CSB^+$ 트리 색인의 온라인 재구성 기법)

  • 심태정;이충호;이순조;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.196-198
    • /
    • 2002
  • 클러스터링 데이터베이스는 높은 가용성과 확장성을 갖으며, 예상치 못한 클라이언트 질의의 증가나 질의 패턴의 변경에 따른 작업부하의 편중에 효율적으로 대처할 수 있는 구조이다. 특히 온라인 확장 기법은 트랜잭션 처리를 중지하지 않고 새로운 노드를 클러스터에 추가하여 데이터를 재구성함으로써 임의의 노드에 질의가 집중되는 문제를 해결할 수 있다. 정적으로 구성된 시스템만으로는 두 대 이상의 서버에 작업량이 집중될 경우 재배치 시 서버 간의 데이터 이동의 반복 현상이 발생되며. 이로 인해 네트웍의 부하와 함께 실시간 트랜적션의 처리에 있어서 응답 시간이 지연되는 문제점이 발생한다. 따라서 본 논문에서는 데이터 이동의 반복 현상을 해결하기 위해 클러스터링 데이터베이스에서 온라인 확장을 고려한 CSB+ 트리 색인의 온라인 재구성 기법을 제안한다. 제안된 기법은 온라인 확장을 통한 동구 노드의 확장으로 데이터 이동의 반복을 막고 새롭게 추가된 노드를 통해 빠르고 효율적인 데이터의 분산을 수행한다 또한 각 시스템의 내부를 CS$B^{+}$ 트리로 구성하여 데이터의 재주성시에도 실시간 트랜잭션에 대한 빠른 응답 시간을 보장한다.

  • PDF

An Implementation of a BST Index on a Relational Data Warehouse System based on Hadoop Cloud (Hadoop 클라우드 기반 관계형 데이터 웨어하우스 시스템에서 이진 검색 트리 기반 색인의 구현)

  • Ryu, Hyo-Seok;Choi, Hyun-Sik;Son, Ji-Hoon;Chung, Yon-Don
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.10-12
    • /
    • 2012
  • 클라우드를 기반으로 한 대용량 데이터의 처리 및 분석의 요구가 커지면서, 대용량 관계형 데이터에 대한 분산 처리의 수요 또한 증가하고 있다. 본 논문은 HDFS를 사용하는 관계형 저장 시스템에서 대용량 데이터를 효율적으로 처리하기 위해 개발한 BST 기반 색인에 대해 설명한다.

Efficient Bidirectional linear Broadcast Indexing with Sensor Networks in road environments (도로 환경에서 센서 네트워크를 이용한 효율적인 양방향 선형 브로드캐스트 색인 기법)

  • Kang, Soo;Hwang, Dong-Kyo;Seong, Dong-Ook;You, Jae-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.57-60
    • /
    • 2011
  • 도로 환경에서 이동하는 객체에 효율적인 위치기반 서비스를 제공하기 위해 다양한 브로드캐스트 기법들이 연구 되어 왔다. 하지만 실시간으로 변하는 도로 환경을 고려한 효율적인 브로드캐스트 기법이 요구되고 있다. 본 논문에서는 도로 특성을 고려한 양방향 선형 브로드캐스트 색인 구조를 제안하고, 빈번하게 변화하는 도로 환경을 고려하여 센서 네트워크를 통해 수집되는 도로 정보를 기반으로 최적의 QoS(Quality of Service)를 유지시키는 브로드캐스트 전략 갱신 기법을 제안한다. 또한 질의 처리 속도 향상을 위해 서비스 지역을 센서 클러스터 기반의 지역 세그먼트로 분할하여 불필요한 데이터의 브로드캐스트를 제거하는 분산 브로드캐스트 서비스 구조를 제안한다. 제안하는 기법의 우수성을 증명하기 위해 기존에 제안된 브로드캐스트 기법과 성능을 비교 평가한다.

Korea Electronic Technology Institute (멀티미디어 컨텐츠의 지능형 선택/검색 시스템 구현)

  • 이종설;이윤주;박우출;정하중;조위덕
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.61-63
    • /
    • 2002
  • 멀티미디어 컨텐츠의 지능형 선택/검색 시스템(MISS: Multimedia Content Intelligent Selection/search) 는 콘텐츠를 공급하는 서버에 다량의 멀티미디어 컨텐츠들이 존재하며, 이 컨텐츠 중에서 원하는 것을 검색, 선택하는 시스템이다. 지능적 검색, 선택기능을 갖는 MISS 시스템은 인터넷 및 네트워크상에 연결된 시스템들간의 맞춤형 서비스 구현에 필요한 핵심이며, 모든 종류의 멀티미디어 콘텐츠에 적용 가능하다. 현재 WWW 서비스경우는 정보를 찾기 위하여 웹상에서 문서를 찾아주는 텍스트 기반 정보검색기술이 사용되고 있는데, 점점 우리가 접하는 정보의 형태는 텍스트와 함께 화상, 음성, 동영상 등의 멀티미디어화 및 디지털화하고 있다. 사용자들에게는 멀티미디어 데이터를 효과적으로 찾아야 하는 필요성이 증가하고 이에 따라 방대한 양의 분산된 멀티미디어 데이터를 처리할 수 있는 색인 및 검색 도구의 요구가 커지게 되었다. MISS 시스템은 WWW 서비스의 요구에도 적용될 수 있다. MISS 시스템은 다량의 동영상 콘텐츠 중에서 특정 배우, 감독등의 여러 가지 검색 조건으로 콘텐츠를 검색/선택할 수 있고, 하나의 동영상 콘텐츠 내에서 특정Video Segment를 검색할 수 있다. 본 MISS 시스템은 동영상에 대한 Search/Query를 위한DS 구조로써 MPEG-7의 User preference metadata를 이용하였다.

  • PDF

Efficient k-Nearest Neighbor Query Processing Method for a Large Location Data (대용량 위치 데이터에서 효율적인 k-최근접 질의 처리 기법)

  • Choi, Dojin;Lim, Jongtae;Yoo, Seunghun;Bok, Kyoungsoo;Yoo, Jaesoo
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.8
    • /
    • pp.619-630
    • /
    • 2017
  • With the growing popularity of smart devices, various location based services have been providing to users. Recently, some location based social applications that combine social services and location based services have been emerged. The demands of a k-nearest neighbors(k-NN) query which finds k closest locations from a user location are increased in the location based social network services. In this paper, we propose an approximate k-NN query processing method for fast response time in a large number of users environments. The proposed method performs efficient stream processing using big data distributed processing technologies. In this paper, we also propose a modified grid index method for indexing a large amount of location data. The proposed query processing method first retrieves the related cells by considering a user movement. By doing so, it can make an approximate k results set. In order to show the superiority of the proposed method, we conduct various performance evaluations with the existing method.

Scalable RDFS Reasoning using Logic Programming Approach in a Single Machine (단일머신 환경에서의 논리적 프로그래밍 방식 기반 대용량 RDFS 추론 기법)

  • Jagvaral, Batselem;Kim, Jemin;Lee, Wan-Gon;Park, Young-Tack
    • Journal of KIISE
    • /
    • v.41 no.10
    • /
    • pp.762-773
    • /
    • 2014
  • As the web of data is increasingly producing large RDFS datasets, it becomes essential in building scalable reasoning engines over large triples. There have been many researches used expensive distributed framework, such as Hadoop, to reason over large RDFS triples. However, in many cases we are required to handle millions of triples. In such cases, it is not necessary to deploy expensive distributed systems because logic program based reasoners in a single machine can produce similar reasoning performances with that of distributed reasoner using Hadoop. In this paper, we propose a scalable RDFS reasoner using logical programming methods in a single machine and compare our empirical results with that of distributed systems. We show that our logic programming based reasoner using a single machine performs as similar as expensive distributed reasoner does up to 200 million RDFS triples. In addition, we designed a meta data structure by decomposing the ontology triples into separate sectors. Instead of loading all the triples into a single model, we selected an appropriate subset of the triples for each ontology reasoning rule. Unification makes it easy to handle conjunctive queries for RDFS schema reasoning, therefore, we have designed and implemented RDFS axioms using logic programming unifications and efficient conjunctive query handling mechanisms. The throughputs of our approach reached to 166K Triples/sec over LUBM1500 with 200 million triples. It is comparable to that of WebPIE, distributed reasoner using Hadoop and Map Reduce, which performs 185K Triples/sec. We show that it is unnecessary to use the distributed system up to 200 million triples and the performance of logic programming based reasoner in a single machine becomes comparable with that of expensive distributed reasoner which employs Hadoop framework.

EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System (EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법)

  • Lee, Chun-Geun;Kim, Jeong-Won;Kim, Yeong-Ju;Jeong, Gi-Dong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.9
    • /
    • pp.2294-2304
    • /
    • 1999
  • Our research purpose in this paper is to improve the performance of query processing in GIS(Geographic Information System) by enhancing the I/O performance exploiting parallel I/O and efficient disk access. By packing adjacent spatial data, which are very likely to be referenced concurrently, into one block or continuous disk blocks, the number of disk accesses and the disk access overhead for query processing can be decreased, and this eventually leads to the I/O time decrease. So, in this paper, we proposes EPR(Enhanced Parallel R-tree) indexing method which integrates the parallel I/O method of the previous Parallel R-tree method and a packing-based clustering method. The major characteristics of EPR method are as follows. First, EPR method arranges spatial data in the increasing order of proximity by using Hilbert space filling curve, and builds a packed R-tree by bottom-up manner. Second, with packing-based clustering in which arranged spatial data are clustered into continuous disk blocks, EPR method generates spatial data clusters. Third, EPR method distributes EPR index nodes and spatial data clusters on multiple disks through round-robin striping. Experimental results show that EPR method achieves up to 30% or more gains over PR method in query processing speed. In particular, the larger the size of disk blocks is and the smaller the size of spatial data objects is, the better the performance of query processing by EPR method is.

  • PDF