• 제목/요약/키워드: 분산 데이터 색인

검색결과 48건 처리시간 0.05초

투영벡터의 통계적성질을 이용한 영상 검색 (Image Retrieval using Statistical Property of Projection Vector)

  • 권동현;김용훈;배성포;이태홍
    • 한국통신학회논문지
    • /
    • 제25권7A호
    • /
    • pp.1044-1049
    • /
    • 2000
  • 영상의 특징을 나타내는 방법의 하나인 투영은 영상의 근사화된 형상 및 위치 정보 등의 많은 유용한 정보를 포함하고 있다. 그러나 투영을 영상 검색을 위한 방법으로 사용할 경우, 사용되는 색인 데이터 량이 많고, 에디터 베이스의 영상 크기에 따라 토영된 벡터의 길이가 달라진다는 단점이 있다. 이에 본 논문에서는 투영기법이 안고 있는 이러한 문제점을 극복하는 방법으로 데이터베이스 영상을 투영한 후 투영 벡터의 국부화를 통하여 영상의 지역적 특성이 반영되도록 하였으며, 색인 데이터 량을 주리기 위하여 투영된 벡터의 분산 값을 색인 데이터로 활용하였다. 제안된 방법은 검색 시 투영 기법의 장점을 수용함과 동시에 영상의 통계적 특성을 활용할 수 있을 뿐 아니라 시스템 구현 시 질의 시간 내에 응답을 얻을 수 있다는 이점이 있다.

  • PDF

LBS를 위한 이동객체의 분산관리 시스템설계 (The Distributed Management System of Moving Objects for LBS)

  • 장인성;조대수;박종현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1847-1850
    • /
    • 2002
  • 최근에 이동통신기술의 발전과 무선인터넷 사용자의 급증 및 휴대 단말기 장치의 성능 향상으로 인하여 사용자의 위치 정보를 활용하여 부가 정보 서비스를 받을 수 있는 위치기반서비스(LBS Location Based Service)에 대한 관심이 급증하고 있다. 위치기반 서비스를 제공하기 위해서는 사용자의 위치정보를 관리하는 이동체 데이터베이스가 필수적으로 요구된다. 친구 찾기 서비스와 같은 초기 단계의 LBS 서비스에서는 현재위치만을 가지고 서비스할 수 있지만, 데이터 마이닝이나 CRM등과 같이 연동된 고급 서비스를 제공하기 위해서는 시시각각 변화는 사용자의 현재 위치정보뿐 아니라 과거위치정보를 관리할 수 있어야 한다. 본 논문에서는 이동체 데이터 베이스의 구성요소 중 대용량의 위치정보를 저장 및 검색하기 위한 분산 관리 시스템을 설계하고자 한다. 분산 관리 시스템은 현재위치 관리 컴포넌트와 과거위치 관리 컴포넌트, 분산위치관리 컴포넌트로 구성된다. 현재 위치 관리 컴포넌트와 과거위치 관리 컴포넌트는 공간색인을 제공하므로 데이터 검색의 성능을 향상시키고, 분산위치 관리 컴포넌트는 대용량의 데이터를 다양한 데이터베이스에 분산 저장 및 검색하므로 과부하를 조절하고 대용량의 위치정보를 효율적으로 관리하고자 한다.

  • PDF

대용량 멀티미디어 데이터의 내용 기반 검색을 위한 고확장 지원 색인 기법 (A Scalable Index for Content-based Retrieval of Large Scale Multimedia Data)

  • 최현화;이미영;이규철
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.726-730
    • /
    • 2009
  • 카메라 기술의 발전 및 사용자 중심의 인터넷 패러다임인 웹 2.0을 토대로 멀티미디어 데이터가 급증하면서, 멀티미디어 검색은 인터넷 서비스로서 그 중요성이 날로 증가되고 있다. 현재 멀티미디어 검색은 단순한 키워드(keyword) 검색에 의존하고 있는 실정으로, 정보 검색의 정확도 및 사용자의 만족도를 충족시키기 위해서는 내용 기반 검색 지원이 필요하다. 본 논문에서는 대용량의 멀티미디어 데이터의 내용 기반 검색을 지원하기 위하여, 데이터의 분포에 따른 다중 길이의 시그니처를 기반으로 한 새로운 분산 인덱스 구조를 제안한다. 제안하는 인덱스 구조는 고차원 데이터의 클러스터링에 따라 데이터의 분포를 분석하여 서로 다른 요약 파일을 분산 생성하고, 이를 기반으로 유사 검색을 병렬로 수행할 수 있도록 설계되었다. 그리하여, 클러스터 환경 하에서 고차원 데이터의 분산 저장이 용이하고, 각 노드들은 서로 다른 시그니처 파일을 기반으로 검색을 병렬 수행함으로써 효율적인 검색을 지원한다.

  • PDF

클러스터링 데이터베이스에서 온라인 확장을 고려한 $CSB^+$ 트리 색인의 온라인 재구성 기법 (Online Scaling Consious Online Reorganization of $CSB^+$ tree Index in a Database Cluster)

  • 심태정;이충호;이순조;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.196-198
    • /
    • 2002
  • 클러스터링 데이터베이스는 높은 가용성과 확장성을 갖으며, 예상치 못한 클라이언트 질의의 증가나 질의 패턴의 변경에 따른 작업부하의 편중에 효율적으로 대처할 수 있는 구조이다. 특히 온라인 확장 기법은 트랜잭션 처리를 중지하지 않고 새로운 노드를 클러스터에 추가하여 데이터를 재구성함으로써 임의의 노드에 질의가 집중되는 문제를 해결할 수 있다. 정적으로 구성된 시스템만으로는 두 대 이상의 서버에 작업량이 집중될 경우 재배치 시 서버 간의 데이터 이동의 반복 현상이 발생되며. 이로 인해 네트웍의 부하와 함께 실시간 트랜적션의 처리에 있어서 응답 시간이 지연되는 문제점이 발생한다. 따라서 본 논문에서는 데이터 이동의 반복 현상을 해결하기 위해 클러스터링 데이터베이스에서 온라인 확장을 고려한 CSB+ 트리 색인의 온라인 재구성 기법을 제안한다. 제안된 기법은 온라인 확장을 통한 동구 노드의 확장으로 데이터 이동의 반복을 막고 새롭게 추가된 노드를 통해 빠르고 효율적인 데이터의 분산을 수행한다 또한 각 시스템의 내부를 CS$B^{+}$ 트리로 구성하여 데이터의 재주성시에도 실시간 트랜잭션에 대한 빠른 응답 시간을 보장한다.

  • PDF

Hadoop 클라우드 기반 관계형 데이터 웨어하우스 시스템에서 이진 검색 트리 기반 색인의 구현 (An Implementation of a BST Index on a Relational Data Warehouse System based on Hadoop Cloud)

  • 류효석;최현식;손지훈;정연돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.10-12
    • /
    • 2012
  • 클라우드를 기반으로 한 대용량 데이터의 처리 및 분석의 요구가 커지면서, 대용량 관계형 데이터에 대한 분산 처리의 수요 또한 증가하고 있다. 본 논문은 HDFS를 사용하는 관계형 저장 시스템에서 대용량 데이터를 효율적으로 처리하기 위해 개발한 BST 기반 색인에 대해 설명한다.

도로 환경에서 센서 네트워크를 이용한 효율적인 양방향 선형 브로드캐스트 색인 기법 (Efficient Bidirectional linear Broadcast Indexing with Sensor Networks in road environments)

  • 강수;황동교;성동욱;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.57-60
    • /
    • 2011
  • 도로 환경에서 이동하는 객체에 효율적인 위치기반 서비스를 제공하기 위해 다양한 브로드캐스트 기법들이 연구 되어 왔다. 하지만 실시간으로 변하는 도로 환경을 고려한 효율적인 브로드캐스트 기법이 요구되고 있다. 본 논문에서는 도로 특성을 고려한 양방향 선형 브로드캐스트 색인 구조를 제안하고, 빈번하게 변화하는 도로 환경을 고려하여 센서 네트워크를 통해 수집되는 도로 정보를 기반으로 최적의 QoS(Quality of Service)를 유지시키는 브로드캐스트 전략 갱신 기법을 제안한다. 또한 질의 처리 속도 향상을 위해 서비스 지역을 센서 클러스터 기반의 지역 세그먼트로 분할하여 불필요한 데이터의 브로드캐스트를 제거하는 분산 브로드캐스트 서비스 구조를 제안한다. 제안하는 기법의 우수성을 증명하기 위해 기존에 제안된 브로드캐스트 기법과 성능을 비교 평가한다.

멀티미디어 컨텐츠의 지능형 선택/검색 시스템 구현 (Korea Electronic Technology Institute)

  • 이종설;이윤주;박우출;정하중;조위덕
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.61-63
    • /
    • 2002
  • 멀티미디어 컨텐츠의 지능형 선택/검색 시스템(MISS: Multimedia Content Intelligent Selection/search) 는 콘텐츠를 공급하는 서버에 다량의 멀티미디어 컨텐츠들이 존재하며, 이 컨텐츠 중에서 원하는 것을 검색, 선택하는 시스템이다. 지능적 검색, 선택기능을 갖는 MISS 시스템은 인터넷 및 네트워크상에 연결된 시스템들간의 맞춤형 서비스 구현에 필요한 핵심이며, 모든 종류의 멀티미디어 콘텐츠에 적용 가능하다. 현재 WWW 서비스경우는 정보를 찾기 위하여 웹상에서 문서를 찾아주는 텍스트 기반 정보검색기술이 사용되고 있는데, 점점 우리가 접하는 정보의 형태는 텍스트와 함께 화상, 음성, 동영상 등의 멀티미디어화 및 디지털화하고 있다. 사용자들에게는 멀티미디어 데이터를 효과적으로 찾아야 하는 필요성이 증가하고 이에 따라 방대한 양의 분산된 멀티미디어 데이터를 처리할 수 있는 색인 및 검색 도구의 요구가 커지게 되었다. MISS 시스템은 WWW 서비스의 요구에도 적용될 수 있다. MISS 시스템은 다량의 동영상 콘텐츠 중에서 특정 배우, 감독등의 여러 가지 검색 조건으로 콘텐츠를 검색/선택할 수 있고, 하나의 동영상 콘텐츠 내에서 특정Video Segment를 검색할 수 있다. 본 MISS 시스템은 동영상에 대한 Search/Query를 위한DS 구조로써 MPEG-7의 User preference metadata를 이용하였다.

  • PDF

대용량 위치 데이터에서 효율적인 k-최근접 질의 처리 기법 (Efficient k-Nearest Neighbor Query Processing Method for a Large Location Data)

  • 최도진;임종태;유승훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제17권8호
    • /
    • pp.619-630
    • /
    • 2017
  • 스마트 기기의 대중화로 다양한 위치 기반 서비스가 제공되고 있다. 최근에는 소셜 서비스와 결합한 위치 기반 소셜 서비스들이 생겨나고 있다. 이러한 위치 기반 소셜 네트워크 서비스에서는 사용자 중심의 가장 가까운 위치를 검색하는 k-최근접 질의 처리의 요구가 증가된다. 본 논문에서는 대규모 사용자 환경에서 질의를 효율적으로 처리하기 위한 근사 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 빅데이터 분산 처리기술을 활용하여 효율적인 스트림 처리를 수행한다. 본 논문에서는 대량의 위치 데이터에 대한 색인을 위해 전통적인 그리드 색인 기법을 변형한 색인 기법을 제안한다. 제안하는 질의 처리기법은 사용자의 진행방향을 고려하여 해당 셀을 우선적으로 탐색한다. 이를 통해 k개의 근사 결과 집합을 생성할 수 있다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과 다양한 성능 평가를 수행한다.

단일머신 환경에서의 논리적 프로그래밍 방식 기반 대용량 RDFS 추론 기법 (Scalable RDFS Reasoning using Logic Programming Approach in a Single Machine)

  • 바트셀렘 작바랄;김제민;이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.762-773
    • /
    • 2014
  • 시맨틱 웹상에서 RDFS로 표현된 데이터의 사용 증가로 인하여, 대용량 데이터의 추론에 대한 많은 요구가 생겨나고 있다. 많은 연구자들은 대용량 온톨로지 추론을 수행하기 위해서 하둡과 같은 고가의 분산 프레임워크를 활용한다. 그러나, 적절한 사이즈의 RDFS 트리플 추론을 위해서는 굳이 고가의 분산 환경 시스템을 사용하지 않고 단일 머신에서도 논리적 프로그래밍을 이용하면 분산 환경과 유사한 추론 성능을 얻을 수 있다. 본 논문에서는 단일 머신에 논리적 프로그래밍 방식을 적용한 대용량 RDFS 추론 기법을 제안하였고 다중 머신을 기반으로 한 분산 환경 시스템과 비교하여 2억개 정도의 트리플에 대한 RDFS 추론 시스템을 적용한 경우 분산환경과 비슷한 성능을 보이는 것을 실험적으로 증명하였다. 효율적인 추론을 위해 온톨로지 모델을 세부적으로 분리한 메타데이터 구조와 대용량 트리플의 색인 방안을 제안하고 이를 위해서 전체 트리플을 하나의 모델로 로딩하는 것이 아니라 각각 온톨로지 추론 규칙에 따라 적절한 트리플 집합을 선택하였다. 또한 논리 프로그래밍이 제공하는 Unification 알고리즘 기반의 트리플 매칭, 검색, Conjunctive 질의어 처리 기반을 활용하는 온톨로지 추론 방식을 제안한다. 제안된 기법이 적용된 추론 엔진을 LUBM1500(트리플 수 2억개) 에 대해서 실험한 결과 166K/sec의 추론 성능을 얻었는데 이는 8개의 노드(8 코아/노드)환경에서 맵-리듀스로 수행한 WebPIE의 185K/sec의 추론 속도와 유사함을 실험적으로 증명하였다. 따라서 단일 머신에서 수행되는 본 연구 결과는 트리플의 수가 2억개 정도까지는 분산환경시스템을 활용하지 않고도 분산환경 시스템과 비교해서 비슷한 성능을 보이는 것을 확인할 수 있었다.

EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법 (EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System)

  • 이춘근;김정원;김영주;정기동
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2294-2304
    • /
    • 1999
  • 본 논문은 병렬 입출력과 효율적인 디스크 접근을 이용하여 입출력 성능을 높임으로써 지리 정보 시스템의 질의 처리 성능을 향상시키는 것을 목적으로 한다. 동시에 접근할 가능성이 높은 인접한 공간 데이터를 디스크의 논리적 블록 단위로 패킹하여 하나 또는 연속적인 논리적 블록으로 클러스터링 하면 한번의 디스크 접근으로 많은 공간 데이터를 읽을 수 있어 질의 처리에 따른 디스크 접근 횟수와 디스크 접근 오버 헤드를 줄임으로써 입출력 시간을 줄일 수 있다. 본 논문에서는 기존 Parallel R-tree 기법의 병렬 입출력 기법과 패킹 기반 클러스터링 기법을 결합하여 효율적인 입출력을 지원하는 EPR(Enhanced Parallel R-tree) 색인 기법을 제안한다. EPR 기법의 주요 특징은 다음과 같다. 첫째, 공간 데이터를 Hilbert space filling curve를 이용하여 인접도에 따라 정렬하여 패킹함으로써 상향식으로 R-tree를 생성한다. 둘째, 정렬된 공간 데이터를 패킹하여 하나 또는 연속적인 논리적 블록에 저장하는 패킹 기반 클러스터링을 통해 공간 데이터 클러스터를 구성한다. 셋째, 색인 기법 및 공간 데이터 클러스터를 round-robin 스트라이핑 방식을 통해 다중 디스크에 분산 배치한다. EPR 기법과 기존 PR 기법의 성능을 비교한 결과, 공간 질의 처리 속도가 30% 이상 향상되었으며, 특히 논리적 블록의 크기가 클수록, 공간 데이터의 크기가 작을수록 질의 처리 성능이 향상되는 결과를 보였다.

  • PDF