• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.029초

이동체 데이타베이스를 위한 통합 색인의 설계 및 구현 (Design and Implementation of Unified Index for Moving Objects Databases)

  • 박재관;안경환;정지원;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.271-281
    • /
    • 2006
  • 최근 PDA, 휴대폰, 노트북, GPS, RFID와 같은 모바일 장치의 발달과 범용적인 사용으로 위치 기반 서비스(LBS: Location Based Service)에 대한 요구가 점점 증대되고 있다. 위치 기반 서비스의 핵심 기술로는 이동체의 위치를 저장 및 관리하기 위한 이동체 데이타베이스를 들 수 있다. 이러한 데이타베이스는 이동체 정보를 빠르게 검색하기 위해 색인을 필요로 하며, 이 색인은 다수의 이동체에 의해 갱신되는 업데이트를 관리하고 실시간으로 위치를 추적할 수 있어야 한다. 따라서 이동체 데이터베이스를 위한 색인은 실시간 처리를 위해서 메인 메모리에서 동작하는 색인의 구조를 가져야 하며, 다수 이동체의 위치 정보를 관리하기 위해 색인의 일부분을 메모리에서 디스크로 이동하거나 디스크에서 메모리로 로딩하는 기법을 지원해야 한다. 이 논문에서는 이러한 색인의 요구 조건을 충족시키기 위해서 메인 메모리와 디스크를 연동하는 통합색인 기법과 메모리 공간 부족 시에 색인의 일부를 디스크로 이동시키는 이주 정책들을 제시하였다 이주 정책은 디스크 I/O를 줄이기 위해 노드 단위가 아닌 서브트리 단위로 이동하도록 함으로써, 벌크 연산 및 동적 클러스터링의 효과를 얻게 된다. 통합 색인은 이주 정책에 따라 다른 형태로 구성될 수 있으며, 본 논문에서는 Oldest Node 정책과 LRU Buffer 정책을 적용하였다. 또한 통합 색인을 구현하고, 각 이주 정책 별로 실험 평가를 수행하여 성능을 측정하였다

이동객체의 현재 위치정보 관리를 위한 셀 기반 색인 기법 (A Cell-based Indexing for Managing Current Location Information of Moving Objects)

  • 이응재;이양구;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1221-1230
    • /
    • 2004
  • 모바일 환경에서 정보 제공 및 처리의 대상이 되는 사람, 자동차, 비행기 둥과 같은 이동객체는 시간이 경과함에 따라 끊임없이 자신의 위치를 변경하는 특징을 가지며, 이러한 정보들을 데이터베이스에서 효과적으로 처리하기 위해서는 연속적인 위치 변경을 수용할 수 있는 저장공간과 색인 유지 및 관리 기술이 필요하다. 기존의 색인 기법들은 색인의 유지 성능보다 질의 처리 능력을 향상시키는데 노력을 기울여 왔기 때문에 복잡하게 이동하며 매우 빈번하게 위치 정보를 갱신하는 이동객체 정보를 관리하기 어렵다. 이 논문에서는 질의 처리 성능뿐만 아니라 이동객체의 빈번한 위치 갱신을 효율적으로 처리하기 위해 고정 그리드 방식의 색인과 R-Tree의 장점을 결합한 ACAR-Tree(Adaptive Cell index with Auxiliary R-Tree)를 제안한다. 제안된 ACAR-Tree는 R-Tree에서 색인의 재구성으로 인하여 갱신 성능이 저하되는 단점을 보완하기 위하여 고정 그리드 방법의 셀 기반의 색인 방법을 기초로 한다. 또한 고정 그리드 방법에서의 데이터 분포가 편중되었을 경우의 색인 성능저하 문제를 해결하기 위하여, 셀과 버켓이 1 : 1로 매핑되는 셀에서 오버플로가 발생하였을 경우 해당 버켓이 부가적인 색인 구조인 보조R-Tree로 전환하여 처리한다. 제안된 방법을 다양한 데이터 분포 및 데이터 크기에서 실험한 결과, 기존의 R-Tree 기반의 색인 방법과 비교하여 색인의 크기가 크게 감소하였으며, 질의 및 갱신 성능에 대해서도 뛰어난 성능을 보였다.

다차원 데이터 및 동적 이용자 선호도를 위한 색인 구조의 연구 (An Index Structure for Efficiently Handling Dynamic User Preferences and Multidimensional Data)

  • 최종혁;류관희;나스리디노프 아지즈
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권7호
    • /
    • pp.925-934
    • /
    • 2017
  • 다차원 색인 구조 중 대표적인 것은 R-tree에 기초한 색인으로써 공간 정보 등에 있어 강력한 성능을 보인다. 하지만 R-tree의 경우 차원의 수가 증가하거나 이용자 선호에 따라 부분 차원만을 이용하는 경우, 색인을 생성하는 시간이 크게 증가하고 생성된 색인의 효율성이 감소하는 문제를 갖고 있다. 따라서 지속적으로 차원이 증가하고 있는 최근의 다차원 데이터에는 해당 방법들은 적합하지 않다. 본 논문에서는 이런 문제를 해결하기 위해 해시 색인에 기반한 새로운 다차원 색인 구조인 다차원 해시 색인을 제안한다. 다차원 해시 색인은 해시 함수를 통해 데이터들을 유클리드 공간의 버킷들로 분류하여 색인을 생성하고 이후 탐색이 요청되었을 때 이용자 선호도에 따라 선택된 부분 차원의 공간을 탐색할 수 있는 해시 탐색 트리를 생성하여 효과적인 탐색을 수행한다. 실험 결과, 해당 기법은 R-tree와 비교하여 색인 생성에 있어 매우 큰 성능의 향상과 함께 탐색에서도 유사한 탐색 성능을 보이는 것을 확인할 수 있었다.

GMS: 공간 데이터베이스 관리 시스템 (GMS: Spatial Database Management System)

  • 박상근;박순영;정원일;김명근;배해영
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.217-224
    • /
    • 2003
  • 전통적인 관계형 데이터베이스 시스템에서 관리되고 있는 일반적인 데이터가 아닌 점, 선, 다각형 등의 다양한 공간 데이터를 관리하기 위해서는 확장된 형태의 공간데이터 타입 및 대용량성과 다양한 접근 패턴을 지니는 공간데이터의 특성을 고려한 새로운 데이터베이스 관리 시스템이 요구된다. 본 논문에서는 이와 같은 공간데이터의 특성을 고려한 저장 기법과 공간질의 처리기법을 제공하는 공간 데이터베1이스 관리 시스템인 GMS를 제안한다. GMS는 다양한 크기를 지니는 공간데이터의 특성을 고려하여 공간/비공간 통합 저장관리 및 BLOB 데이터 저장기법을 제공하며, 저장된 공간/비공간 데이터에 대한 다양한 색인기법을 제공하고 있다. 그밖에 공간 연산 및 복잡한 질의처리를 위해 확장된 질의 최적화 및 질의처리 기법을 제공하며, 다중 사용자를 위한 확장된 동시성 제어 기법과 공간/비공간 데이터에 대한 서로 다른 회복 기법을 제공한다.

  • PDF

대용량 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법 (Approximate Top-k Subgraph Matching Scheme Considering Data Reuse in Large Graph Stream Environments)

  • 최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.42-53
    • /
    • 2020
  • 소셜 네트워크 서비스의 발전과 함께 다양한 응용에서 객체 간의 관계를 표현하기 위한 그래프 자료구조가 자주 활용되고 있다. 최근에는 실시간 그래프 스트림에서 서브 그래프 매칭의 요구가 늘어나고 있다. 따라서 실시간 그래프 스트림에서 높은 응답성을 위한 효율적인 근사 Top-k 매칭 기술이 필요하다. 본 논문에서는 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 대용량 스트림을 효율적으로 처리하기 위해서 기존 분산 스트림 처리 플랫폼인 스톰을 활용하고 스트림 처리 비용을 감소시키기 위한 기존 데이터 재사용 방법을 활용한다. Top-k 결과 생성을 위해서 거리 기반의 요약 색인 기법을 제안한다. 제안하는 요약 색인은 사전에 선택된 정점 간의 거리 값만을 저장하기 때문에 색인의 부하가 적다. 제안하는 요약 색인에서의 근사 Top-k를 수행하여 사용자에게 근사한 k개의 결과를 제공한다. 제안하는 기법의 우수성을 입증하기 위해 다양한 실세계 그래프 데이터 집합에서의 성능 평가를 수행한다.

음악자료의 접근점 제어 및 확장에 관한 연구 (Control and Expansion of Access Points for Music Materials)

  • 정유진;최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.191-196
    • /
    • 2002
  • 기존의 목록체제에서 중요하게 다루지 않았던 음악자료의 접근점을 중심으로 검색에서 나타나는 문제를 분석하였다. 부분문자열, 번역곡명, 별칭곡명 등에서 나타나는 문제는 키워드 색인방법의 개선과 전거제어로, 그리고 연주수단, 인명정보, 연주장소, 수상내역 등에서 나타나는 문제는 주기사항을 확장시키는 방법이 있으며, 가사의 문제는 키워드추출 및 구절단위의 색인기법을 통한 전문데이터 검색방법을 적용하여 개선할 수 있을 것이다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

GDIT기반의 순수 구조 질의 처리를 위한 색인 구조에 대한 분석 (Analysis of Index Structures for Sturcture-based Retrieval on GDIT)

  • 정채영;김영자;김현주;배종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2000
  • 구조적 문서는 문서로의 다양한 접근 경로를 제공하므로, 구조적 문서들에 대한 정보 검색 시스템들은 문서의 구조를 사용한 구조 검색 질의를 지원하여 검색의 신뢰도를 높일 수 있다. 그러므로, 구조적 문서가 가지는 엘리먼트간의 구조적 포함관계나 순서등 문서 구조에 바탕을 둔 다양한 유형의 사용자 질의를 지원할 수 있는 색인 구조가 필요하다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계나 엘리먼트의 발생순서에 관련된 질의등 여러 유형의 순수 구조 질의를 처리할 수 있는 세가지 색인 구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 GDIT 개념[5]에 바탕을 두고, GDIT기반의 색인 기법을 사용한다.

  • PDF

RFID 미들웨어에서 연속질의 처리를 위한 질의 색인 기법 (A Query Indexing Method for Processing Continuous Queries in RFID Middleware Systems)

  • 석수욱;박재관;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.28-30
    • /
    • 2005
  • EPCglobal은 RFID와 관련된 다양한 분야의 표준화를 주도하고 있으며, 응용 표준으로써 Tag 정보의 운용을 위한 RFID 미들웨어(Savant)를 제시하였다. 특히, Savant의 RIED는 Tag 정보를 저장하고 다양한 질의 저리를 제공하는 MMDBMS이다. 그러나 RIED는 User-Driven 방식만 지원하므로 연속${\cdot}$질의를 저리하기 위해 주기적으로 질의를 수행하게 된다. 따라서 주기적인 질의 수행으로 인한 심각한 성능 저하가 발생하며, 실시간 처리를 요구하는 질의를 수행하지 못한다. 이 논문에서는 RFID 미들웨어의 질의 처리 문제를 해결하기 위하여 연속 질의에 적합한 질의 색인 구조를 제시한다. 이 색인은 질의를 색인의 데이터로, 데이터를 색인의 질의로 Swap하여 데이터에 독립적인 검색 성능을 보장한다.

  • PDF