• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.029초

이동체 색인을 위한 KDB-Tree 의 분할 정책 (Splitting Policies of KDB-Tree for indexing of Moving Objects)

  • 이창헌;임덕성;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.19-21
    • /
    • 2002
  • 최근 이동통신 및 GPS 기술의 발달로 위치기반서비스 요구가 점점 증가하고 있고, 대용량의 위치데이터가 저장되는 위치기반서비스의 구현을 위한 이동체외 저장 및 검색에 관한 연구가 활발하다. 이동체의 위치 정보를 점으로 모델링하여 색인 할 경우 KDB-Tree의 성능이 우수하다. 그러나 KDB-Tree는 시공간에서의 이동체 위치데이터 색인을 고려할 경우 시간 도메인의 특성으로 인해 성능 저하의 문제를 발생시킨다. 본 논문에서는 이동체 위치데이터의 색인을 위한 KDB-Tree의 사용에서 시간 도메인의 특성을 반영한 분할 도메인 선정 방법과 분할 정책을 제시한다. 새로운 분할 정책은 색인의 공간활용도를 높이고 색인의 크기를 작게 하여 검색의 성능을 높인 최근 시간 분할 기법과 LD(Last Division) 분할 정책이다. 본 논문에서는 KDB-Tree의 변경된 분할 정책을 구현하고 성능평가론 수행한다. 이 성능 평가 실험을 통해서 변경된 분할 정책을 사용한 KDB-Tree에서 공간활용도가 높고 검색 성능이 우수함을 보인다.

  • PDF

연속 Top-k 질의 모니터링을 위한 효율적인 알고리즘 (An Efficient Algorithm for Monitoring Continuous Top-k Queries)

  • 장재희;정하림;김용희;김응모
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.590-595
    • /
    • 2016
  • 본 논문에서는 기존 공간 속성만을 고려하는 그리드 기반의 색인 기법을 변형하여 보다 빠른 연산을 수행하는 상위-k 질의 기법을 제안한다. 제안하는 기법은 이동 객체의 공간 속성 뿐만 아니라 비공간 속성을 활용하여 사용자가 선호하는 정보를 효과적으로 검색할 수 있는 메인메모리 기반 그리드 색인 구조인 Bit-Vector Grid Index(BVGI)를 구축한다. 그리드의 각 셀은 이동객체의 비공간 속성 값을 비트 벡터로 부호화하여 이동 객체가 어떤 셀에 포함되어 있는지 빠르게 판단할 수 있고, 각 셀에 존재하는 이동객체의 비트 벡터만을 비교하여 불필요한 연산을 줄일 수 있다. 성능 평가를 통해 제안하는 BVGI 기법이 기존의 질의 처리 기법보다 메모리 사용량과 CPU-time 측면에서 우수함을 보였다.

S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법 (An Efficient Spatial Data Transformation Method Using Caching on S-XML Middleware)

  • 이동욱;장용일;박순영;오영환;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.47-50
    • /
    • 2005
  • 본 논문에서는 S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법을 제안한다. 공간 데이터베이스 관리 시스템(SDBMS)을 기반으로 하여 S-XML 을 지원하는 시스템은 SDBMS 에서 사용되는 이진 데이터와 S-XML 간의 상호 변환 과정이 필요하다. 특히 변환 과정에서 공간 데이터는 비공간 데이터에 비해 데이터 크기가 크고, 복잡한 동시에 다양한 데이터 형식을 가지고 있어 비공간 데이터에 비해 변환 비용이 크다. 따라서 공간 데이터의 특성을 고려한 변환 비용 감소 기법이 필요하다. 제안 기법은 SDBMS 의 질의 처리 결과인 이진 데이터를 S-XML 문서로 변환하고, S-XML 미들웨어의 캐싱 관리자에서 공간 데이터에 해당하는 부분만을 캐싱 한다. 캐싱 관리자는 질의를 점 질의와 영역 질의로 구분한다. 점 질의의 결과에 대해서는 공간 데이터의 OID 를 키 값으로 하는 해쉬 색인을 사용하며, 영역 질의 결과에 대해서는 질의에서 표현된 MBR 에 따라 R-Tree 색인을 사용한다. 변환 과정에서 요구되는 공간 데이터가 캐싱된 데이터로 존재하면 질의 종류에 따른 색인을 사용하여 데이터를 추출하고 이를 S-XML 데이터로 치환한다. 캐싱 데이터를 이용한 공간 데이터 변환 기법에 의해 공간 데이터의 변환 비용을 줄임으로써 S-XML 미들웨어 에서의 변환 시간을 단축할 수 있다.

  • PDF

동적 정보 저장을 위한 자동 하이퍼텍스트 색인 기법의 개발 (Development of an Automatic Hypertext Indexer for Dynamic Information Storage)

  • 이동애;장덕성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2333-2341
    • /
    • 1997
  • 하이퍼텍스트 정보를 저장할 때 정보가 삽입, 삭제, 변경되면, 인접한 정보들에 대한 하이퍼텍스트 링크도 변화되어야 한다. 하이터텍스트 링크는 하이터텍스트 색인어를 기준으로 관련있는 다른 정보를 찾는 수단을 제공한다. 따라서 하이퍼텍스트 색인어를 관리하는 것이 동적 정보 저장의 핵심이 된다. 본 논문에서는 새로운 정보가 삽입, 삭제, 변경될지라도 시스템이 안정성을 유지하며, 변경된 부분에 대한 하이퍼텍스트 색인어와 하이퍼텍스트 링크가 동적으로 결정될 수 있는 방법을 제시한다. 이를 위해 동적 색인기를 만들고, 동적 색인기의 동작을 돕기 위해 색인어 사전, 불용어 사전, 조사 사전, 역색인 파일, 시소러스 등을 구성한다.

  • PDF

구조적 문서의 효율적인 구조 질의 처리 및 검색을 위한 알고리즘의 설계 (Design of Algorithm for Efficient Retrieve Pure Structure-Based Query Processing and Retrieve in Structured Document)

  • 김현주
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권8호
    • /
    • pp.1089-1098
    • /
    • 2001
  • 구조적 문서가 가지는 구조 정보는 문서로의 다양한 접근경로를 나타내는데 사용될 수 있다. 이러한 구조적 문서가 가지는 구조 정보를 활용하기 위해서는 문서의 구조에 대해서 색인을 해야 한다. 이때 내용색인뿐만 아니라 문서마다 구조정보를 저장하므로 색인에 필요한 공간이 커진다. 그러므로, 색인공간 오버헤드를 최소화시키면서도 엘리먼트간의 포함관계나 순서 등 문서의 순수 구조에 바탕을 둔 순수 구조 질의를 처리할 수 있어야 한다. 본 논문에서는 색인공간 오버헤드를 최소화하면서도 여러 유형의 구조 관련 질의를 효율적으로 처리할 수 있는 구조 색인 구조와 GDIT자료구조를 제시한다. 제안하는 구조 색인 구조는 문서에 존재하는 가장 하위 엘리먼트만을 색인대상으로 하며, 검색엘리먼트가 존재하는 문서개수에 영향을 받지 않는다. 그리고 이 색인구조를 바탕으로 순수 구조에 대한 질의 처리과정을 보이고 색인공간에 대해 그 성능을 평가한다. 제안된 색인 구조는 GDIT개념[2]에 바탕을 두고, GDIT기반의 색인기법을 사용한다.

  • PDF

QUISIS: Interval Skip List를 활용한 질의 색인 기법 (QUISIS: A Query Index Method Using Interval Skip List)

  • 민준기
    • 정보처리학회논문지D
    • /
    • 제15D권3호
    • /
    • pp.297-304
    • /
    • 2008
  • 인터넷과 인트라넷의 확산에 따라, 스트림 데이터 처리(stream data processing)와 같은 새로운 분야가 등장하게 되었다. 스트림 데이터는 실시간적이고 연속적으로 생성된다. 스트림 데이터 환경에서는 복수 개의 질의들이 미리 등록되고 후에 도착되는 데이터는 등록된 질의들에 의하여 평가된다. 따라서 질의 성능을 향상시키기 위하여, 스트림 데이터 처리 시스템을 위한 다양한 연속성 질의 색인 방법들이 제안되었다. 본 논문에서는 스트림 데이터를 위한 질의 색인에 대하여 다룬다. 일반적으로, 스트림 질의는 간격 조건식을 포함하고 있다. 따라서, 간격 조건식을 이용하여, 질의들을 색인화할 수 있다. 이 논문에서, 탐색 속도를 향상시키기 위하여, Interval Skip List를 수정한 효율적인 질의 색인 방법, QUISIS를 제안한다. QUISIS는 최근 데이터 값이 근 미래에 도착하는 값과 비슷하다는 지역성을 활용한다. 성능 평가를 통하여, 본 논문에서 제안하는 기법의 효율성을 보인다.

유사도 검색을 위한 데이터 재배열을 이용한 공간 효율적인 역 색인 기법 (A Space-Efficient Inverted Index Technique using Data Rearrangement for String Similarity Searches)

  • 임마누;김종익
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1247-1253
    • /
    • 2015
  • 유사도 검색에서는 효율적으로 유사성을 만족하는 문자열을 찾기 위해서 데이터에 대한 역 색인을 구축하여 이용한다. 일반적으로 기존의 기법들은 빠른 응답속도의 질의처리를 위해서 역 색인을 메모리에 상주시킨다. 하지만 구축된 역 색인은 그 크기가 매우 크다는 문제점을 가지고 있다. 따라서 데이터의 크기가 매우 큰 경우나 자원이 제약적인 환경에서는 역 색인을 이용한 질의처리가 불가능할 수 있다. 본 논문에서는 동일한 q-그램을 포함하는 문자열들이 서로 인접한 위치가 되도록 재배치시킨 후 해당 문자열들을 범위로 표현한다. 실험을 통하여 질의처리의 성능을 희생하지 않으면서도 색인의 크기가 줄어드는 것을 보인다.

XML 문서에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법 (An Efficient Inverted Index Technique based on RDBMS for XML Documents)

  • 서치영;이상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.27-40
    • /
    • 2003
  • XML 정보검색 시스템이 XML 문서에 대한 포함질의를 지원하기 위해서는 기존의 정의검색 분야에서 널리 쓰이는 역색인 기법을 XML 문서에 대해서도 적용이 가능하도록 확장해야 한다. 본 논문에서는 확장된 역색인 정보를 저장하고 XML 문서에 대한 포함질의를 처리하는 방법을 이전 연구에서와 같이 두 가지 관점에서 제시한다. 하나는 관계형 데이타베이스 관리 시스템(RDBMS)을 이용해서 역색인 정보를 저장하고 질의를 처리하는 방법이고 다른 하나는 RDBMS 대신 역 리스트 엔진(Inverted List Engine)을 이용하는 방법이다. 이전 연구에서 역색인을 확장한 방식은 두 가지 문제점이 존재한다. 하나는 RDBMS를 이용하는 방법이 역 리스트 엔진을 이용하는 방법에 비해 성능 상으로 많이 안 좋다는 점이고, 다른 하나는 RDBMS 상에서 포함질의를 처리 시, 질의의 경로길이에 비례해서 조인연산이 증가하고 조인연산도 크기가 큰 테이블간의 조인이 된다는 점이다. 본 논문에서는 이러한 문제점들을 해결하고자 이전연구와는 다르게 역색인을 확장하여 RDBMS를 이용하는 방법의 효율성을 밝힌다.

CIR-Tree를 위한 효율적인 대량적재 알고리즘의 설계 및 구현 (Design and Implementation of an Efficient Bulk Loading Algorithm for CIR-Tree)

  • 피준일;송석일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.193-206
    • /
    • 2002
  • 이 논문에서는 고차원 색인 구조인 CIR-트리를 위한 효율적인 벌크로딩 알고리즘을 설계하고 구현한다. 벌크로딩 기법은 대량의 고차원 데이타가 색인 구성 시 함께 주어지는 경우 색인의 구성을 빠르게 하고 구축한 색인의 검색 성능을 향상시킨다. CIR-트리는 반드시 필요한 차원만 이용해서 비단말 노드의 엔트리를 구성하기 때문에 엔트리 크기가 일정하지 않다. 이 특성은 비단말 노드의 분기율을 높이고 탐색 성능을 향상시키는 효과가 있다. 기존에 다차원 및 고차원 색인구조를 위한 벌크로딩 기법이 제안되었지만 이러한 CIR-트리의 특징을 제대로 살릴 수 있는 방법은 없다. 이 논문에서는 기존의 벌크로딩 알고리즘을 개선하면서 CIR-트리의 특징을 효과적으로 색인 구성에 반영할 수 있는 알고리즘을 제안한다. 또한 이를 BADA-III의 하부 저장 시스템인 MiDAS-III에서 구현하고 다양한 실험을 통해 그 성능을 입증한다.

위치 기반 서비스를 위한 가상 셀 기반 $B^+$-tree 이동객체 색인 기법 (Virtual Cell based $B^+$-tree Index Structure of Moving Objects for Location Based Services)

  • 박용훈;서동민;송석일;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.185-190
    • /
    • 2010
  • 최근 위치 인식 기술과 휴대 장치의 발달로 인해 이동하는 객체를 기반으로 하는 위치 기반 서비스(Location Based Service, LBS)의 관심이 점점 증가하고 있고 그에 관련된 연구들이 활발하게 진행되고 있다. 이동 객체의 응용은 빈번하게 변경되는 이동객체의 위치정보를 효과적으로 처리할 수 있는 색인구조를 필요로 한다. 위치정보를 색인하기 위해 R-tree 기반의 색인들이 제안되었다. 하지만 R-tree는 변경보다는 검색 연산에 초점이 맞추어진 색인구조이기 때문에 잦은 변경을 다루어야 하는 이동객체 환경에 적합하지 못하다. 최근 이러한 객체의 빠른 위치 변경을 지원하는 그리드 기반의 색인 구조가 제안되었다. 하지만 셀의 객체 점유율에 따라 검색 속도가 저하되는 단점은 여전히 해결되지 못하고 있다. 이러한 단점은 객체들이 특정 영역에 몰리는 경우 또는 그리드의 해상도를 잘못 지정한 경우 더욱 부각된다. 본 논문에서는 이러한 단점을 해결하기 위해 가상 셀 기반의 색인 구조를 제안한다. 데이터 페이지에 객체의 점유율을 보장하기 위해 여러 개의 인접한 셀들의 데이터를 한 데이터 페이지에 함께 저장한다. 공간 채움 곡선을 기반으로 순서화된 셀들로 셀의 인접성을 결정한다. 또한 공간 채움 곡선의 차수를 동적으로 지정하여 객체가 집중된 셀에 대해서는 셀의 단위 크기를 작게 지정한다. 뿐만 아니라 셀을 표현하기 위한 식별자를 위해 비트를 이용한 표현식을 제안하였다. 이로 인해 노드의 팬아웃을 증가시켰고, 저장공간을 절약하였다. 실험을 통해서 제안하는 색인 기법의 우수성을 증명하였다.

  • PDF