• 제목/요약/키워드: 버켓 분할

검색결과 18건 처리시간 0.023초

NAND 플래시 메모리 기반 저장시스템을 위한 하이브리드 해시 인텍스 (Hybrid Hash Index for NAND Flash Memory-based Storage System)

  • 유인희;김보경;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.21-24
    • /
    • 2011
  • 최근 NAND 플래시 메모리는 가벼운 무게, 적은 전력소모, 온도 및 충격에 강한 내구성 때문에 하드디스크를 대체할 저장 매체로 주목 받고 있다. 하지만 NAND 플래시 메모리는 비대칭적인 읽기 쓰기 소거 연산 처리 속도와 제자리 갱신이 불가능한 물리적인 특징으로 인해 디스크 기반의 대표적인 인덱스 구조 중의 하나인 해시 인덱스 구조를 NAND 플래시 메모리 상에 구현하였을 때, 레코드가 빈번하게 삽입, 삭제, 갱신되면 대량의 제자리 갱신이 발생하여 플래시 메모리에서 느린 쓰기 연산과 소거 연산이 수행되어 성능이 저하된다. 본 논문에서는 이러한 성능 저하를 피하기 위하여 버켓 오버플로우 발생 시 분할 연산을 수행하지 않고, 최대한 지연시킴으로써 쓰기 연산을 줄이는 인덱스 구조를 제안한다. 또한, 각 버켓에 대한 오버플로우 버켓의 갱신 및 삭제 비율에 따라 적응적으로 오버플로우 버켓을 할당하여 추가적인 읽기 쓰기 연산을 줄인다. 본 논문은 기존의 해시 인덱스 구조를 예제 및 수식을 통하여 제안하는 인덱스 구조의 우수성을 보인다.

가상 디렉토리 확장 해시 색인: 확장 해싱에서의 새로운 디렉토리 구조를 이용한 저비용 해시 색인 (Virtual Directory Extendible Hash index: An Economic Hash Index Using New Directory Structure)

  • 박상근;박순영;김명근;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1493-1496
    • /
    • 2003
  • 데이터베이스 관계 연산자 중 프로젝션(projection)과 집단 연산(aggregate function)시 사용되는 GROUP BY절, 그리고 동등 조인(equi join)에 대한 질의 처리는 중복된 튜플 중복된 GROUP BY 필드, 조인 중 발생하는 임시결과에 대한 제거나 집단 연산, 임시 결과의 저장을 위해 정렬이나 해싱 기반 알고리즘을 적용하고 있다. 이 중 해싱 기반 알고리즘은 데이터에 대한 직접적인 접근 방법과 정렬비용이 없다는 장점으로 인해 자주 사용하게 된다. 그러나 이러한 해싱(extendible hashing)[1] 기반 알고리즘은 키 값이 저장되는 버켓(bucket) 페이지의 넘침(overflow)으로 인해 분할(split)이 발생하는 경우, 분할을 야기시킨 버켓 페이지에 대한 정보를 제외한 동일한 내용의 기존 디렉토리 구조를 배로 확장해야 하는 공간 확장과, 확장된 디렉토리 구조의 유지를 위해 많은 비용을 소모하게 된다. 본 논문에서는 다량의 데이터에 대한 접근 기법과 디렉토리 구조의 저장공간, 유지 비용 절감 및 중복 해시 값을 지니는 데이터를 처리하기위한 해시 색인인 가상 디렉토리 확장 해시 색인을 제안한다. 가상 디렉토리 확장 해시 색인은 디렉토리 구조를 다단계 구조로 유지함으로써, 넓은 저장 공간을 필요로 하는 다량의 데이터에 대한 접근경로 문제를 해결하였고, 가상 디렉토리 레벨이라는 새로운 구조를 통해, 기존 디렉토리 구조의 공간 낭비 및 유지 비용을 최소화 시켰으며, 버켓 페이지를 리스트(list) 구조로 유지함으로써 중복 해시 값에 의한 디렉토리 구조의 연쇄적 분할 문제를 해결하였다.

  • PDF

공간 데이터베이스에서 질의 결과 크기 추정을 위한 공간 분할 (Spatial Partitioning for Query Result Size Estimation in Spatial Databases)

  • 황환규
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.23-32
    • /
    • 2004
  • 질의 최적화기의 중요 기능 중에 하나는 질의가 주어졌을 때 질의 조건을 만족하는 입력 레코드의 개수를 추정하는 일이다. 관계 데이터베이스와 마찬가지로 공간 데이터베이스에서 질의 결과 크기 추정은 입력 데이터 공간을 버켓으로 불리는 작은 영역으로 분할한 후 분할된 영역에 대해서 질의 결과 ■기를 추정한다. 추정의 정확도는 작은 영역으로 분할할 때 근사 계산한 데이터와 실제 데이터의 차이에 의해서 결정되며 이것은 공간 분할을 어떻게 분할하는가에 달려 있다. 기존의 방법은 일차원에 많이 사용되는 데이터의 범위를 균일하게 하는 너비 균등 방법과 빈도수의 합을 일정하게 하는 높이 균등 방법을 공간상의 이차원에 적용한 면적 균등 분할과 개수 균등 분할 방법에 기초를 두고 있다. 본 논문에서 제안한 방법은 공간을 분할할 때 데이터의 범위와 빈도수의 곱을 면적으로 나타낸 후 면적 값의 차이가 가장 큰 순서로 버켓을 정하는 방법으로 데이터 범위와 빈도수를 동시에 고려하여 최적의 버켓을 결정한다. 본 논문에서는 제안한 방법과 기존의 방법을 실제 데이터와 인위데이터를 사용하여 질의 크기, 버켓수, 데이터 개수, 데이터 크기의 변화에 대해서 질의 결과 추정에 대한 정확도를 비교, 분석하여 제안한 방법의 성능 우수성을 확인한다.

순환도메인을 기반으로 하는 PR-화일의 구현 및 성능 평가 (The Implementation Performance Evaluation of PR-File Based on Circular ar Domain)

  • 김흥기;황부현
    • 한국정보처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.63-76
    • /
    • 1996
  • 본 논문에서 우리는 공간객체를 취급하는 새로운 동적 공간색인구조인 PR-화 일과 계층별 공간국부성 측도인 변형된 계층분산을 제안한다. 다차원 검색공간이 순환 도메 인을 갖는다는 가정하에서, PR-화일은 공간적으로 이웃하는 객체들을 결집시키기 위해 변형된 계층분산을 이용한다. PR-화일의 삽입과 분할 알고리즘은 객체의 분포 형태에 관계없이 낮은 계층분산값을갖는 색인을 유지시킨다. 실험 결과에 의하면, PR-화일은 낮은 계층분산값을 갖는 색인을 사용함으로써 객체의 검색시 적중율을 높이며, 버켓의 용량이 커질수록 버켓 이용율을 향상시키는 특성을 보인다.

  • PDF

무선 센서 네트워크에서 효율적인 집계 질의 처리 (Efficient Processing of Aggregate Queries in Wireless Sensor Networks)

  • 김정준;신인수;이기영;한기준
    • Spatial Information Research
    • /
    • 제19권3호
    • /
    • pp.95-106
    • /
    • 2011
  • 최근 무선 센서 네트워크에서 센서로부터 원하는 데이타를 가져오는 네트워크 내 집계 질의처리 기법에 대한 연구가 활발히 진행되고 있다. 기존의 대표적인 네트워크 내 집계 질의 처리 기법들은 집계 질의 처리를 위해 라우팅 알고리즘과 데이타 구조를 제안하고 있다. 그러나 이러한 기법들은 센서 노드들의 에너지 소모가 크고, 질의 처리 결과 정확도가 떨어지고, 또한 질의 처리 시간이 오래 걸리는 문제점들을 가지고 있다. 본 논문에서는 이러한 기존 집계 질의 처리 기법들의 문제점을 해결하고 무선 센서 네트워크에서 보다 효율적인 집계 질의 처리를 위해 BPA(Bucket-based Parallel Aggregation)를 제시하였다. BPA는 질의 영역을 센서 노드 분포에 따라 쿼드 트리로 구성하여 집계 질의를 병렬로 처리하고, 각 센서 노드로 하여금 데이타를 이중 전송하게 함으로써 전송 오류로 인한 데이타 손실을 줄인다. 또한, BPA는 집계 질의 처리시 버켓 기반의 데이타 구조를 이용하고 이러한 버켓 데이타 구조를 버켓내 데이타 개수에 따라 적응적으로 분할 및 합병한다. 특히 버켓내 데이타 크기를 줄이기 위해 데이타를 압축하고 데이타 전송 횟수를 줄이기 위해 필터링을 수행한다. 마지막으로 센서 데이타를 이용한 다양한 실험을 통해 본 논문에서 제안하는 BPA의 우수성을 입증하였다.

텔레매틱스 단말기의 CDMA 통신을 이용한 위치 관리 시스템 (Location Management System using CDMA Communications of Telematics Terminals)

  • 김진덕;최진오;문상호;이상욱
    • 한국정보통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1843-1850
    • /
    • 2004
  • 대규모 영업용 차량의 텔레매틱스 단말기를 활용하여 효과적으로 위치 데이터를 획득하고 관리하면 이동 중인 차량의 관제 및 전체 도로 교통 흐름 정보를 추출할 수 있는 기반이 된다. 기존의 공간 색인에 관한 연구는 효율적인 검색 방법을 제시하였지만 텔레매틱스 단말기와 같은 객체를 다루는 이동체 데이터베이스에서는 질의처리의 효율성보다 이동 객체 최신 위치를 획득, 저장하는 것이 더 중요하다. 그러므로 보다 정확한 현재 위치 정보를 제공해야 하는 이동체 DB를 위해서는 병렬 처리 시스템의 도입이 필요하다. 이 논문에서는 텔레매틱스 단말기의 CDMA 통신을 이용한 위치관리 시스템을 제안한다. 구체적으로 다중 처리기를 이용하여 모바일 객체를 공간 색인하는 시스템을 제안하며, 데이터베이스의 변경연산을 최소화하기 위해 이동객체의 특성을 이용한 버켓 분할 기법을 제안한다. 그리고 처리기 간의 메시지 전송량을 줄이기 위한 데이터 획득 방법 및 버켓 경계 정보 전송 방법을 제안한다.

고차원에서 선택율 추정을 위한 블록 히스토그램 압축방법 (Block Histogram Compression Method for Selectivity Estimation in High-dimensions)

  • 이주홍;전석주;박선
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.927-934
    • /
    • 2003
  • 데이터베이스 질의 최적화기는 가장 효율적인 실행계획을 구하기 위해서 질의의 선택율을 추정한다. 일반적으로 애트리뷰트들은 서로 독립적이지 않기 때문에 여러 개의 애트리뷰트를 가지는 질의에 대해서는 다차원 선택을 추정 기법이 필요하다. 대부분의 상용 데이터베이스에서는 히스토그램이 계산 오버헤드가 많지 않고 작은 에러율로 데이터 분포를 를 근사 시킬 수 있기 때문에 실용적으로 많이 사용되고 있다. 그러나 여러 개의 애트리뷰트를 가진 다차원 지?l의 경우에서는 차원이 높아 질수록 에러율을 낮추기 위해 많은 저장 공간을 필요로 하기 때문에 히스토크램 방법이 적합하지 않다. 이 논문에서는 다차원 선택을 추정을 위한 새로운 기법을 제안한다. 다차원 공간에서 크기가 작은 히스토그램 버켓을 많이 만들고 이 버켓의 정보를 DCT로 압축하여 선택을 추정에 사용함으로써 에러율을 작게 하고 저장 공간의 사용량도 줄인다. 폭 넓은 실험 결과는 본 논문에서 제시한 방법들의 타당성과 이점을 확인시켜 준다.

이동체 관리를 위한 다중 처리 시스템의 설계 (A Design of Parallel Processing System for Management of Moving Objects)

  • 김진덕;강구안;육정수;박연식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.345-349
    • /
    • 2004
  • 자동차, 모바일 폰, PDA와 같은 이동 객체를 모바일 데이터베이스에 정확히 색인하기 위해서는 위치 정보를 계속적으로 변경해주어야 하며 이는 많은 시간이 소요된다. 기존의 공간 색인에 관한 연구는 효율적인 검색 방법을 제시하였지만 이동체 데이터베이스에서는 질의처리의 효율성보다 이동객체의 위치정보를 빨리 획득하고, 최신 위치를 저장하는 것이 더 중요하다. 그러므로 가능한 한 정확한 현재 위치 정보를 제공해야 하는 이동체 데이터베이스를 위해서는 병렬 처리 시스템의 도입이 필요하다. 이 논문에서는 다중 처리기를 이용하여 모바일 객체를 공간 색인 하는 시스템을 제안한다. 구체적으로 데이터베이스의 변경 연산을 최소화하기 위해 이동객체의 특성을 이용한 버켓 분할 기법을 제안한다. 그리고 처리기간의 메시지 전송량을 줄이기 위한 데이터 획득 방법 및 버켓 경계 정보 전송 방법을 제안한다.

  • PDF

하이브리드 버켓을 이용한 대규모 집적회로에서의 효율적인 분할 개선 방법 (An efficient iterative improvement technique for VLSI circuit partitioning using hybrid bucket structures)

  • 임창경;정정화
    • 전자공학회논문지C
    • /
    • 제35C권3호
    • /
    • pp.16-23
    • /
    • 1998
  • In this paper, we present a fast and efficient Iterative Improvement Partitioning(IIP) technique for VLSI circuits and hybrid bucket structures on its implementation. The IIP algorithms are very widely used in VLSI circuit partition due to their time efficiency. As the performance of these algorithms depends on choices of moving cell, various methods have been proposed. Specially, Cluster-Removal algorithm by S. Dutt significantly improved partition quality. We indicate the weakness of previous algorithms wjere they used a uniform method for choice of cells during for choice of cells during the improvement. To solve the problem, we propose a new IIP technique that selects the method for choice of cells according to the improvement status and present hybrid bucket structures for easy implementation. The time complexity of proposed algorithm is the same with FM method and the experimental results on ACM/SIGDA benchmark circuits show improvment up to 33-44%, 45%-50% and 10-12% in cutsize over FM, LA-3 and CLIP respectively. Also with less CUP tiem, it outperforms Paraboli and MELO represented constructive-partition methods by about 12% and 24%, respectively.

  • PDF

공간 질의 최적화를 위한 힐버트 공간 순서화에 따른 공간 분할 (Spatial Partitioning using filbert Space Filling Curve for Spatial Query Optimization)

  • 황환규;김현국
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.23-30
    • /
    • 2004
  • 공간 질의 크기에 대한 근사치를 구하기 위해서는 입력 데이터 공간을 분할한 후 분할된 영역에 대하여 질의 결과 크기를 추정한다. 본 논문에서는 데이터 편재가 심한 공간 데이터에 대한 질의 크기 추정의 문제를 논의한다. 공간을 분할하는 기법으로 관계 데이터베이스에서 많이 사용되는 너비 균등, 높이 균등 히스토그램에 해당되는 면적 균등, 개수 균등 분할에 대한 방법을 검토하고 공간 인덱싱에 기초한 공간 분할방법에 대해서 알아본다. 본 논문에서는 공간 순서화 기법인 힐버트 공간 채움 곡선을 이용한 공간 분할을 제안한다. 제안한 방법과 기존의 방법을 실제 데이터와 인위 데이터를 사용하여 편재된 공간 데이터에 대한 질의 결과 크기의 추정에 대한 정확도를 비교한다. 본 실험에서 힐버트 채움 곡선에 의한 공간 분할이 공간 질의 크기 버켓 수의 변화, 데이터 위치 편재도의 변화, 데이터 크기의 변화에 대해서 기존의 분할 방법보다 질의 결과 크기 추정에 대해서 우수한 성능을 보였다.