• Title/Summary/Keyword: B-tree 구조

검색결과 176건 처리시간 0.024초

캐시를 고려한 T-트리 인덱스 구조 (Cache Sensitive T-tree Index Structure)

  • 이익훈;김현철;허재녕;이상구;심준호;장준호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.12-23
    • /
    • 2005
  • 지난 10년간 CPU의 속도는 메모리의 속도에 비해 급속한 속도로 발전하였다 그 결과 데이터 베이스 시스템을 포함한 다른 컴퓨터 응용분야에서 메모리의 접근이 병목현상을 일으키게 되었다. 메모리의 접근 속도를 줄이기 위해 캐시 메모리가 도입되었다 하지만 캐시 메모리는 원하는 데이타가 캐시에 옮겨져 있어야 메모리 접근 속도를 줄일 수 있다. 때문에 응용프로그램에서 데이타를 어떤 순서로 액세스 하느냐에 따라 캐시의 활용도가 달라지고 응용프로그램의 성능이 달라지게 된다. 이 시점에서 현재 컴퓨터에서 B+-트리가 T-트리보다 더 빠르다는 사실이 알려졌다. B+-트리가 T-트리보다 캐시를 더 효율적으로 사용하기 때문이다. 또한 B+-트리를 개선하여 캐시를 더욱 효율적으로 사용하는 CSB+-트리(Cache Sensitive B+-tree)가 제안되기도 하였다 본 논문의 목표는 T-트리가 캐시를 효율적으로 사용하도록 새로운 T-트리 구조를 개발하는 것이다. CSB+-트리와 같이 시스템의 L2 캐시를 최대한 활용하며 기존 T-트리가 가지는 장점을 가지는 새로운 CST-트리(Cache Sensitive T-트리)를 설계 개발하고, 실험을 통해 기타 다른 인덱스 구조에 비교하여 CST-트리의 우수성을 보인다.

스트링 B-트리를 이용한 게놈 서열 분석 시스템 (An Analysis System for Whole Genomic Sequence Using String B-Tree)

  • 최정현;조환규
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.509-516
    • /
    • 2001
  • 생명 과학의 발전과 많은 게놈(genome) 프로젝트의 결과로 여러 종의 게놈 서열이 밝혀지고 있다. 생물체의 서열을 분석하는 방법은 전역정렬(global alignment), 지역정렬(local alignment) 등 여러 가지 방법이 있는데, 그 중 하나가 k-mer 분석이다. k-mer는 유전자의 염기 서열내의 길이가 k인 연속된 염기 서열로서 k-mer 분석은 염기서열이 가진 k-mer들의 빈도 분포나 대칭성 등을 탐색하는 것이다. 그런데 게놈의 염기 서열은 대용량 텍스트이고 k가 클 때 기존의 온메모리 알고리즘으로는 처리가 불가능하므로 효율적인 자료구조와 알고리즘이 필요하다. 스트링 B-트리는 패턴 일치(pattern matching)에 적합하고 외부 메모리를 지원하는 좋은 자료구조이다. 본 논문에서는 스트링 B-트리(string B-tree)를 k-mer 분석에 효율적인 구조로 개선하여, C. elegans 외의 30개의 게놈 서열에 대해 분석한다. k-mer들의 빈도 분포와 대칭성을 보여주기 위해 CGR(Chaotic Game Representation)을 이용한 가시화 시스템을 제시한다. 게놈 서열과 매우 유사한 서열 상의 어떤 부분을 시그니쳐(signature)라 하고, 높은 유사도를 가지는 최소 길이의 시그니쳐를 찾는 알고리즘을 제시한다.

  • PDF

J-tree : 사용자의 검색패턴을 이용한 대용량 데이타를 위한 효율적인 색인 (J-Tree: An Efficient Index using User Searching Patterns for Large Scale Data)

  • 장수민;서광석;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.44-49
    • /
    • 2009
  • 최근에 휴대용 단말기들의 발전으로, 대용량 데이타에 대한 다양한 검색 서비스들이 휴대용 단말기에 제공되고 있다. 정보 검색을 위한 대부분 응용프로그램들은 대용량 데이타를 검색하기 위하여 B-tree나 R-tree와 같은 색인을 사용한다. 그러나 전체 데이타의 매우 적은 부분이 사용자에 의하여 접근된다. 또한, 각 데이타에 대한 접근 빈도수들은 다양하다. 그러나 B-tree나 R-tree와 같은 색인들은 편향적 접근 패턴의 특성을 고려하지 않는다. 그리고 캐쉬는 빠른 접근을 위해서 반복적으로 접근되는 데이타를 메모리에 저장한다. 그러나 캐쉬에서 사용하는 메모리의 크기는 제한적이다. 본 논문에서는 사용자의 검색패턴들을 고려한 디스크 기반의 새로운 색인구조, J-tree를 제안한다. 제안된 색인은 모든 데이터에 대한 일정한 검색속도를 보장하는 균형트리이다. 그리고 자주 접근된 데이타에 대해서는 빠른 검색속도를 제공한다. 성능평가는 다양한 실험환경에서 제안된 색인의 효율성을 보여준다.

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF

B2V-Tree: 무선 데이타 스트림에서 부분 부합 질의를 위한 색인 기법 (B2V-Tree: An Indexing Scheme for Partial Match Queries on Wireless Data Streams)

  • 정연돈;이지연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.285-296
    • /
    • 2005
  • 이동 분산 환경에서는 무선 데이타 방송 기법을 통하여 서버의 데이타 레코드들을 이동 사용자들에게 전달하는 방식이 많이 사용된다. 그리고, 무선 방송 스트림에서 데이타를 에너지 효율적으로 접근하기 위해서는 색인 기법이 필요하다. 하지만, 기존의 색인 기법들은 데이타 레코드의 키 값을 이용한 트리 형태의 색인 구조를 사용하고 있다. 따라서 부분 부합 질의 등과 같은 내용 기반 검색 질의를 지원할 수 없었다. 본 논문에서는 무선 방송으로 이동 사용자들에게 전달되는 데이타 스트림에서 내용 기반 검색인 부분 부합 질의를 지원하기 위해 B2V-Tree라고 불리는 색인 기법을 제안한다. 본 논문에서 제안하는 B2V-Tree는 데이타 레코드들의 애트리뷰트 값을 다중 애트리뷰트 해싱을 통해 비트 벡터로 생성한 다음, 이들을 색인 트리로 구성하는 색인 기법이다.

멀티캐스트 스위치를 위한 확장된 B-Tree 복사망 (Extended B-Tree(EBT) Copy Network for Multicast Switches)

  • 신재구;손유익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.561-563
    • /
    • 2000
  • 본 논문은 멀티캐스트 패킷 스위치의 성능 향상에 관하여 언급한다. 네트워크에 요구된 복사본의 수가 네트워크의 크기보다 클 경우 발생되는 오버플로우 문제를 해결하기 위해 Lee의 브로드캐스트 반얀 네트워크(BBN)를 기반으로 하여 다중경로와 다중출력을 제공하는 기능이 추가된 구조를 제안하였으며, 여기에 입력에서 다음 처리해야할 패킷의 fanout 값이 남아있는 BBN의 출력포트 수보다 클 경우 패킷이 복사될 수 없게됨으로서 발생되어질 수 있는 네트워크의 성능이 저하되는 문제를 해결하기 위하여, 셀분할 알고리즘을 이용한 수정된 DAE(dummy address encoder) 방식을 제안하였다.

  • PDF

효율적인 이벤트 큐의 구조에 관한 연구 (A Study on the Structures for Efficient Event Queues)

  • 김상욱
    • 한국시뮬레이션학회논문지
    • /
    • 제4권2호
    • /
    • pp.61-68
    • /
    • 1995
  • The performance of event-driven logic simulation frequently used for VLSI design verification depends on the data structures for event queues. This paper improves the existing Timing Wheel as a data structure for an event queue. In case of the use of B+ tree, an efficient node degree is also presented based on the experiment results. A new Timing Wheel index structure, which eliminates the insertion and deletion overhead of B+ tree, is proposed and analyzed.

  • PDF

DFS를 이용한 추가 메모리를 요구하지 않는 제로트리 압축기법 (Zero-tree packetization without additional memory using DFS)

  • 김충길;이주경;정기동
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.575-578
    • /
    • 2003
  • SPIHT는 수행속도가 빠르고 효율적인 웨이블릿 기반의 이미지 압축 알고리즘으로 잘 알려져 있다. 그러나, SPIHT는 알고리즘 수행에 필요한 제로트리 및 계수의 상태를 저장하기 위하여 리스트 구조를 사용하고 있어 추가 메모리론 요구하며, 비트율의 증가에 따라 메모리 요구량이 증가하는 단점을 가진다. 본 논문에서는 SPIHT 알고리즘을 수행하는데 있어 추가 메모리를 요구하지 않는 MZP-DFS 알고리즘을 제안한다. 제안된 기법은 깊이우선 순서에 따라 공간트리를 탐색하고 테스트 함수 및 복원 계수의 LSB를 이용함으로써 추가 메모리를 제거하였으며 SPIHT와 동일한 성능을 가진다. MZP-DFS는 추가 메모리를 요구하지 않기 때문에 하드웨어 제작비용을 절감할 수 있으며, 각각의 공간트리를 병렬적으로 수행할 수 있기 때문에 실시간 이미지 압축에 적합하다.

의사결정나무모형을 이용한 유역내 구조적 홍수방어 대안 도출 (Flood Mitigation Planing for a Basin Using a Decision Tree Model)

  • 변성호;강현직;한정우;김태웅
    • 대한토목학회논문집
    • /
    • 제28권1B호
    • /
    • pp.33-40
    • /
    • 2008
  • 우리나라는 6월부터 9월까지의 우기에 강우가 집중 발생하는 기상특성으로 인해 자연재해의 95% 이상이 집중호우와 태풍에 의한 풍수해로 집계되고 있을 만큼 홍수피해에 취약하며, 오래전부터 홍수방어에 대한 구조적 대책이 시행되어왔다. 본 연구의 목적은 의사결정기법중의 하나인 의사결정나무를 이용하여 유역내 홍수방어를 위한 기본적인 후보대안을 제시하는데 있다. 이러한 후보대안은 유역이 가지고 있는 치수적 기능을 최대한 살리고 상 하류의 유기적인 홍수방어기능을 효율적으로 증대시키는 다수의 조합으로 제시되었다. 또한 본 연구에서는 유역종합치수계획 수립시 적용가능한 홍수방어 대안 조합 지침을 제시하였다.

대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성 (Incremental Generation of A Decision Tree Using Global Discretization For Large Data)

  • 한경식;이수원
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.487-498
    • /
    • 2005
  • 최근 들어, 대용량의 데이터를 처리할 수 있는 트리 생성 방법에 많은 관심이 집중되고 있다 그러나 대용량 데이터를 위한 대부분의 알고리즘은 일괄처리 방식으로 데이터를 처리하기 때문에 새로운 데이터가 추가되면 이 데이터를 반영한 결정 트리를 생성하기 위해 처음부터 트리를 다시 생성해야 하다. 이러한 재생성에 따른 비용문제에 보다 효율적인 접근 방법은 결정 트리를 순차적으로 생성하는 접근 방법이다. 대표적인 알고리즘으로 BOAT와 ITI를 들 수 있으며 이들 알고리즘은 수치형 데이터 처리를 위해 지역적 범주화를 이용한다. 그러나 범주화는 정렬된 형태의 수치형 데이터를 요구하기 때문에 대용량 데이터를 처리해야하는 상황에서 전체 데이터에 대해 한번만 정렬을 수행하는 전역적 범주화 기법이 모든 노드에서 매번 정렬을 수행하는 지역적 범주화보다 적합하다. 본 논문은 수치형 데이터 처리를 위해 전역적 범주화를 이용하여 생성된 트리를 효율적으로 재생성하는 순차적 트리 생성 방법을 제안한다. 새로운 데이터가 추가될 경우, 전역적 범주화에 기반 한 트리를 순차적으로 생성하기 위해서는 첫째, 이 새로운 데이터가 반영된 범주를 재생성해야 하며, 둘째, 범주 변화에 맞게 트리의 구조를 변화시켜야한다. 본 논문에서는 효율적인 범주 재생성을 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안하며 범주 변화에 맞는 트리 구조 변화를 위해 신뢰구간과 트리 재구조화기법을 이용한다. 본 논문에서 피플 데이터베이스를 이용하여 기존의 지역적 범주화를 이용한 경우와 비교 실험하였다.