• 제목/요약/키워드: 인덱스 테이블

검색결과 104건 처리시간 0.03초

분할된 역 인덱스 테이블에서 부모노드의 정보를 이용한 질의 처리 (Query Processing using Information of Parent Nodes in Partitioned Inverted Index Tables)

  • 김명수;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.905-913
    • /
    • 2008
  • 최근 XML(Extensible Markup Language) 사용의 증가와 함께 다량의 이질적 구조를 가진 XML문서들이 이용되고 있으며, 이러한 XML문서들의 효율적인 관리를 위해 데이터 저장 구조에 대한 연구의 필요성이 증가하고 있다. 이에 따라 본 논문에서는 이들 XML 문서들의 효율적인 관리를 위하여 분할된 역 인덱스 테이블에서 부모노드의 정보를 이용하여 질의를 처리하는 방법을 제안한다. 이질적 구조를 가진 대규모의 문서들에 대한 질의 처리 횟수와 처리 데이터 량은 검색 성능에 큰 영향을 주기 때문에 데이터 구조를 설계할 때에 이 두 가지 요소들을 신중히 고려해야 한다. 제안된 방법은 부모 노드의 정보를 이용하여 선형 경로 질의를 위한 질의 처리 횟수를 반감시키고, 역 인덱스 테이블을 XML 트리의 깊이에 따라 적절히 분할하여 탐색 대상이 되는 데이터의 양을 줄이기 때문에 XML 문서에 대한 검색 성능을 향상시킨다. 제안하는 방법의 효율성을 입증하기 위해 인터넷에서 수집한 XML 문서들에 대한 XPath 질의 처리 성능이 기존의 역 색인 기법들에 비해 우수함을 보인다.

  • PDF

동영상 저장 시스템에서 효율적인 검색을 위한 XML 메타데이터 엔진 설계 (An XML-based Metadata Engine Design for Effective Retrieval in Video Recording System)

  • 신은영;박성한
    • 방송공학회논문지
    • /
    • 제10권2호
    • /
    • pp.202-209
    • /
    • 2005
  • 본 논문에서는 동영상 저장 시스템에서 검색시간을 단축시킬 수 있는 XML .메타데이터 엔진을 설계한다. 이를 위하여 본 논문에서 제안하는 방법은 XML 메타데이터를 프래그먼트 단위로 저장하면서, 메타데이터에의 접속시간을 최소화시키기 위하여 메타데이터의 내용과 구조적 특성을 고려한 계층적 인덱스 스키마을 구성한다. 계층적 인덱스 스키마는 메타데이터의 내용적 특성을 기반으로 검색에 자주 사용되는 상위 레벨의 메타데이터를 구별하고 그 메타데이터를 기반으로 일반 검색을 위한 노드 인덱스와 구조적 특성을 갖는 그룹 테이블을 기반으로 고급 검색을 위한 그룹 인덱스를 구성한다. 이 접근 방법은 기존 방법에 비해 전체 인덱스 수를 줄이고, 그룹 테이블을 작성함으로써 반환 시간을 향상시킨다. 시뮬레이션 결과 제안하는 메타데이터 엔진이 기존 메타데이터 엔진보다 향상된 검색시간을 보여준다.

정렬 인덱스 스캔을 이용한 조인기법 (A Join Processing Technique using Sorted Index Scan)

  • 이종백;강운학;이상원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.16-18
    • /
    • 2012
  • 플래시메모리는 빠른 성능 및 저전력 등 여러 가지 장점 덕분에 저장장치 시장에서 최근 빠른 속도로 하드디스크를 대체해 가고 있다. 특히, 엔터프라이즈 데이터베이스 분야에서 가격 대비 성능 면에서 효과가 높기 때문에 더 주목을 받고 있다. 데이터베이스 분야에서 조인은 가장 자주 사용되는 연산으로 그 성능 개선이 중요한데, 본 논문에서는 플래시메모리를 위한 새로운 조인 처리의 한 방법으로 정렬 인덱스 스캔 방식을 활용하는 방안은 제시한다. 정렬 인덱스 스캔은 최근 플래시메모리 상에서 테이블에 대한 접근 방식의 하나로, 조인결과의 정렬을 고려할 경우, 기존의 전체 테이블 스캔에 기반을 둔 해시조인이나 정렬합병조인과 비교했을 때 상당한 성능 개선을 보장한다.

대용량 공간 데이터의 빠른 검색을 위한 해시 기반 R-Tree (A Hash based R-Tree for Fast Search of Mass Spatial Data)

  • 강홍구;김정준;신인수;한기준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동추계학술대회
    • /
    • pp.82-89
    • /
    • 2008
  • 최근, GIS 분야에서 RFID와 GPS 센서 같은 위치 및 공간 데이타를 포함하는 다양한 GeoSensor의 활용으로 수집되는 공간 데이타가 크게 증가하면서, 대용량 공간 데이타의 빠른 처리를 위한 공간 인덱스의 중요성이 높아지고 있다. 특히, 대표적인 공간 인덱스인 R-Tree를 기반으로 검색 성능을 높이기 위한 연구가 활발히 진행되고 있다. 그러나, 기존 연구는 R-Tree에서 노드의 MBR 간의 겹침이나 트리 높이를 어느 정도 줄임으로써 다소 검색 성능을 향상시켰지만, 트리 검색에서 발생하는 불필요한 노드 접근 비용 문제를 효율적으로 해결하지 못하고 있다. 본 논문에서는 이러한 문제를 해결하고 R-Tree에서 대용량 공간 데이타의 빠른 검색을 제공하는 인덱스인 HR-Tree(Hash based R-Tree)를 제시한다. HR-Tree는 트리 검색 없이 R-Tree 리프 노드를 직접 접근할 수 있는 해시 테이블을 이용함으로써 R-Tree의 검색 성능을 높인다. 해시 테이블은 데이타 영역을 차원에 따라 반복적으로 분할한 Partition과 대응되는 R-Tree 리프 노드의 MBR과 포인터들로 구성된다. 각 Partition은 생성 과정에서 고유의 식별 코드를 갖기 때문에 Partition 코드가 주어지면 해시 테이블에서 해당 레코드를 쉽게 접근할 수 있다. 또한, HR-Tree는 R-Tree구조의 변경없이 다양한 R-Tree 변형 구조에 쉽게 적용할 수 있는 장점이 있다. 마지막으로 실험을 통하여 HR-Tree의 우수성을 입증하였다.

  • PDF

인덱스 테이블을 이용한 고속 VQ 코드북 탐색 알고리즘 (Fast VQ Codebook Search Algorithms Using Index Table)

  • 황재호;곽윤식;홍충선;이대영
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3272-3279
    • /
    • 2000
  • 본 논문에서는 Wavelet/VQ 코딩 기법에 효율적인 두 가지의 고속 VQ 코드북 탐색 알고리즘을 제안한다. 웨이브렛 계수 블록 내에서 코드북의 코드워드들의 원소, 즉 웨이브렛 계수가 큰 값을 가질 확률이 적다. 이러한 특성을 코드북 탐색에 이용하기 위하여 각 서브밴드에서 코드워드의 에너지 크기로 재정렬된 인덱스 테이블을 이용한다. 코드북 탐색 시 인덱스 테이블을 이용하여 코드워드의 큰 계수 값과 그에 대응하는 입력벡터의 원소를 먼저 비교함으로써 PDE의 탈출 조건을 조기에 만족하게 되어 탐색 시간이 줄어들게 된다.

  • PDF

다차원 데이터 분석을 위한 비트맵 인덱스 (A Bitmap Index for Multi-Dimensional Data Analysis)

  • 임윤선;박영선;김명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.298-300
    • /
    • 2002
  • 다차원 데이터를 배열에 저장하는 Multidimensional OLAP (MOLAP) 시스템은 배열내의 위치 정보를 통해 데이터를 신속하게 엑세스할 수 있는 장점을 갖는다. 그러나 실생활의 다차원 데이터는 대체로 희박하여 저장될 때 압축되고, 데이터가 검색될 때는 원래의 위치 정보를 찾기 위해 인덱스를 필요로 하게 된다. 다양한 종류의 다차원 인덱스가 테이블 형태의 데이터를 대상으로 개발되어 있으나, 이들은 데이터의 삽입과 삭제에 유연하게 대처할 수 있도록 하기 위해서 인덱스 공간과 데이터 검색 시간에 약간의 낭비를 초래한다. 본 연구에서는 OLAP 데이터가 주기적으로 갱신되며, 분석에 필요한 집계 데이터도 점진적으로 갱신되기보다 실제로는 새로 생성되고 있다는 점을 고려하여, 읽기 전용 MOLAP 데이터를 위한 인덱스 구조를 제안한다. 데이터는 청크들로 나뉜 후 압축 저장되며, 각 청크는 위치 정보를 유지하면서 비트로 표현되어 인덱스에 저장되도록 하였다. 제안한 비트맵 인덱스는 높은 압축률을 보이며, 범위 질의(range query)를 포함한 OLAP 주요 연산들 처리에 특히 효율적이다.

  • PDF

편중 데이타의 효율적인 처리를 위한 공간 해쉬 스트립 조인 알고리즘 (A Spatial Hash Strip Join Algorithm for Effective Handling of Skewed Data)

  • 심영복;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.536-546
    • /
    • 2005
  • 이 논문은 공간 조인연산 시 인덱스가 존재하지 않는 두 입력 테이블에 대한 후보 객체들의 여과 단계 처리이다 이 분야에 대한 기존 알고리즘들은 대개 공간 데이타의 조인 연산에서는 우수한 성능을 나타내고 있지만 입력 테이블에 객체들이 편중되어 있을 경우 성능이 저하되는 문제를 가지고 있으며, 이러한 단점을 보완할 수 있는 방법에 대한 연구는 미흡한 상태이다 따라서, 이 논문에서는 인덱스가 존재하지 않는 두 입력 테이블의 편중된 객체에 대한 문제를 해결하기 위해 기존 연구인 Spatial Hash Join 알고리즘을 개선한 Spatial Hash Strip loin 알고리즘을 제안한다. SHSJ 알고리즘과 기존 SHJ 알고리즘의 차이점은 입력 데이타 집합을 버킷에 할당 시 버킷 용량에 제한을 두지 않는다는 점과 버킷의 조인 단계에서 SSSJ 알고리즘을 사용한다는 것이다. 제안한 SHSJ 알고리즘의 성능 평가를 위해 Tiger/line 데이타를 사용하여 평가한 결과 인덱스가 존재하지 않으며 편중 분포를 갖는 입력 테이블에 대한 공간 조인 연산의 성능이 기존 SHJ와 SSSJ 알고리즘보다 우수함이 검증되었다.

이동 P2P 환경에서 효율적인 피어 지역 색인 (An Efficient Local Peer Indexing in Mobile P2P Environment)

  • 곽동원;최길성;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.67-69
    • /
    • 2010
  • 본 논문에서는 이동 피어의 효율적인 콘텐츠 탐색을 지원하는 피어 지역 색인 기법을 제안한다. 제안하는 기법은 인덱스 테이블, 버디 테이블, 라우팅 테이블로 구성되며 타임스탬프 메시지를 이용하여 메시지 전송 비용을 감소시킨다. 제안하는 색인 구조는 동적인 이동성과 상황 정보를 고려하여 탐색정확도를 향상하고 탐색 비용을 감소시킨다.

  • PDF

저차원 집계 테이블들을 사용한 고차원 데이터의 온라인 분석 (Analysis of High Dimensional Data using Low Dimensional Summary Tables)

  • 최혜정;김명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.16-18
    • /
    • 2002
  • 다차원 데이터를 온라인으로 분석하기 위해서는 사전에 집계 테이블들을 계산해 둔다. 대용량 고차원 데이터의 경우는 집계 테이블의 분량이 천문학적으로 방대하기 때문에 사전 집계 계산이 현실적으로 불가능한 경우가 많다. 고차원 데이터 처리에 관한 연구로는 데이터의 차원 수를 감소시키거나 인덱스를 압축하여 질의처리 시간을 단축하려는 연구를 들 수 있는데, 이러한 방법들은 고차원 데이터의 온라인 분석시에 발생하는 데이터 폭발 현상을 근본적으로 해결하지는 못한다. 본 연구에서는 고차원 데이터가 분석될 때 실제로 저차원 집계 테이블들이 주로 사용된다는 점에 착안하여 데이터 폭발 현상을 감소시키면서 데이터를 분석하는 방안을 제시한다 이 방법은 사전 집계 연산을 할 때 크기가 방대한 고차원 집계 테이블들의 생성을 생략하고, 3-6차원 또는 그 이하 차원의 집계 테이블들만을 고속으로 동시에 생성하는 방법이다.

  • PDF

An Improved Index Structure for the Flash Memory Based F2FS File System

  • Kim, Yong-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.1-8
    • /
    • 2022
  • F2FS는 SSD(Solid State Drive)를 위한 파일시스템 중의 하나로서 리눅스 운영체제의 커널에 채용되어 널리 사용되고 있다. F2FS는 플래시 메모리의 특성을 반영하여 성능을 높이기 위한 여러 가지 방안들을 적용하였는데, 그 중의 하나가 파일별 데이터 블록들의 주소 정보를 관리하는 인덱스 구조의 개선이다. 본 논문에서는 F2FS의 인덱스 구조를 더욱 개선하여 성능을 높이는 방안을 제시하였다. F2FS는 모든 인덱스 블록들에 대하여 논리적 번호로 기록하고 이것을 물리적 번호로 매핑하는 테이블을 사용한다. 본 논문에서는 인덱스 블록들 중에서 끝단의 블록만 논리적 번호를 적용하고 앞단의 블록들은 물리적 번호를 직접 적용함으로써, 데이터 블록 접근시에 매핑 테이블을 검색하는 회수를 기존의 1~4회에서 1~2회로 줄일 수 있음을 보여주었다.