• 제목/요약/키워드: multidimensional indexes

검색결과 25건 처리시간 0.025초

다차원 범위 질의를 위한 순차 색인 기법 (A Sequential Indexing Method for Multidimensional Range Queries)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.254-262
    • /
    • 2005
  • 이 논문은 다차원 범위 질의를 위한 순차 색인 기법인 세그먼트-페이지 색인(SP-색인)이라는 새로운 색인 기법을 제안한다. SP-색인의 목표는 (1) 다차원 색인 기법에서의 범위 질의의 성능 향상, (2) 과도한 색인의 재구성 없이 색인의 클러스터링이라는 두 가지로 요약된다. 오랜 동안의 데이타베이스 연구 결과로 다양한 다차원 색인 기법이 개발 되었지만, 대부분의 연구가 데이타 레벨의 클러스터링에 초점을 맞추었고, 색인 자체의 클러스터링에는 거의 관심을 두지 않았다. 따라서 대부분의 관련된 색인 노드가 디스크에 분산되고, 질의 처리 시에 많은 무작위 디스크 접근이 발생한다. SP-색인은 관련된 노드를 연속적인 디스크 페이지로 구성되는 하나의 세그먼트에 저장하여 노드들의 분산을 피하고, 세그먼트 내에서의 순차 접근을 통해 질의 처리 성능을 높인다. 실험 결과에 따르면 SP-색인은 페이지 기반의 전통적인 색인기법에 비해 수행 시간 면에서 수 배의 성능 향상을 보이고, 단순히 큰 페이지를 사용에 따른 디스크 대역폭 낭비를 줄인다.

다차원 파일구조를 이용한 객체지향 데이터베이스의 중포속성 색인기법 (Indexing Techniques or Nested Attributes of OODB Using a Multidimensional Index Structure)

  • 이종학
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2298-2309
    • /
    • 2000
  • 본 논문에서는 객체지향 데이터베이스의 중포속성에 대한 색인기법으로 다차원 색인구조를 이용하는 다차원 중포속성 색인기법은 MD-NAI를 제안한다. 중포석성에 대한 기존의 색인기법들은 중포된 객체에 대한 기존의 색인기법들은 B+-tree와 같은 일차원 색인구조를 이용함으로써, 클래스 계층과 중포속성이 포함된 복합 형태의 질의들에 대한 처리를 잘 지원하지 못한다. MD-NAI에서는 객체지향 데이터베이스의 클래스 계층에 대한 색인기법인 이차원 클래스 계층 색인기법(2D-CHI)을 다차원으로 확장한다. 2D-CHI는 키 속성 도메인과 클래스 식별자 도메인으로 구성된 이차원 도메인 공간상에서 객체들의 클러스터링을 다루는 색인기법이다. 본 논문의 MD-NAI에서는 색인된 중포속성을 표현하는 경로상의 각 클래스 계층마다 하나의 클래스 식별자 도메인을 할당하여 구성된 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다룬다. 따라서, MD-NAI에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위 클래스 계층상의 임의의 클래스들로 제한되거나, 질의에 포함된 복합속성들의 도메인이 클래스 계층상의 임의의 클래스들로 제한되는 경우에도 잘 지원할 수 있다.

  • PDF

Z-인덱스 기반 MOLAP 큐브 저장 구조 (A Z-Index based MOLAP Cube Storage Scheme)

  • 김명;임윤선
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.262-273
    • /
    • 2002
  • MOLAP(multi-dimensional online analytical processing)은 데이타의 다차원적 분석 기술로서, 이는 질의 처리 속도를 높이기 위해 데이타를 큐브(cube)라고 불리는 다차원 배열에 저장하고 배열 인덱스를 사용하여 데이타를 엑세스한다. 큐브는 다양한 방식으로 디스크에 저장될 수 있으며 이 때 사용되는 방식에 따라 MOLAP의 주요 연산인 슬라이스와 다이스 연산 속도가 크게 영향을 받는다. 이러한 연산들을 효율적으로 처리하기 위해 다차원 배열을 작은 크기의 청크로 나누고 이 들 중에서 희박한 청크들을 압축하여 저장하는 기법이 [1]에 제안되어 있다. 이 방식에서는 청크들을 행우선 순서로 디스크에 저장한다. 본 연구에서는 청크들을 밀도와 인접도 기준으로 배치시킴으로써 슬라이스와 다이스 연산 속도를 향상시키는 방법을 제시한다. 청크 밀도를 이용하여 청크들을 디스크 블록 경계에 가능한 한 맞추었고, Z 인덱싱을 사하여 인접한 저밀도 청크들을 군집화 함으로써 디스크 I/O의 속도를 높였다. 제안한 큐브 저장 방식은 일반적 비즈니스 데이타의 분석에 흔히 사용되는 3~5차원의 큐브 저장에 효율적이라는 것을 실험적으로 보였다.

공간 데이타베이스에서 최근접 K쌍을 찾는 효율적 기법 (An Efficient Method for Finding K Nearest Pairs in Spatial Databases)

  • 신효섭;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.238-246
    • /
    • 2000
  • R 트리와 같은 다차원 인덱스로 구성된 2개의 공간 데이타 집합들에 대하여 거리가 가까운 순서대로 점진적으로 객체 쌍을 찾는 거리조인(distance join) 알고리즘이 이전에 제안된 바 있다. 본 논문에서는 찾고자 하는 객체 쌍의 개수 K를 미리 정할 때 거리 우선순위 큐를 이용한 효율적인 K-거리조인 기법을 제안한다. 특히 양쪽 노드 확장 방식과 스위핑 축 및 방향의 선택 기법을 이용한 최적화된 평면 스위핑 가지치기 기법을 통한 거리조인 알고리즘을 개발한다. 실제 지리정보 데이타 집합을 가지고 실험을 수행하여 본 논문에서 제안한 알고리즘이 기존의 알고리즘들보다 좋은 성능을 나타냄을 확인한다.

  • PDF

다차원 중포 속성 색인구조의 최적 설계기법 (An Optimal Design Method for the Multidimensional Nested Attribute Indexes)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.194-207
    • /
    • 2003
  • 본 논문에서는 객체 데이터베이스 시스템에서 중포 속성에 대한 색인구조로 다차원 색인구조를 이용하는 다차원 중포 속성 색인구조(Multidimensional Hefted Attribute Index: MD-NAI)의 최적 설계 기법을 제시한다. MD-NAI는 $B^{+}$-tree와 같은 일차원 색인구조를 이용한 중포 속성 색인구조에서 지원할 수 없는 클래스 계층과 중포 속성이 포함된 복합 형태의 질의들에 대한 처리를 잘 지원할 수 있다. 그러나, MD-NAI는 사용자 질의 형태에 따라 색인검색의 성능이 매우 나빠질 수 있다 본 논문에서는 질의 형태에 따른MD-NAI의 성능 개선을 위하여, 먼저 중포 술어에 대한 질의 정보로서 색인 페이지 영역의 최적 모양을 결정하고, 이 최적 모양을 갖는 색인페이지 영역의 모양이 되도록 하는 영역분할 전략을 적용하여 최적의 MD-NAI를 구성한다. 또한, 성능평가를 위하여 MD-NAI를 이용하여 다양한 중포 술어의 형태와 객체 분포에 대하여 실시한 실험 결과를 제시한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 최적 의 MD-NAI를 구성할 수 있었으며, 삼차원 MD-NAI의 경우에 질의 영역의 구간비가 1:16:256일 때 기존의 순환분할 전략에 의한 MD-NAI에 비해 성능이 5.5배 이상까지 향상되었다.

  • PDF

시퀀스 데이터베이스에서 타임 워핑을 지원하는 효과적인 인덱스 기반 서브시퀀스 매칭 (An Index-Based Approach for Subsequence Matching Under Time Warping in Sequence Databases)

  • 박상현;김상욱;조준서;이헌길
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.173-184
    • /
    • 2002
  • 본 논문에서는 대용량 시퀀스 데이터베이스에 타임 워핑을 지원하는 인덱스 기반 서브시퀀스 매칭에 관하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해준다. 최근의 연구에서 타임 워핑을 지원하는 효과적인 전체 매칭 기법을 제안된바 있다. 이 기법은 데이터 시퀀스들로부터 타임 워핑에 영향을 받지 않는 특징 벡터들의 집합을 대상으로 인덱스를 구성한다. 또한, 특징 공간상에서의 필터링을 위하여 삼각형 부등식을 만족하는 타임 워핑 거리의 하한 함수를 사용한다. 본 연구에서는 이 기존의 연구에 슬라이딩 윈도우를 기반으로 하는 접두어-질의 방법을 결합하는 새로운 기법을 제안한다. 인덱싱을 위하여 각 슬라이딩 윈도우와 대응되는 서브 시퀀스로부터 특징 벡터를 추출하고, 이 특징 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 구성한다. 질의 처리를 위하여, 조건을 만족하는 질의 접두어들에 대한 특징 벡터들을 이용하여 다수의 인덱스 검색을 수행한다. 제안된 기법은 대용량의 데이터베이스에서도 효과적인 서브시퀀스 매칭을 지원한다. 본 연구에서는 제안된 기법이 착오 기각을 유발시키지 않음을 증명한다. 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 따르면, 제안된 기법은 실제 S&P 500 주식 데이터와 대용량의 생성 데이터 모두에 대하여 큰 성능 개선 효과를 보이는 것으로 나타났다.

다차원 색인을 이용한 밀도 기반 클러스터링의 근사적 접근 방법 (An Approximate Approach for Density-Based Clustering Using Multidimensional Indexes)

  • 황재준;문양세;황규영;장주현;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.37-39
    • /
    • 2005
  • 본 논문에서는 기존의 밀도 기반 전지 클러스터링 알고리즘의 성능을 개선한 밀도 기반 클러스터링의 근사적 접근법을 제안한다. 기존의 밀도 기반 전지 알고리즘은 다차원 색인의 많은 검색 공간을 빠르게 전지하면서도 원하는 클러스터를 정확히 찾아내는 특징을 가지고 있다. 그러나 기존 알고리즘은 전지를 위한 한계 값 설정을 위하여 단말 영역들의 밀도 값을 사용함으로써, 내부 영역에 속한 단말 영역들 간의 밀도 편차가 큰 경우 전지 여부에 대한 판별이 빨리 이루어지지 않는다. 또한, 최악의 경우에는 모든 단말 페이지를 검색하여야 하고, 이에 따라 성능이 저하될 수 있다. 반면에 제안하는 근사적 접근법에서는 한계 값 설정을 위해 단말 영역이 아닌 내부 영역의 밀도 값을 사용한다. 일반적으로, 내부 영역들 간의 밀도 편차는 단말 영역들 간의 밀도 편차보다 크지 않으므로, 근사 밀도 기반 전지 알고리즘에서는 더욱 많은 검색 공간의 전지 여부의 빨리 판별할 수 있게 된다. 성능 평가 실험을 수행한 결과, 제안한 알고리즘은 기존의 알고리즘과 비교하여 정확성 측면에서는 큰 차이가 없는 반면 수행 시간 측면에서는 최대 $17\%$의 성능 향상 효과가 있는 것으로 나타났다.

  • PDF

통증(痛症)의 임상적평가법(臨床的評價法)에 관한 고찰(考察) (The Study For Clinical Measurement of Pain)

  • 신승우;정석희;이종수;신현대;김성수
    • 동국한의학연구소논문집
    • /
    • 제8권2호
    • /
    • pp.25-46
    • /
    • 2000
  • 통증은 환자들로 하여금 내원하게 하는 주된 증상중의 하나로, 치료방법의 선택 및 효과 판정을 위해서는 적절한 평가가 필요하다. 통증은 실험적인 방법과 임상적인 방법에 의해 측정될 수 있는데, 통증의 주관적인 성격상 임상적인 방법이 일반적으로 사용된다. 통증의 임상적측정법은 일차원적측정법과 다차원적측정법으로 대별할 수 있는데, 일차원적 측정법으로는 시각적상사척도(Visual Analogue Scale), 구술적평정척도(Verbal Rating Scale), 수치평정척도(Numerical Rating Scale), 통증표정척도(Pain Faces Scale), 그리고 포커칩 도구(Poker Chip Tool)등이 있고, 다차원적 측정법으로는 McGill 동통질문서(McGill Pain Questionnaire), 다면적인성검사(MMPI), 통증행동척도(Pain Behavior Scale), 통증장애지표(Pain Disability Index), 그리고 통증평정척도(Pain Raing Scale)등이 있다. 일차원적 측정법은 주로 환자의 자가통증평가법에 기초하여 통증의 강도를 측정하는데, 측정방법의 단순함과 신속성으로 인해 급성통증을 평가하는데 주로 사용된다. 다차원적인 측정법은 통증의 주관적, 정신적 그리고 행동적인 면을 측정하는데, 측정방법이 포괄적이고 신뢰성이 있어서 만성통증을 측정하는데 사용된다. 환자의 언어와 인지능력은 정확한 통증을 평가하는데 장애가 되는 주된 요인이다. 통증에 따른 행동반응이나 생체반응은 환자의 통증을 완전히 대변하지 못하지만 이러한 상황에 있어 유용한 통증평가지표가 될 수 있다. 통증평가법을 결정할 때에는 먼저 측정하려고 하는 통증의 성격을 고려하여 어떠한 면을 측정할 것인가를 결정해야하며 아울러 환자의 언어와 인지능력을 고려해야 한다. 적절한 평가법의 선택은 환자의 진단과 치료에 있어 유효한 결론에 이르게 하는 중요한 과정이다.

  • PDF

대용량 데이터베이스에서 다차원 인덱스를 사용한 효율적인 다단계 k-NN 검색 (Efficient Multi-Step k-NN Search Methods Using Multidimensional Indexes in Large Databases)

  • 이상훈;김범수;최미정;문양세
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.242-254
    • /
    • 2015
  • 본 논문에서는 다차원 인덱스 기반 다단계 k-NN 검색의 성능 향상 문제를 다룬다. 기존 다단계 k-NN 검색에서는 고차원 객체의 저차원 변환으로 인한 정보 손실로 k-NN 질의 결과 매우 큰 허용치(검색 범위)가 결정되어 범위 질의 결과로 많은 후보가 검색된다. 또한, 많은 후보는 후처리 과정에서 매우 많은 I/O 및 CPU 오버헤드를 발생시킨다. 본 논문에서는 이와 같은 고찰에 기반하여 범위 질의의 허용치를 줄여 후보 개수를 줄이고 이를 통해 성능을 향상시키는 방법을 제안한다. 먼저, k-NN 질의 결과로 결정된 허용치를 고차원 및 저차원 객체간 거리 비율로 강제 축소하여 범위 질의에 사용하는 허용치 축소 (근사적) 해결책을 제안한다. 다음으로, k-NN 질의 계수 k 대신 c k 를 사용하여 얻은 보다 타이트(tight)한 허용치로 범위 질의를 수행하는 계수 제어 (정확한) 해결책을 제안한다. 실제 객체 데이터를 사용하여 실험한 결과, 제안한 두 가지 해결책은 기존 다단계 k-NN 검색에 비해 후보 개수와 검색 시간 모두를 크게 향상시킨 것으로 나타났다.

R-tree에서 Seeded 클러스터링을 이용한 다량 삽입 (Bulk Insertion Method for R-tree using Seeded Clustering)

  • 이태원;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.30-38
    • /
    • 2004
  • 지구 관측 시스템(EOSDIS)나 많은 수의 클라이언트를 추적하는 이동전화 서비스 등 많은 응용에서는 지속적으로 생겨나는 대량의 복잡한 데이타들을 보관하고 인덱싱하는 것이 매우 어려운 일이다. 다차원 데이타를 효과적으로 관리하기 위해 R-tree에 기반 한 인덱스 구조가 널리 사용되어 왔다. 본 논문에서는 빠른 데이타 생성 속도를 따라잡으면서 대량 삽입을 통해 R-tree를 관리할 수 있는 seeded clustering이라는 확장성 있는 기법을 제안한다. 이 기법에서는 삽입할 대상 R-tree의 상위 k레벨의 구조를 활용하여 시드 트리를 만들어 삽입 데이타를 분류해 클러스터를 생성한다. 그리고 각 클러스터로부터 삽입 R-tree를 생성하고 이를 대상 R-tree에 한 번에 하나씩 삽입한다. 논문에서는 자세한 알고리즘과 함에 다양한 실험 결과를 보여준다. 실험 결과를 통해 seeded clustering을 이용한 대량 삽입이 기존의 대량 삽입 기법들과 비교해 삽입이나 질의 처리 모두에서 우수함을 알 수 있다.