• 제목/요약/키워드: 다차원 데이터베이스

검색결과 147건 처리시간 0.025초

다차원 데이터 및 동적 이용자 선호도를 위한 색인 구조의 연구 (An Index Structure for Efficiently Handling Dynamic User Preferences and Multidimensional Data)

  • 최종혁;류관희;나스리디노프 아지즈
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권7호
    • /
    • pp.925-934
    • /
    • 2017
  • 다차원 색인 구조 중 대표적인 것은 R-tree에 기초한 색인으로써 공간 정보 등에 있어 강력한 성능을 보인다. 하지만 R-tree의 경우 차원의 수가 증가하거나 이용자 선호에 따라 부분 차원만을 이용하는 경우, 색인을 생성하는 시간이 크게 증가하고 생성된 색인의 효율성이 감소하는 문제를 갖고 있다. 따라서 지속적으로 차원이 증가하고 있는 최근의 다차원 데이터에는 해당 방법들은 적합하지 않다. 본 논문에서는 이런 문제를 해결하기 위해 해시 색인에 기반한 새로운 다차원 색인 구조인 다차원 해시 색인을 제안한다. 다차원 해시 색인은 해시 함수를 통해 데이터들을 유클리드 공간의 버킷들로 분류하여 색인을 생성하고 이후 탐색이 요청되었을 때 이용자 선호도에 따라 선택된 부분 차원의 공간을 탐색할 수 있는 해시 탐색 트리를 생성하여 효과적인 탐색을 수행한다. 실험 결과, 해당 기법은 R-tree와 비교하여 색인 생성에 있어 매우 큰 성능의 향상과 함께 탐색에서도 유사한 탐색 성능을 보이는 것을 확인할 수 있었다.

시간지원 데이타베이스에서 다차원 시간 집계 연산의 효율적인 처리 기법 (On Efficient Processing of Multidimensional Temporal Aggregates In Temporal Databases)

  • 강성탁;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.429-440
    • /
    • 2002
  • 시간지원 데이타베이스 시스템은 자료의 과거 및 현재, 그리고 미래의 상태까지 관리함으로써, 사용자에게 시간에 따라 변화하는 자료에 대한 저장 및 질의 수단을 제공한다. 시간지원 데이터베이스에서의 집계 연산은 집계 연산과 질의에 시간 애트리뷰트를 고려하므로 기존의 집계 연산과는 큰 차이가 있다. 본 논문에서는 다차원 시간 집계 연산에 초점을 둔다. 다차원 시간 집계 연산은 시간 애트리뷰트 뿐만 아니라 하나 이상의 일반 애트리뷰트까지 고려한 시간 집계 연산으로 이력 데이타 웨어 하우스, 전화 기록 관리(CBR) 등에 유용하다. 본 논문에서는 다차원 시간 집계 연산을 효율적으로 처리하기 위한 자료 구조인 PTA-tree를 제안하고, 이를 이용한 시간 집계 처리 기법을 제안한다. 또한 본 논문에서는 제안된 PTA-tree를 이용한 기법과 기존의 SB-tree를 확장한 기법의 성능을 최악 경우 분석과 실험을 통해 비교한다.

SIMD 벡터 명령어를 이용한 다차원 레코드 스캔 (Multi-Dimensional Record Scan with SIMD Vector Instructions)

  • 조성룡;한환수;이상원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.732-736
    • /
    • 2010
  • 대량의 데이터 처리 영역에 대한 중요성이 증가하는 가운데 다차원의 속성을 갖는 레코드에 대한 스캔을 필요로 하는 질의처리에 있어 SIMD 명령어 셋을 이용하여 보다 효율적인 스캔성능을 얻을 수 있다. 이러한 배경하에서 이 논문에서 제시하는 기법인 'SIMD 레코드 스캔'은 행-기반의 스캔으로 열-기반의 저장구조를 갖는 기존의 메모리 기반 데이터베이스 시스템에서 조건식 처리나 집계연산등에서의 연산성능을 높이기 위해 열에 종속적으로 SIMD 명령어를 이용하던 것과는 달리 다차원 속성들의 비교가 요구되는 레코드 스캔에서의 효율을 높일 수 있다. 이는 레지스터 및 시스템 메모리의 크기가 증가함에 따라 더 큰 성능향상을 가져올 수 있으며, 멀티코어 기반의 병렬화 기법과 독립적이므로 SIMD를 지원하는 단일 프로세서뿐 아니라 이들로 구성된 멀티코어 프로세서에도 기존 시스템이나 아키텍처를 변경하지 않고도 적용이 가능하다.

객체지향 질의처리를 위한 다차원 중포 속성 색인구조의 최적 설계기법 (Optimal Design Method of Multidimensional Nested Attribute Indexes for Object-Oriented Query Processing)

  • 윤동하;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1863-1866
    • /
    • 2002
  • 본 논문에서는 객체지향 데이터베이스 시스템에서 중포 속성에 대한 색인구조로 다차원 색인구조를 이용하는 다차원 중포 색인구조(Multidimensional Nested Attribute Index: MD-NAI)의 최적 설계기법을 제시한다. MD-NAI는 일차원 색인구조를 이용한 중포 속성 색인구조에서 지원할 수 없는 클래스 계층상의 클래스 대치가 있는 중포 술어의 질의처리를 잘 지원할 수 있다. 그러나, MD-NAI는 사용자 질의 형태에 따라 색인검색의 성능이 매우 나빠질 수 있다. 본 논문에서는 질의 형태에 따른 MD-NAI의 성능 개선을 위하여, 먼저 중포 술어에 대한 질의 정보로서 MD-NAI의 색인 페이지 영역의 최적 모양을 결정하고, 이 최적 모양을 갖는 색인 페이지 영역의 모양이 되도록 하는 영역분할 전략을 적용한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 최적의 MD-NAI를 구성할 수 있었으며, 삼차원 MD-NAI의 경우에 질의 형태에 따라 5.5배까지 성능이 향상되었다.

  • PDF

멀티미디어 데이터의 다차원 연관규칙 마이닝 (Multi-Dimensional Association Rule Mining in Multimedia Data)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.233-236
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 특성국지화를 이용한 내용기반의 정보검색 기술과 다차원 데이터큐브 구축기술을 통해 멀티미디어 데이터에서 연관규칙을 찾아내는 멀티미디어 데이터마이닝 시스템 프로토타입을 제안한다. 특히 멀티미디어 데이터의 칼라, 질감 등 거시적인 이미지 성분 대신 이미지의 영역성과 유사성을 이용한 특성국지화방법을 이용하여 이미지를 분할함으로써 방대한 데이타에서 효과적인 내용기반의 정의 검색을 시행하고 검색한 벡터를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이터베이스에서 데이터간 연관규칙을 찾아내어 지식을 마이닝하는데 효과적인 다차원 데이터큐브를 구축하고 여기에 연관규칙 검색 알고리즘을 적용한다.

  • PDF

데이터 웨어하우스에서 다차원 데이터를 위한 피벗 테이블의 효율적인 처리를 위한 관계 대수 변환 (Relational Algebra Query Transformation for Processing Efficiently Pivot Tables for Multi-dimensional Data in Data Warehouses)

  • 신성현;김진호;문양세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2005
  • 데이터 웨어하우스에서는 데이터를 다양한 관점으로 분석하기 위해 데이터를 다차원 형태로 유지한다. 이 다차원 데이터를 간단하고 편리한 형태로 사용자에게 표현하기 위해 피벗 테이블이 이용된다. 피벗 테이블은 데이터에 대한 요약된 정보를 제공하는데 널리 사용되는 편리한 표현 방법이지만, 실제 값이 열의 제목으로 나오기 때문에 많은 개수의 열을 가질 수 있다. 이러한 피벗 테이블을 그대로 저장할 경우 관계 DBMS의 테이블 컬럼 수에 제약을 받게 되며, 데이터 저장 및 질의 처리에 성능이 떨어질 수 있다. 이 논문은 관계 데이터베이스의 테이블을 이용하여 피벗 테이블을 효율적으로 저장하는 방법을 제안한다. 이때, 피벗 테이블에 대한 질의물 저장된 형태의 테이블에 적용 가능하도록 질의를 변환시켜야 한다. 따라서 이 연구에서는 피벗 테이블에 대한 관계 연산자들(실렉션, 프로젝션, 합집합, 차집합 카디션 곱)을 효율적으로 변환하는 질의 변환 방범을 제안한다.

  • PDF

시공간데이터베이스의 다차원 선택도 추정을 위한 웨이블렛 기반 히스토그램 (Simple Wavelet-based Histogram of Multidimensional Selectivity Estimation for Spatio-temporal Databases)

  • 권정민;신병철;이종연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.34-36
    • /
    • 2005
  • 선택도 추정 기법은 상용 데이터베이스에서 질의 최적화를 위해 많이 사용하고 있다. 그 중 선택도 추정 기법에 가장 많이 사용되고 있는 기법은 히스토그램이다. 최근 시공간 데이터베이스 관련 연구에서 시간$\cdot$공간 데이터베이스의 선택도 추정 기법이 활발하게 이루어지고 있다. 이 히스토그램 추정 기법이 과거에서 현재시점까지 범위 질의 수행을 성공적으로 이루어지고 있지만 대량의 데이터들을 효율적으로 관리하기에는 저장오버헤드가 너무 크다. 본 논문에서는 시공간데이터베이스에서 성공적으로 선택도 추정을 다룬 히스토그램 추정 기법을 보완하여 과거 이력데이터들의 저장을 효율적으로 할 수 있는 압축기법을 제안한다. 현재 객체에 대해서는 기존 연구에서 성공적으로 이루어진 히스토그램 기반 추정 기법을 응용하고 과거 이력데이터에 대해서는 압축기법인 웨이블렛을 응용하여 선택도추정의 오류율과 저장오버헤드의 향상이 기대된다.

  • PDF

능동규칙에서 시공간 사건의 검출과정 (An Detection Process of Spatiotemporal Event in Active Rule)

  • 이지영;신예호;오광진;윤성현;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.367-369
    • /
    • 1999
  • 기존의 능동 데이터베이스 시스템에 관한 연구는 관계형 및 객체지향형 데이터베이스 시스템을 위주로 연구되어 왔다. 그런데 능동규칙이 다차원 공간상의 공간 객체 및 공간 객체의 시간 흐름에 따른 이력을 포함하는 시공간 데이터를 다루기 위해서는 능동규칙의 시공간 확장이 필요하다. 이에 이 논문은 시공간 능동규칙 연구의 일환으로서 시공간 사건을 정의하기 위한 사건 부분을 시공간에 대응하도록 확장하고 이의 검출 모델에 관해 연구한다.

  • PDF

국제물류 통합 플랫폼 서비스를 위한 데이터웨어하우스 스키마 설계 (Design of Data Warehouse Schema for International Logistics Platform Services)

  • 이선영;이종연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.318-321
    • /
    • 2008
  • 국제물류 EPCglobal Network 프레임워크에서 대용량 운송 데이터베이스의 누적과 경영 전략의 의사결정에 필요한 지식 탐사를 위해 데이터 웨어하우스 시스템 도입이 요구된다. 따라서 본 연구에서는 국제물류 통합 플랫폼을 지원하는 데이터 웨어하우스를 설계하기 위해 현재 데이터베이스 시스템을 분석하고 다차원 데이터 모델인 사실 별자리 스키마 구조를 이용한다. 또한 설계된 데이터웨어하우스를 통해 의사결정을 지원할 수 있는 지식탐사를 위한 질의들의 예를 보여준다.

VA-Tree : 대용량 데이터를 위한 효율적인 다차원 색인구조 (VA-Tree : An Efficient Multi-Dimensional Index Structure for Large Data Set)

  • 송석일;이석희;조기형;유재수
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.753-768
    • /
    • 2003
  • 이 논문은 다차원의 특징벡터를 벡터 근사치로 표현한 후 색인 트리를 구성하여 검객의 효율을 높이는 VA(Vector Approximate)-트리를 제안한다. 이 논문에서 제안하는 VA-트리는 전체적인 색인구조의 저장 공간을 줄이기 위해서 VA-화일의 벡터 근사치 개념을 이용하여 데이터양이 증가해도 검색 성능이 저하되지 않도록 하는 트리 형태의 구조를 갖는다. VA-트리는 MBR 기반의 색인구조이지만 MBR간에 겹침이 발생하지 않는 분할 방법을 사용하여 검색 효율을 높인다. 제안하는 색인구조와 기존의 여러 다차원 색인구조와의 성능 평가를 통해 제안하는 방법의 우수함을 보인다.

  • PDF