• 제목/요약/키워드: 데이타 큐브

검색결과 27건 처리시간 0.029초

데이터 웨어하우스의 성장에 따른 문제 해결을 위한 개선된 메타데이타 모델 (Enhanced Metadata Model for Growing Data)

  • 박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.386-388
    • /
    • 1998
  • 본 논문에서는 필드의 추가, 삭제에 의해 데이터 큐브의 확장과 서로 다른 시간구간의 뷰가 존재함을 밝히고 이에 따른 두 가지 문제점을 제안한다. 첫째 새로 추가된 필드에 따라 이전 데이터를 변화할 것인가\ulcorner 둘째 필드의 추가로 불필요해진 실체화된 뷰를 계속 유지할 것인가\ulcorner 이를 해결하기 위해 메타데이타를 통하여 데이터 큐브의 재구성이나 불필요한 뷰의 실체와 없이 다른 시간구간의 실체화된 뷰를 효과적으로 사용하는 기법을 제안한다. 본 논문에서 제안한 기법은 시간 축을 고려함으로써 데이터 큐브의 격자구조를 따라 의존관계의 뷰들을 부분적으로 사용하고 결과를 결합하는 방식이다. 성능평가를 통하여 데이터 웨어하우스의 변화 시 기존의 기법보다 좋은 질의처리 성능을 가짐을 보인다. 보다 빠른 질의처리를 위하여 데이터 큐브를 사용하고, 큐브를 구성하는 뷰들을 실체화 한다. 하지만 새로운 필드의 추가나 삭제와 같은 데이터 웨어하우스의 변화, 성장에 의해 구조변화 등의 문제가 발생하고, 이에 대하여 적절해 대응할 필요가 있다.

데이타 큐브에서 세분화된 뷰 실체화 기법 (Fine Granule View Materialization in Data Cubes)

  • 김민정;정연동;박웅제;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.587-595
    • /
    • 2001
  • 일반적으로 뷰라고 불리는 데이타 큐브의 일부를 실체화하여 저장하는 방법은 데이타 웨어하우스에서 많이 사용되는 기술이다. 유는 집계 함수로 정의되는 질의의 결과이다. 본 논문에서는 세분화된 뷰의 개념을 소개한다. 세분화된 뷰란 각 타원별로 정해진 구간에서의 집계 함수 결과이다. 이때 각 차원 별로 나누는 구간은 질의의 접근 형태를 기준으로 설정된다. 세분화된 뷰의 표현 및 선택을 위하여 AND-OR 큐브 그래프와 4ND-OR 최소 비용 그래프를 정의한다. 그리고, 이 구조체들을 이용하여 세분 화된 뷰 실체화 기법을 제안한다. 실험을 통해 제안하는 방법의 성능을 평가한다.

  • PDF

큐브 계산에서 I/O 비용을 줄이는 구간 기반 큐브 분할 (Range-based Cube Partitioning for Reducing I/O Cost in Cube Computation)

  • 박웅제;정연도;김진녕;이윤준;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.596-605
    • /
    • 2001
  • 본 논문은 OLAP에서의 I/O 비용을 줄이는 큐브 계산 방법으로, 구간 기반 큐브 분할 기법을 제안한다. 제안하는 방법은 큐브 분할 단계들 사이에 존재하는 계산의 일부를 중복시켜 처리하는 방법을 통해 큐브 분할 작업의 I/O 성능을 향상시킨다. 계산의 중복을 위하여 제안하는 방법은 애트리뷰트의 단 일 값이 아닌 애트리뷰트 값의 일정 구간을 기준으로 큐브를 분할한다 분석과 실험을 통하여 제안하는 방법의 성능을 기존 큐브 분할 방법과 비교하여 보인다.

  • PDF

관계 DBMS 상에서 전위 방식의 OLAP 큐브 생성 알고리즘의 성능 평가 (Performance Evaluation of Front-End OLAP Cube Generation Algorithms on Relational DBMS)

  • 조선화;김진호;문양세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2005
  • ROLAP 시스템에서는 다차원 OLAP 큐브를 관계 데이터베이스 내에 여러 집계 테이블을 사용하여 저장하며, 관계 DBMS 기능을 그대로 이용하므로 구현이 간단하다. 이들 집계 테이블들은 대용량의 소스 데이타(즉, 사실 테이블)를 정렬한 후 이에 대한 집계 값을 계산하므로 큐브를 생성하는데 많은 시간이 소요된다. 이러한 다차원 큐브를 효율적으로 생성할 수 있는 여러 가지 방법이 제안되었다. 이들 방법들은 큐브 생성 시간이 사실 테이블을 정렬하는데 주로 소요되므로 이 횟수를 줄이는 기법을 주로 제안하였다. 그러나 이러한 큐브 생성 알고리즘의 성능은 실제 DBMS 상에서 평가되지 않았다. 이 연구에서는 기존의 큐브 생성 알고리즘들을 관계 DBMS 상에서 그 성능을 비교 평가하였다.

  • PDF

메타큐브 : 부정형 물체의 모델링을 위한 새로운 구조 요소 (MetaCube : A New Skeletal Element for Modeling Informal Objects)

  • 김은석;김재정
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권4호
    • /
    • pp.353-361
    • /
    • 2000
  • 컴퓨터 그래픽스에서 모델링 요소를 선택하는 것은 사실적인 이미지를 실시간에 생성하는데 중요한 영향을 미친다. 특히 부정형 물체를 모델링하는데 있어서 적은 양의 데이타, 용이한 렌더링 및 확장성은 모델링 요소의 중요한 선택 기준이 된다. 음함수 곡면을 표현하는 많은 모델링 방법들 중 하나인 메타볼 모델은 적은 양의 데이타로 복잡한 곡면을 모델링할 수 있다는 장점을 갖는다. 그러나 곡면이 아닌 육면체와 같은 평면으로 구성되는 물체를 메타볼로 모델링하게 되면 다각형으로 모델링하는 것보다 더 많은 수의 데이타량을 요구하게 된다. 본 논문은 메타볼의 장점을 수용하면서 적은 수의 데이타로 평면형태의 물체까지 모델링할 수 있는 메타볼의 확장 형태인 메타큐브를 제안한다. 메타큐브는 두 개의 매개 변수 값에 의해 구에서 정육면체까지 자유로운 확장이 가능하므로 적은 수의 데이타로 곡면과 평면이 혼합된 물체를 쉽게 모델링할 수 있다.

  • PDF

중첩된-서브큐브: 전위-합 큐브를 위한 손실 없는 압축 방법 (Overlapped-Subcube: A Lossless Compression Method for Prefix-Sun Cubes)

  • 강흠근;민준기;전석주;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권6호
    • /
    • pp.553-560
    • /
    • 2003
  • 영역 질의는 의사결정에서 자주 사용되는 중요한 질의이다. 그러나, 영역 질의를 처리하기 위해서는 많은 점(cell)들이 검색되어야 하기 때문에 효율적인 처리가 쉽지 않았다. 이러한 문제를 해결하기 위해서 영역의 크기에 관계없이 일정한 시간에 영역 질의를 처리할 수 있는 전위-합 큐브(prefix-sum cube)가 제안되었다. 그러나, 전위-합 큐브는 영역 질의의 처리는 효율적으로 할 수 있지만, 그것을 저장하기 위해 매우 큰 저장 공간이 필요하다는 문제를 갖고 있다. 본 논문에서는 전위-합 큐브의 이 문제를 해결하기 위해서 손실 없이 전위-합 큐브를 압축하는 중첩된-서브큐브 압축 방법을 제안한다. 중첩된-서브큐브 압축 방법은 전위-합 큐브의 압축을 위해서 만들어진 것으로 압축된 상태에서 저장된 값을 검색할 수 있는 매우 유용한 특징이 있다. 이 특징으로 인해, 질의 처리 시 압축된 전위-합 큐브를 그대로 사용할 수 있다. 압축된 전위-합 큐브를 사용하면, 동일한 크기의 버퍼에 전위-합 큐브의 더 많은 부분을 저장할 수 있다. 이것은 질의 처리 시 디스크 입출력의 횟수를 획기적으로 감소시킨다.

메타큐브를 이용한 볼륨 데이터 자동 모델링 방법 (An Automatic Modeling Method of Volume Data Using Metacubes)

  • 김은석;김재정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.499-501
    • /
    • 2000
  • 음함수 곡면 모델의 대표적인 구조 요소인 메타볼은 다양한 형태의 곡면을 모델링하는데 뛰어난 성능을 갖는다[1]. 그러나 복잡한 형태의 물체는 곡면 뿐 아니라 평면적인 요소를 포함하기 때문에 메타볼만으로 부정형 물체를 모델링하는 데에는 많은 어려움이 따른다. 메타큐브는 메타볼의 장점을 수용하면서 적은 수의 데이터로 평면 형태의 물체가지 모델링할 수 있는 메타볼의 확장 형태로서, 두 개의 매개변수만으로 구에서 정육면체까지 자유로운 확장이 가능하다[2]. 본 논문은 메타큐브를 이용하여 볼륨 데이터로부터 3차원 물체를 자동 모델링하는 방법을 제안한다. 제안 방법은 볼륨 데이터의 형태에 기반하여 분할된 볼륨 트리를 이용하여 비교적 빠른 시간에 볼륨 데이터로부터 비슷한 형태의 3차원 물체를 재구성하는 메타큐브 집합을 추출한다. 다양한 볼륨데이타에 대한 실험 결과를 제시함으로써 제안 방법의 효용성을 증명한다.

  • PDF

멀티미디어 데이터의 다차원 연관규칙 마이닝 (Multi-Dimensional Association Rule Mining in Multimedia Data)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.233-236
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 특성국지화를 이용한 내용기반의 정보검색 기술과 다차원 데이터큐브 구축기술을 통해 멀티미디어 데이터에서 연관규칙을 찾아내는 멀티미디어 데이터마이닝 시스템 프로토타입을 제안한다. 특히 멀티미디어 데이터의 칼라, 질감 등 거시적인 이미지 성분 대신 이미지의 영역성과 유사성을 이용한 특성국지화방법을 이용하여 이미지를 분할함으로써 방대한 데이타에서 효과적인 내용기반의 정의 검색을 시행하고 검색한 벡터를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이터베이스에서 데이터간 연관규칙을 찾아내어 지식을 마이닝하는데 효과적인 다차원 데이터큐브를 구축하고 여기에 연관규칙 검색 알고리즘을 적용한다.

  • PDF

OLAP에서 MAX-of-SUM 질의의 효율적인 처리 기법 (Efficient Processing of MAX-of-SUM Queries in OLAP)

  • 정희정;김동욱;김종수;이윤준;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.165-174
    • /
    • 2000
  • OLAP 분야에서 지금까지 연구되어온 영역 질의는 주어진 영역에 대한 집단 연산의 결과를 구하는 단순한 형태이다. 그러나 실제 데이타 분석 과정에서는 이러한 단순한 형태의 영역 질의뿐만 아니라, 집단 연산이 포함된 특정 조건을 만족하는 데이타 큐브 내의 영역을 찾는 형태의 확장된 영역 질의에 대한 필요성이 존재한다. 본 논문에서는 이러한 확장된 영역 질의 유형의 일반적인 형태를 정의하고, 이에 대한 대표적인 예인 'MAX-of-SUM 질의'의 효율적인 처리 기법을 제안한다. MAX-of-SUM 질의는 데이타 큐브 상에서 영역합(SUM)이 최대(MAX)가 되는 영역을 찾는 질의를 의미한다. 본 논문에서는 MAX-of-SUM 질의 처리 시 검색의 대상이 되는 영역들에 대한 SUM 연산의 결과값이 취할 수 있는 범위를 미리 예측하는 기법을 제안한다. 즉, 영역에 대한 SUM 값의 범위를 예측함으로써, 이들 중에서 최대값을 찾기 위해 실제로 계산하여야 하는 영역의 개수를 줄여 빠른 질의 처리를 보장한다.

  • PDF

시공간 데이타웨어하우스를 위한 힐버트큐브 (Hilbert Cube for Spatio-Temporal Data Warehouses)

  • 최원익;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.451-463
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 대상공간을 일정한 크기의 셀로 나누고 그 셀들을 힐버트 값 순서로 저장한다. 이러한 셀들이 시간순서로 모여 규브형태를 이루게 된다. 또한 H-Cube는 시간의 흐름에 따라 변화되는 지역적인 데이타 편중에 대처하기 위해 적응적으로 셀을 정제한다. H-Cube는 정적인 공간 차원에서 움직이는 짐 객체에 초점을 두고 있는 적웅적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.