• 제목/요약/키워드: 공간데이터웨어하우스

검색결과 46건 처리시간 0.031초

저장 공간이 제약된 환경에서 계층적 비트맵 인덱스 생성에 관한 연구 (Building Hierarchical Bitmap Indices in Space Constrained Environments)

  • 김종욱
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권1호
    • /
    • pp.33-41
    • /
    • 2015
  • 비트맵 인덱스는 낮은 카디널리티를 갖는 컬럼에 대한 OLAP 질의의 수행 속도에 있어서 매우 우수한 성능을 보이고 있기 때문에, 데이터 웨어하우스에서 많이 사용하고 있는 인덱스 기법 중에 하나이다. 일반적으로 데이터 웨어하우스에 기반을 둔 많은 응용 프로그램들은 컬럼 값들이 계층 구조를 형성하는 경우가 많이 있다. 만일, 컬럼 값들이 계층적으로 표현될 수 있는 경우 일반적인 비트맵 인덱스 보다 계층적 비트맵 인덱스를 이용하는 것이 질의 처리 수행 속도에 있어서 더 높은 성능을 보인다고 알려지고 있다. 그러나 계층적 비트맵 인덱스의 경우 사용하는 계층 구조의 크기가 큰 경우 저장 공간 오버헤드가 발생할 수 있다는 문제점을 가지고 있다. 그러므로 본 논문에서는 저장 공간이 제약된 환경에서 컬럼 값들이 거대 계층 구조를 형성하고 있을 때, 질의 워크로드에 기반하여 계층적 비트맵 인덱스를 효과적으로 생성하기 위한 방법을 제안한다. 특히, 본 논문에서는 주어진 계층 구조를 두 개의 배타적 역영으로 나누는 Cut 선택 방법 제안함으로써, 계층적 비트맵 인덱스의 저장 공간 오버헤드 문제를 해결한다.

공간 데이터 웨어하우스에서 시공간 데이터의 효율적인 집계 정보 관리 기법 (Efficient Aggregate Information Management of Spatiotemporal Data in Spatial Data Warehouses)

  • 유호선;유병섭;박순영;이재동;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2005
  • 다차원 분석을 위한 OLAP 연산에서는 사용자의 요청에 빠르게 응답하기 위해 집계 값을 미리 계산하여 저장해 두는 사전 집계 방식을 이용한다. 시공간 데이터에 대한 사전 집계 기법으로는 R-트리의 각 노드에 대한 과거 집계 값을 요약 테이블로 관리하는 기법과 R-트리의 노드에서 현재 집계 값을 관리하는 기법이 있다. 그러나 이 기법들은 현재와 과거 모두의 집계 정보를 필요로 하는 시스템에서는 성능이 저하되며, 특히 과거 집계 정보의 경우 시간에 따른 계층화가 되어있지 않아 시간에 대한 계층 분석에 어려움이 있다. 본 논문에서는 시공간 데이터의 현재와 과거 집계 정보를 효율적으로 관리하는 기법을 제안한다. 제안 기법은 aR-tree를 이용하여 해당 영역에 대한 현재 집계 정보를 저장하고, 각 노드에 과거 집계 정보에 대한 연결을 위하여 링크를 추가하였다. 과거 집계 정보는 각 노드의 과거에서 현재까지의 집계 정보를 계층 구조로 유지하는 시간 요약 집계 테이블을 만들어 저장한다. 따라서 제안한 기법은 현재와 과거 집계 정보를 모두 유지할 수 있으므로 현재와 과거 집계 정보에 대한 처리 성능을 향상시킨다. 또한 제안 기법에서는 공간 정보를 공간 인덱스인 R-트리로 유지하고, 과거로부터의 시간 정보를 시간 요약 집계 테이블을 이용하여 계층화시켜 유지하므로 시간과 공간에 대한 계층 분석이 용이하다.

  • PDF

데이터 웨어하우스의 다차원 온라인 분석처리 시스템을 위한 저장구조의 물리적 설계기법 (A Physical Design Method of Storage Structures for MOLAP Systems of Data Warehouse)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.297-312
    • /
    • 2005
  • 데이터 웨어하우스의 다차원 온라인 분석처리 시스템(MOLAP)에서 집계 연산은 중요한 기본 연산이다. 기존의 MOLAP 집계 연산은 다차원 배열구조를 기반으로 한 파일구조에 대해서 연구되어 왔다. 다차원 배열구조는 편중된 분포를 갖는 데이터에서는 잘 동작하지 못한다는 단점이 있다. 본 논문에서는 편중된 분포에도 잘 동작하는 다차원 파일구조를 사용한 MOLAP 저장구조의 물리적 설계기법을 제안한다. 먼저, 균일분포를 갖는 데이터에 대해서 집계 연산처리 성능이 다차원 파일구조상의 질의 영역의 모양과 다차원 파일구조의 도메인 공간을 이루는 페이지 영역의 모양 사이의 유사성에 따라 크게 영향 받음을 보이고, 이러한 특성을 이용하여 다차원 파일구조를 설계함으로써 다차원 온라인 분석처리의 성능을 향상시킨다. 그리고 편중된 분포에 대해서는 질의 영역별로 가중치를 부여한 정규화된 질의 영역의 모양을 이용함으로써 데이터의 분포에 따른 영향을 설계에 반영한다. 또한 본 논문에서는 실험을 통하여 이론적으로 제안한 MOLAP 저장구조의 물리적 설계기법이 실제 환경에서 정확히 동작함을 보인다. 실험결과에 의하면 이차원 파일구조의 경우 집계 연산처리를 위한 저장구조의 성능이 일곱 배 이상으로 향상됨을 확인하였다. 삼차원 이상의 파일구조에 대해서는 더욱더 큰 성능향상이 예상된다. 이러한 성능의 향상은 제안된 MOLAP 저장구조의 물리적 설계기법이 매우 유용함을 나타내는 것이다.

  • PDF

데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법 (Materialized View Selection using Decision Tree in Data Warehouse)

  • 장윤경;유병섭;어상훈;김경배;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.63-66
    • /
    • 2006
  • 실체화 뷰 선택은 질의 수행 시간과 제한된 저장 공간 등의 유지 비용을 고려하여 최적의 실체화 뷰 집합을 선택하고 유지하는 것이다. 본 논문에서는 의사결정 트리를 이용한 실체화 뷰 선택기법을 제안한다. 제안기법은 의사결정 트리를 이용하여 실체화 뷰로 생성될 질의를 판단하고 실체화 뷰 교체가 필요한 경우 메타데이터 테이블을 이용하여 교체 대상을 결정한다. 의사결정 트리는 높은 우선순위를 가진 속성으로부터 차례대로 데이터를 분류하기 때문에 이용도가 높은 실체화 뷰를 선택하는 방법을 제공하고 메타데이터 테이블은 실체화 뷰 집합의 빠른 교체 수행과 효율적인 유지보수를 제공한다. 성능평가를 통해 제안된 기법은 실체화 뷰 비율에 따른 질의처리 시간이 기존기법보다 약 13%의 성능 향상을 보였다.

  • PDF

공간적 의사결정을 위한 공간 데이터 웨어하우스 설계 및 활용

  • 박지만;황철수
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 추계학술대회논문집
    • /
    • pp.9-14
    • /
    • 2003
  • The major reason that spatial data warehousing has attracted a great deal of attention in business GIS in recent years is due to the wide availability of huge amounts of spatial data and the imminent need for turning such data into useful geographic information. Therefore, this research has been focused on designing and implementing the pilot tested system for spatial decision making. The purpose of the system is to predict targeted marketing area by discriminating the customers by using both transaction quantity and the number of customer using credit card in department store. Focused on the analysis methodology, the case study is aiming to use GIS and clustering for knowledge discovery. The system is a key section of the research of multi-dimensional and spatio-temporal analysis in the internet environment.

  • PDF

한국의 공간데이터웨어하우스 기술현황 조사 (Status of Spatial Data Warehouse in Korea)

  • 김승용;염재홍
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2007년도 춘계학술발표회 논문집
    • /
    • pp.237-242
    • /
    • 2007
  • The NGIS(National Geographic Information System) project is in its third phase currently. To put the produced data to practical use, central and local governments are trying to implement spatial data warehouse(SDW). In this study, status of local and international SDW(Spatial Data Warehouse) technology were investigated. It has been observed that in Korea it was necessary to shift the focus from management of spatial data to servicing of spatial data to information end users. To that end, the following tasks should be pursued : 1) standardization, 2) automatic ways of linking various legacy administrative information, 3) development of customized middleware for spatial data integration and 4) legal system infra structure.

  • PDF

GIS-AMR 부하 분석 모델에서의 전력 부하 예측을 위한 시공간 패턴 마이닝 (Spatio-temporal Pattern Mining for Power Load Forecasting in GIS-AMR Load Analysis Model)

  • 이헌규;박명호;박진형;신진호;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.3-6
    • /
    • 2009
  • 변압기 무선부하감시 시스템에서 30분 간격으로 계측된 부하 데이터와 GIS-AMR 데이터웨어하우스로부터 변압기 속성 및 공간적 특징을 추출하여 정확한 변압기의 부하 패턴을 예측하기 위한 시공간 패턴 마이닝 기법을 적용하였다.

분할된 압축 인덱스를 이용한 컬럼-지향 플래시 스토리지의 검색 성능 개선 (Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index)

  • 변시우
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.393-401
    • /
    • 2013
  • 대부분의 기존 데이터베이스들은 빠른 저장 성능을 얻기 위하여 한 레코드의 속성들을 하드 디스크에 연속적으로 배치하는 레코드-지향 저장 모델을 사용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템에는 월등한 읽기 성능 때문에 컬럼-지향 저장 방식이 적합한 모델이 되고 있다. 또한, 현재 플래시 메모리가 고속 데이터베이스 시스템을 위한 선호 저장 매체로 인정되고 있다. 본 논문에서는 고속 컬럼-지향 데이터베이스 모델을 도입하고, 고속 컬럼-지향 데이터웨어하우스 시스템을 위한 컬럼-인지 인덱스 관리 기법을 제안한다. 본 인덱스 관리 기법은 개선된 B트리에 기반하며, 중간 노드와 리프노드에서 내장 플래시 인덱스와 빈공간 압축을 통하여 높은 검색 성능을 얻는다. 성능 평가 결과를 기반으로 본 인덱스 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 확인하였다.

프랙탈을 이용한 시공간 데이터웨어하우스 (Spatio-Temporal Data Warehouses Using Fractals)

  • 최원익;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.46-48
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 적응적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

  • PDF

시멘틱 공유를 위한 MDA기반 지하공간정보 온톨로지 모델 개발 (Development of MDA-based Subsurface Spatial Ontology Model for Semantic Sharing)

  • 이상훈;장병욱
    • 대한공간정보학회지
    • /
    • 제17권1호
    • /
    • pp.121-129
    • /
    • 2009
  • 최근 이질적인 정보의 폭발적인 증가와 다양한 관리주체별로 생산, 축적되는 공간정보의 특성으로 인하여 공간정보의 재사용과 공유가 어려운 실정이다. 국가공간정보체계의 하나인 지하공간정보도 공간분석을 위해서는 지형도, 지질도, 지하시설물도 등 여타 공간정보와 공유가 필수적이다. 그러나, 기존 표준 혹은 데이터웨어하우스에 의한 공유방법은 시멘틱 이질성을 고려할 수 없다. 본 연구는 지하공간정보의 시멘틱 공유를 위해 일반개념, 측정스케일, 공간모델을 포함한 온톨로지 레이어 모델을 개발하였다. 또한, 기존의 수작업에 의존하는 온톨로지 개발방법론이 아닌 MDA기반 방법론을 적용하여 직관적이며 환경변화에 쉽게 대응할 수 있는 메타모델(UML Profile)을 개발하였다. 개발된 온톨로지 모델의 시멘틱 품질은 Pellet 추론엔진을 통해 검증하였다. 본 연구를 통해 시멘틱 공유를 증진시키고, 온톨로지의 지식표현 능력을 이용하여 GIS 전문가시스템 개발이 가능할 것으로 기대된다.

  • PDF