• Title/Summary/Keyword: 공간데이터웨어하우스

Search Result 46, Processing Time 0.028 seconds

Building Hierarchical Bitmap Indices in Space Constrained Environments (저장 공간이 제약된 환경에서 계층적 비트맵 인덱스 생성에 관한 연구)

  • Kim, Jong Wook
    • Journal of Digital Contents Society
    • /
    • v.16 no.1
    • /
    • pp.33-41
    • /
    • 2015
  • Since bitmap indices are useful for OLAP queries over low-cardinality data columns, they are frequently used in data warehouses. In many data warehouse applications, the domain of a column tends to be hierarchical, such as categorical data and geographical data. When the domain of a column is hierarchical, hierarchical bitmap index is able to significantly improve the performance of queries with conditions on that column. This strategy, however, has a limitation in that when a large scale hierarchy is used, building a bimamp for each distinct node leads to a large space overhead. Thus, in this paper, we introduce the way to build hierarchical bitmap index on an attribute whose domain is organized into a large-scale hierarchy in space-constrained environments. Especially, in order to figure out space overhead of hierarchical bitmap indices, we propose the cut-selection strategy which divides the entire hierarchy into two exclusive regions.

Efficient Aggregate Information Management of Spatiotemporal Data in Spatial Data Warehouses (공간 데이터 웨어하우스에서 시공간 데이터의 효율적인 집계 정보 관리 기법)

  • Ryu, Ho-Sun;You, Byeong-Seob;Park, Soon-Young;Lee, Jae-Dong;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.43-46
    • /
    • 2005
  • 다차원 분석을 위한 OLAP 연산에서는 사용자의 요청에 빠르게 응답하기 위해 집계 값을 미리 계산하여 저장해 두는 사전 집계 방식을 이용한다. 시공간 데이터에 대한 사전 집계 기법으로는 R-트리의 각 노드에 대한 과거 집계 값을 요약 테이블로 관리하는 기법과 R-트리의 노드에서 현재 집계 값을 관리하는 기법이 있다. 그러나 이 기법들은 현재와 과거 모두의 집계 정보를 필요로 하는 시스템에서는 성능이 저하되며, 특히 과거 집계 정보의 경우 시간에 따른 계층화가 되어있지 않아 시간에 대한 계층 분석에 어려움이 있다. 본 논문에서는 시공간 데이터의 현재와 과거 집계 정보를 효율적으로 관리하는 기법을 제안한다. 제안 기법은 aR-tree를 이용하여 해당 영역에 대한 현재 집계 정보를 저장하고, 각 노드에 과거 집계 정보에 대한 연결을 위하여 링크를 추가하였다. 과거 집계 정보는 각 노드의 과거에서 현재까지의 집계 정보를 계층 구조로 유지하는 시간 요약 집계 테이블을 만들어 저장한다. 따라서 제안한 기법은 현재와 과거 집계 정보를 모두 유지할 수 있으므로 현재와 과거 집계 정보에 대한 처리 성능을 향상시킨다. 또한 제안 기법에서는 공간 정보를 공간 인덱스인 R-트리로 유지하고, 과거로부터의 시간 정보를 시간 요약 집계 테이블을 이용하여 계층화시켜 유지하므로 시간과 공간에 대한 계층 분석이 용이하다.

  • PDF

A Physical Design Method of Storage Structures for MOLAP Systems of Data Warehouse (데이터 웨어하우스의 다차원 온라인 분석처리 시스템을 위한 저장구조의 물리적 설계기법)

  • Lee Jong-Hak
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.3
    • /
    • pp.297-312
    • /
    • 2005
  • Aggregation is an operation that plays a key role in multidimensional OLAP (MOLAP) systems of data warehouse. Existing aggregation operations in MOLAP have been proposed for file structures such as multidimensional arrays. These tile structures do not work well with skewed distributions. This paper presents a physical design methodology for storage structures ni MOLAP that use the multidimensional tile organizations adapting to a skewed distribution. In uniform data distribution, we first show that the performance of multidimensional analytical processing is highly affected by the similarity of the shapes between query regions and page regions in the domain space of the multidimensional file organizations. And than, in skewed distributions, we reflect the effect of data distributions on the design by using the shapes of the normalized query regions that are weighted with data density of those query regions. Finally, we demonstrate that the physical design methodology theoretically derived is indeed correct in real environments. In the two-dimensional file organizations, the results of experiments indicate that the performance of the proposed method is enhanced by more than seven times over the conventional method. We expect that the performance will be more enhanced when the dimensionality is more than two. The result confirms that the proposed physical design methodology is useful in a practical way.

  • PDF

Materialized View Selection using Decision Tree in Data Warehouse (데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법)

  • Jang Youn-Kyung;You Byeong-Seob;Eo Sang-Hun;Kim Gyung-Bae;Bae Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.63-66
    • /
    • 2006
  • 실체화 뷰 선택은 질의 수행 시간과 제한된 저장 공간 등의 유지 비용을 고려하여 최적의 실체화 뷰 집합을 선택하고 유지하는 것이다. 본 논문에서는 의사결정 트리를 이용한 실체화 뷰 선택기법을 제안한다. 제안기법은 의사결정 트리를 이용하여 실체화 뷰로 생성될 질의를 판단하고 실체화 뷰 교체가 필요한 경우 메타데이터 테이블을 이용하여 교체 대상을 결정한다. 의사결정 트리는 높은 우선순위를 가진 속성으로부터 차례대로 데이터를 분류하기 때문에 이용도가 높은 실체화 뷰를 선택하는 방법을 제공하고 메타데이터 테이블은 실체화 뷰 집합의 빠른 교체 수행과 효율적인 유지보수를 제공한다. 성능평가를 통해 제안된 기법은 실체화 뷰 비율에 따른 질의처리 시간이 기존기법보다 약 13%의 성능 향상을 보였다.

  • PDF

공간적 의사결정을 위한 공간 데이터 웨어하우스 설계 및 활용

  • 박지만;황철수
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.11a
    • /
    • pp.9-14
    • /
    • 2003
  • The major reason that spatial data warehousing has attracted a great deal of attention in business GIS in recent years is due to the wide availability of huge amounts of spatial data and the imminent need for turning such data into useful geographic information. Therefore, this research has been focused on designing and implementing the pilot tested system for spatial decision making. The purpose of the system is to predict targeted marketing area by discriminating the customers by using both transaction quantity and the number of customer using credit card in department store. Focused on the analysis methodology, the case study is aiming to use GIS and clustering for knowledge discovery. The system is a key section of the research of multi-dimensional and spatio-temporal analysis in the internet environment.

  • PDF

Status of Spatial Data Warehouse in Korea (한국의 공간데이터웨어하우스 기술현황 조사)

  • Kim, Seung-Yong;Yom, Jae-Hong
    • Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography Conference
    • /
    • 2007.04a
    • /
    • pp.237-242
    • /
    • 2007
  • The NGIS(National Geographic Information System) project is in its third phase currently. To put the produced data to practical use, central and local governments are trying to implement spatial data warehouse(SDW). In this study, status of local and international SDW(Spatial Data Warehouse) technology were investigated. It has been observed that in Korea it was necessary to shift the focus from management of spatial data to servicing of spatial data to information end users. To that end, the following tasks should be pursued : 1) standardization, 2) automatic ways of linking various legacy administrative information, 3) development of customized middleware for spatial data integration and 4) legal system infra structure.

  • PDF

Spatio-temporal Pattern Mining for Power Load Forecasting in GIS-AMR Load Analysis Model (GIS-AMR 부하 분석 모델에서의 전력 부하 예측을 위한 시공간 패턴 마이닝)

  • Lee, Heon Gyu;Piao, Minghao;Park, Jin Hyoung;Shin, Jin-ho;Ryu, Keun Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.3-6
    • /
    • 2009
  • 변압기 무선부하감시 시스템에서 30분 간격으로 계측된 부하 데이터와 GIS-AMR 데이터웨어하우스로부터 변압기 속성 및 공간적 특징을 추출하여 정확한 변압기의 부하 패턴을 예측하기 위한 시공간 패턴 마이닝 기법을 적용하였다.

Search Performance Improvement of Column-oriented Flash Storages using Segmented Compression Index (분할된 압축 인덱스를 이용한 컬럼-지향 플래시 스토리지의 검색 성능 개선)

  • Byun, Siwoo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.14 no.1
    • /
    • pp.393-401
    • /
    • 2013
  • Most traditional databases exploit record-oriented storage model where the attributes of a record are placed contiguously in hard disk to achieve high performance writes. However, for search-mostly datawarehouse systems, column-oriented storage has become a proper model because of its superior read performance. Today, flash memory is largely recognized as the preferred storage media for high-speed database systems. In this paper, we introduce fast column-oriented database model and then propose a new column-aware index management scheme for the high-speed column-oriented datawarehouse system. Our index management scheme which is based on enhanced $B^+$-Tree achieves high search performance by embedded flash index and unused space compression in internal and leaf nodes. Based on the results of the performance evaluation, we conclude that our index management scheme outperforms the traditional scheme in the respect of the search throughput and response time.

Spatio-Temporal Data Warehouses Using Fractals (프랙탈을 이용한 시공간 데이터웨어하우스)

  • 최원익;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.46-48
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 적응적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

  • PDF

Development of MDA-based Subsurface Spatial Ontology Model for Semantic Sharing (시멘틱 공유를 위한 MDA기반 지하공간정보 온톨로지 모델 개발)

  • Lee, Sang-Hoon;Chang, Pyoung-Wuck
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.17 no.1
    • /
    • pp.121-129
    • /
    • 2009
  • Today, it is difficult to re-use and share spatial information, because of the explosive growth of heterogeneous information and specific characters of spatial information accumulated by diverse local agency. A spatial analysis of subsurface spatial informa-tion, one of the National Spatial Data Infrastructure, needs related spatial information such as, topographical map, geologic map, underground facility map, etc. However, current methods using standard format or spatial datawarehouse cannot consider a se-mantic hetergenity. In this paper, the layered ontology model which consists of generic concept, measuremnt scale, spatial model, and subsurface spatial information has developed. Also, the current ontology building method pertained to human experts is a expensive and time-consuming process. We have developed the MDA-based metamodel(UML Profile) of ontology that can be a easy under-standing and flexiblity of environment change. The semantic quality of devleoped ontology model has evaluated by reasoning engine, Pellet. We expect to improve a semantic sharing, and strengthen capacities for developing GIS experts system using knowledge representation ability of ontology.

  • PDF