• Title/Summary/Keyword: 관계형 데이터 웨어하우스

Search Result 21, Processing Time 0.026 seconds

OLAP Server에 독립적인 OLAP Client의 구현

  • 임상배;김경창;지원철
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.361-364
    • /
    • 1998
  • 정보기술의 발달과 경영패러다임의 변화로 데이터웨어하우스가 등장했다. 기존의 관계형 데이터베이스를 기반으로 하는 데이터웨어하우스에서는 사용자가 다양하고 복잡한 분석을 효율적으로 수행하기가 매우 어렵다. 따라서 새로운 데이터모델 즉 다차원 모델이 필요하게 되었다. OLAP(Online Analytical Processing)은 이런 다차원적인 기업 데이터를 사용자가 분석하고 Report 할 수 있게 만들고 관리하는 역할을 한다. 이러한 OLAP은 클라이언트/서버 구조를 가지는데 OLAP 제품별로 질의방법이나 보고방식들이 다르다. 따라서 최종 사용자는 다른 Client 툴을 사용할 경우 새로운 질의 방법과 보고방식을 익혀야한다. 그리고 커스텀화된 OLAP Client툴을 사용할 경우 Server가 바뀌면 사용할 수 없게 되는 단점이 있다. 이런 문제의 원인은 OLAP Client가 Server에 의존적이기 때문이다. 본 논문에서는 이러한 문제점을 해결하기 위해서 OLAP의 특성과 OLAP Client가 지녀야 하는 특성을 알아보고 이러한 요구사항에 맞는 OLAP Server에 의존적이지 않은 통합된 OLAP Client를 제시하고 실제 구현하였다.

  • PDF

An Efficient Search Space Generation Technique for Optimal Materialized Views Selection in Data Warehouse Environment (데이타 웨어하우스 환경에서 최적 실체뷰 구성을 위한 효율적인 탐색공간 생성 기법)

  • Lee Tae-Hee;Chang Jae-young;Lee Sang-goo
    • Journal of KIISE:Databases
    • /
    • v.31 no.6
    • /
    • pp.585-595
    • /
    • 2004
  • A query processing is a critical issue in data warehouse environment since queries on data warehouses often involve hundreds of complex operations over large volumes of data. Data warehouses therefore build a large number of materialized views to increase the system performance. Which views to materialized is an important factor on the view maintenance cost as well as the query performance. The goal of materialized view selection problem is to select an optimal set of views that minimizes total query response time in addition to the view maintenance cost. In this paper, we present an efficient solution for the materialized view selection problem. Although the optimal selection of materialized views is NP-hard problem, we developed a feasible solution by utilizing the characteristics of relational operators such as join, selection, and grouping.

Web Information Extraction and Multidimensional Analysis Using XML (XML을 이용한 웹 정보 추출 및 다차원 분석)

  • Park, Byung-Kwon
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.5
    • /
    • pp.567-578
    • /
    • 2008
  • For analyzing a huge amount of web pages available in the Internet, we need to extract the encoded information in web pages. In this paper, we propose a method to extract and convert web information from web pages into XML documents for multidimensional analysis. For extracting information from web pages, we propose two languages: one for describing web information extraction rules based on the object-oriented model, and another for describing regular expressions of HTML tag patterns to search for target information. For multidimensional analysis on XML documents, we propose a method for constructing an XML warehouse and various XML cubes from it like the way we do for relational data. Finally, we show the validness of our method through the application to US patent web pages.

  • PDF

A Study for XML DTD Matching Method using Inlining Algorithm (Inlining 알고리즘을 이용한 XML DTD 매칭 방법에 관한 연구)

  • Heo, Bo-Jin;Kim, Hyeong-Seok;Kim, Chang-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11c
    • /
    • pp.1505-1508
    • /
    • 2003
  • XML DTD 매칭은 데이터 통합이나 데이터 웨어하우스, 웹 마이닝, 전자상거래, 의미적 질의 처리등과 같은 데이터베이스 관련 응용분야에서 수행해야 할 근본적인 연구 분야이다. 웹이 발전됨에 따라 웹 상의 데이터 교환의 표준인 XML로 많은 데이터를 표현하게 되었고, 이 XML DTD에 대한 매칭이 주된 연구 분야로 대두되었다. XML 스키마는 플랫 구조인 기존의 관계형 데이터베이스 스키마와는 달리 계층적인 트리 구조로 이루어져 DTD를 직접 비교하기가 어렵다. 본 논문에서는 계층적 구조인 XML DTD의 계층적 구조 정보와 무결성 제약조건을 추출하여 일차원적인 직렬 구조로 변환한 후, 유사한 DTD를 매칭하는 방법을 제안한다.

  • PDF

User Defined Schema Integration (사용자 정의 스키마 통합)

  • Lee, Hyun-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.569-572
    • /
    • 2004
  • 최근 데이터베이스를 이용한 정보처리응용 시스템이 증가하고 있는 추세이다. 이러한 응용 시스템의 데이터를 종합적으로 분석 처리하여 사용자 요구에 신속하게 응답할 수 있도록 다양하고 고품질의 정보 서비스를 지원하기 위해 데이터 웨어하우스 환경에 관한 연구가 많이 이루어지고 있다. 이러한 환경을 제공하기 위해서는 많은 데이터 정보가 요구되며, 이를 분석하여 사용자 의사 결정에 적합한 정보 추출 수행은 기존의 관계형 데이터베이스 환경의 테이블들에 대한 질의 수행에서 시간적인 낭비 요소가 많이 존재한다. 그러므로 본 논문에서는 사용자 질의에서 자주 요구되는 사실 혹은 데이터를 통합, 저장 및 수행하기 위한 테이블 생성을 사용자가 직접 선택 정의함으로써 편리하게 테이블 생성할 수 있도록 설계 및 구현한다. 또한 본 내용에서 포함되는 내용으로 기존 일반적인 SQL 질의를 수행할 수 있도록 한다.

  • PDF

Query Optimization Techniques for Horizontal Tables in OLAP Environment (OLAP 환경의 수평적인 테이블에 대한 질의 최적화 방법)

  • Shin Sung-Hyun;Moon Yang-Sae;Kim Jin-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.70-72
    • /
    • 2006
  • 데이터 웨어하우스는 방대한 이력 데이터들을 저장하는 저장소이며, 이를 다양한 관점에서 분석하기 위해 OLAP (On-Line Analytical Processing) 연산을 이용한다. 일반적으로 이러한 저장소는 데이터를 저장할 때 많은 열(columns) 을 기반으로 저장하는 와이드(wide) 형태의 테이블로 저장하게 된다. 하지만, 관계형 DBMS에서는 열 수의 제약(MS SQLServer, Oracle 등 열의 수는 1024개임)을 받게 되므로, 그 이상의 열들을 저장할 수 없다. 하지만, 열 기반(이하, 수평 테이블)으로 저장하는 것보다는 관계형 DBMS의 특징을 이용하여 행(row) 기반(이하, 수직 테이블)으로 저장하게 되면 많은 데이터를 효율적으로 저장할 수 있다. 이때, 저장 테이블의 스키마 구조가 변경되므로, 수평 테이블에 대한 질의도 저장된 수직 테이블에 적용 가능하도록 변화시켜야 한다. 또한, 사용자에게 빠른 질의 응답을 제공하기 위해 질의 최적화를 고려하여 실행전락을 세워야 한다. 따라서 본 연구에서는 경험(heuristic)을 근거로 각 연산(프로젝션, 실렉션, 조인 연산)을 위한 질의 트리를 생성하여 질의 최적화에 대한 여러 질의 경로를 고려하고, 다양한 실험을 통해 질의 최적화에 대한 접근 경로들을 분석한다. 이로써, 본 연구의 질의 경로 분석을 기반으로 최적화 실행 계획을 기대해 본다.

  • PDF

A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams (ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘)

  • 신성현;김진호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF

Performance Comparison of DW System Tajo Based on Hadoop and Relational DBMS (하둡 기반 DW시스템 타조와 관계형 DBMS의 성능 비교)

  • Liu, Chen;Ko, Junghyun;Yeo, Jeongmo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.9
    • /
    • pp.349-354
    • /
    • 2014
  • Since Hadoop which is the Big-data processing platform was announced, SQL-on-Hadoop is the spotlight as the technique to analyze data using SQL on Hadoop. Tajo created by Korean programmers has recently been promoted to Top-Level-Project status by the Apache in April and has been paid attention all around world. Despite a sensible change caused by Hadoop's appearance in DW market, researches of those performance is insufficient. Thus, this study has been conducted to help choose a DW solution based on SQL-on-Hadoop as progressing the test on comparison analysis of RDBMS and Tajo. It has shown that Tajo based on Hadoop is more superior than RDBMS if it is used with accurate strategy. In addition, open-source project Tajo is expected not only to achieve improvements in technique due to active participation of many developers but also to be in charge of an important role of DW in the filed of data analysis.

Incremental Maintenance of Horizontal Views Using a PIVOT Operation and a Differential File in Relational DBMSs (관계형 데이터베이스에서 PIVOT 연산과 차등 파일을 이용한 수평 뷰의 점진적인 관리)

  • Shin, Sung-Hyun;Kim, Jin-Ho;Moon, Yang-Sae;Kim, Sang-Wook
    • The KIPS Transactions:PartD
    • /
    • v.16D no.4
    • /
    • pp.463-474
    • /
    • 2009
  • To analyze multidimensional data conveniently and efficiently, OLAP (On-Line Analytical Processing) systems or e-business are widely using views in a horizontal form to represent measurement values over multiple dimensions. These views can be stored as materialized views derived from several sources in order to support accesses to the integrated data. The horizontal views can provide effective accesses to complex queries of OLAP or e-business. However, we have a problem of occurring maintenance of the horizontal views since data sources are distributed over remote sites. We need a method that propagates the changes of source tables to the corresponding horizontal views. In this paper, we address incremental maintenance of horizontal views that makes it possible to reflect the changes of source tables efficiently. We first propose an overall framework that processes queries over horizontal views transformed from source tables in a vertical form. Under the proposed framework, we propagate the change of vertical tables to the corresponding horizontal views. In order to execute this view maintenance process efficiently, we keep every change of vertical tables in a differential file and then modify the horizontal views with the differential file. Because the differential file is represented as a vertical form, its tuples should be converted to those in a horizontal form to apply them to the out-of-date horizontal view. With this mechanism, horizontal views can be efficiently refreshed with the changes in a differential file without accessing source tables. Experimental results show that the proposed method improves average performance by 1.2$\sim$5.0 times over the existing methods.

A PIVOT based Query Optimization Technique for Horizontal View Tables in Relational Databases (관계 데이터베이스에서 수평 뷰 테이블에 대한 PIVOT 기반의 질의 최적화 방법)

  • Shin, Sung-Hyun;Moon, Yang-Sae;Kim, Jin-Ho;Kang, Gong-Mi
    • The KIPS Transactions:PartD
    • /
    • v.14D no.2
    • /
    • pp.157-168
    • /
    • 2007
  • For effective analyses in various business applications, OLAP(On-Line Analytical Processing) systems represent the multidimensional data as the horizontal format of tables whose columns are corresponding to values of dimension attributes. Because the traditional RDBMSs have the limitation on the maximum number of attributes in table columns(MS SQLServer and Oracle permit each table to have up to 1,024 columns), horizontal tables cannot be directly stored into relational database systems. In this paper, we propose various efficient optimization strategies in transforming horizontal queries to equivalent vertical queries. To achieve this goral, we first store a horizontal table using an equivalent vertical table, and then develop various query transformation rules for horizontal table queries using the PIVOT operator. In particular, we propose various alternative query transformation rules for the basic relational operators, selection, projection, and join. Here, we note that the transformed queries can be executed in several ways, and their execution times will differ from each other. Thus, we propose various optimization strategies that transform the horizontal queries to the equivalent vertical queries when using the PIVOT operator. Finally, we evaluate these methods through extensive experiments and identify the optimal transformation strategy when using the PIVOT operator.