• Title/Summary/Keyword: 웨어하우스 구성

Search Result 48, Processing Time 0.025 seconds

Web Warehousing based on Multi-Agent (다중 에이전트 기반 웹 웨어하우징)

  • 김현희;박승수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.274-276
    • /
    • 2000
  • 본 연구에서는 기존의 데이터 웨어하우징 기술과 웹 기반 기술을 통합한 웹 웨어하우징 기법에 다중 에이전트 패러다임을 적용하여 다중 에이전트 기반 웹 웨어하우징 시스템을 설계, 구현하였다. 시스템은 정보 검색 에이전트, 정보 통합 에이전트, 웹하우스 구축 에이전트로 구성된다. 정보 검색 에이전트는 여러 종류의 웹 자원을 수집한다. 정보 통합 에이전트는 정보 검색 에이전트에 의해 수집된 이형질적인 데이터를 일정한 형식으로 변환한다. 웹하우스 에이전트는 생성된 데이터를 사용하여 웹하우스를 구축하고 관리한다. 웹 데이터를 통합하기 위해 새로운 데이터 모델을 제안하였다. 의미를 갖는 지능적 객체를 생성하기 위해 여러 종류의 추론 에이전트들이 추론작업을 수행하고, 이들은 블랙보드 시스템을 통하여 작업을 통합한다. 본 시스템은 의미 정보 데이터를 사용하므로 웹 정보의 의미적 검색과 정보추출이 가능하다.

  • PDF

A Genetic Algorithm for Materialized View Selection in Data Warehouses (데이터웨어하우스에서 유전자 알고리즘을 이용한 구체화된 뷰 선택 기법)

  • Lee, Min-Soo
    • The KIPS Transactions:PartD
    • /
    • v.11D no.2
    • /
    • pp.325-338
    • /
    • 2004
  • A data warehouse stores information that is collected from multiple, heterogeneous information sources for the purpose of complex querying and analysis. Information in the warehouse is typically stored In the form of materialized views, which represent pre-computed portions of frequently asked queries. One of the most important tasks of designing a warehouse is the selection of materialized views to be maintained in the warehouse. The goal is to select a set of views so that the total query response time over all queries can be minimized while a limited amount of time for maintaining the views is given(maintenance-cost view selection problem). In this paper, we propose an efficient solution to the maintenance-cost view selection problem using a genetic algorithm for computing a near-optimal set of views. Specifically, we explore the maintenance-cost view selection problem in the context of OR view graphs. We show that our approach represents a dramatic improvement in terms of time complexity over existing search-based approaches that use heuristics. Our analysis shows that the algorithm consistently yields a solution that only has an additional 10% of query cost of over the optimal query cost while at the same time exhibits an impressive performance of only a linear increase in execution time. We have implemented a prototype version of our algorithm that is used to evaluate our approach.

A Spatial Data Cubes with Concept Hierarchy on Spatial Data Warehouse (공간 데이터 웨어하우스에서 개념 계층을 지원하는 공간 데이터 큐브)

  • Ok Geun-Hyoung;Lee Dong-Wook;You Byeong-Seob;Bae Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.35-38
    • /
    • 2006
  • 데이터 웨어하우스에서는 OLAP(On-Line Analytical Processing) 연산을 제공하기 위해 다차원 데이터를 큐브의 형태로 관리한다. 특히, 공간 차원과 같이 데이터 큐브의 차원에 개념 계층이 존재하는 경우 사용자는 특정 계층에 대한 집계 결과를 요구한다. 기조의 데이터 큐브의 구조들은 차원의 개념 계층을 지원하지 못하거나 지원하더라도 시간이나 공간적 비용에 대해 비효율적이다. 본 논문에서는 공간 데이터 웨어하우스에서 공간 개념 계층을 이용하여 효율적인 계층별 영역 집계연산을 지원하는 공간 데이터 큐브를 제안한다. 이는 개념 계층을 DAG(Directed Acyclic Graph) 형태로 표현하여 구성된 여러 개의 차원들을 공간차원의 지역성을 기준으로 연결한 구조이다. 이러한 구조를 갖는 큐브를 이용하면, 데이터 검색 시 상위 계층부터 아래 방향으로 탐색하기 때문에 각 차원에 대한 효율적인 검색이 가능하다. 특히, 공간 개념 계층에 대한 DAG를 이용하면, 공간적 지역성에 따른 영역 검색을 지원할 수 있다. 성능평가에서 개념 계층이 적용된 질의에 대한 실험을 통해 제안 기법이 기존 기법들에 비해 저장 공간 효율성 및 질의 응답 성능이 우수함을 증명한다.

  • PDF

Spatial Aggregations for Spatial Analysis in a Spatial Data Warehouse (공간 데이터 웨어하우스에서 공간 분석을 위한 공간 집계연산)

  • You, Byeong-Seob;Kim, Gyoung-Bae;Lee, Soon-Jo;Bae, Hae-Young
    • Journal of Korea Spatial Information System Society
    • /
    • v.9 no.3
    • /
    • pp.1-16
    • /
    • 2007
  • A spatial data warehouse is a system to support decision making using a spatial data cube. A spatial data cube is composed of a dimension table and a fact table. For decision support using this spatial data cube, the concept hierarchy of spatial dimension and the summarized information of spatial fact should be provided. In the previous researches, however, spatial summarized information is deficient. In this paper, the spatial aggregation for spatial summarized information in a spatial data warehouse is proposed. The proposed spatial aggregation is separated of both the numerical aggregation and the object aggregation. The numerical aggregation is the operation to return a numerical data as a result of spatial analysis and the object aggregation returns the result represented to object. We provide the extended struct of spatial data for spatial aggregation and so our proposed method is efficient.

  • PDF

Control of metadata schema conflicts for internet datawarehouse (인터넷 데이터웨어하우스 구축을 위한 메타데이터 스키마 충돌 제어)

  • Kim, Byung-Gon
    • Journal of Digital Contents Society
    • /
    • v.8 no.4
    • /
    • pp.499-507
    • /
    • 2007
  • With the increasing of users' request about internet web service, importance of Internet datawarehouse to support decision making of users is increasing now. Early Internet datawarehouse was studied in the form of using existent database and XML. However, because of limitation of information expression ability, it is gradually changed to system that use metadata schema like RDFS. Because of distributed environment of the Internet, integration and saving of each metadata schemas into one global schema is important. However, between each different schema, semantic and structural conflicts can be happen in such situation and they must be controlled. In this paper, we analyze occasions of conflict when integrate distributed metadata schemas and propose conflict resolution technique for efficient internet datawarehouse query processing.

  • PDF

A Summarization Method for Data Streams (데이터 스트림 정보 요약 기법)

  • Han, Sang-Gil;Lee, Won-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.657-660
    • /
    • 2006
  • 최근까지 데이터웨어하우스와 OLAP 에 관한 연구와 더불어 데이터 큐브(data cube)는 많은 다차원 데이터웨어하우스에서 데이터 분석과 의사 결정 지원을 위해 빠르게 OLAP 연산을 처리하기 위한 중요한 역할을 수행해 왔다. 최근에는 빠른 속도로 생성됨과 동시에 지속적으로 발생되는 연속적인 데이터로 구성된 데이터 스트림이 네트워크 트래픽 모니터링, 증권, 날씨, 콜 센터 등과 같은 많은 분야에서 생성된다. 데이터 스트림은 무한의 집합이기 때문에 기존의 데이터 큐브 방법은 처리시간과 저장공간의 문제 때문에 데이터 스트림에 적용하기 어렵다. 이에 본 논문에서는 기존의 데이터 큐브와 같은 데이터의 요약 정보를 데이터 스트림 환경에서 제한된 메모리를 이용하여 관리 할 수 있는 전원트리를 이용한 데이터 스트림 요약 기법을 제안하고, 실험을 통해 본 논문에서 제안한 방법이 데이터 스트림 환경에서 적응적으로 동작함을 증명한다.

  • PDF

Development and Application of a Big Data Platform for Education Longitudinal Study Analysis (교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용)

  • Park, Jung;Cho, Wan-Sup
    • The Journal of Bigdata
    • /
    • v.5 no.1
    • /
    • pp.11-27
    • /
    • 2020
  • In this paper, we developed a big data platform to store, process, and analyze effectively on such education longitudinal study data. And it was applied to the Seoul Education Longitudinal Study(SELS) to confirm its usefulness. The developed platform consists of data preprocessing unit and data analysis unit. The data preprocessing unit 1) masking, 2) converts each item into a factor 3) normalizes / creates dummy variables 4) data derivation, and 5) data warehousing. The data analysis unit consists of OLAP and data mining(DM). In the multidimensional analysis, OLAP is performed after selecting a measure and designing a schema. The DM process involves variable selection, research model selection, data modification, parameter tuning, model training, model evaluation, and interpretation of the results. The data warehouse created through the preprocessing process on this platform can be shared by various researchers, and the continuous accumulation of data sets makes further analysis easier for subsequent researchers. In addition, policy-makers can access the SELS data warehouse directly and analyze it online through multi-dimensional analysis, enabling scientific decision making. To prove the usefulness of the developed platform, SELS data was built on the platform and OLAP and DM were performed by selecting the mathematics academic achievement as a measure, and various factors affecting the measurements were analyzed using DM techniques. This enabled us to quickly and effectively derive implications for data-based education policies.

데이터웨어하우징을 이용한 CRM 아키텍처

  • 김수연;황현석;서의호
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.165-168
    • /
    • 2001
  • 정보기술의 발전은 기업의 마케팅 방식과 고객 정보를 관리하는 방법을 변환시키고 있다. 급속도로 확산되는 인터넷 환경은 데이터의 수집 과정을 쉽게 만들었으며, 대량의 데이터를 기업에 제공할 수 있게 하였다. 새로운 정보기술 도구로 인해 가능해진 대량의 고객 정보는 기업에게 경쟁 우위를 얻기 위한 도전과 기회를 제공하고 있다. 많은 조직에서는 의사 결정 지원을 위하여 이들 거대한 데이터베이스에 내재된 지식의 중요성을 인식하고 있다. 특히, 이들 데이터베이스로부터 추출된 고객에 대한 지식은 마케팅에 매우 중요하게 사용될 수 있다. 본 연구에서는 데이터웨어하우징을 이용한 CRM 아키텍처를 제안한다. 고객 중심의 전사적인 CRM 아키텍처를 제시하고 CRM 시스템 구성에 필요한 주요 기능을 제안한다. 제안된 아키텍처 내에서 고객 데이터는 다양한 애플리케이션 데이터 소스로부터 데이터전송 시스템을 이용하여 데이터웨어하우스로 통합된 뒤, 다시 마케팅 데이터 마트로 구성되어 CRM 활동에 사용될 수 있다. CRM은 고객 인식(Customer Identification), 고객 분석(Customer Analysis), 상품분석(Product Analysis), 고객 서비스(Customer Service)의 주요 기능을 갖는다.

  • PDF

Supporting XML Materialized Views Using Materialized Views of RDBMS (관계 DBMS의 실체뷰 기능을 이용한 XML 실체뷰 지원)

  • Kim, Seung-Hun;Kang, Hyun-Chul
    • The Journal of Society for e-Business Studies
    • /
    • v.11 no.4
    • /
    • pp.33-48
    • /
    • 2006
  • Since the emergence of XML as the standard for data exchange on the Web, XML warehousing technology is required to efficiently support Web business applications such as e-Commerce. When the RDBMS is employed as the storage for XML warehouse, XML materialized views of the XML warehouse could be provided by leveraging the materialized views of the RDBMS Because XML documents are mapped into relational tuples, an XML query defining an XML materialized view needs to be transformed into SQL. If relational materialized views were defined with the transformed SQL statements, the XML materialized view could be obtained just by XML-tagging the tuples of the corresponding relational materialized views. The foremost advantage of such a scheme is that the RDBMS does take care of XML materialized view consistency except XML tagging whenever their source XML documents are updated. In this paper, we proposed such a scheme of providing XML materialized views, and implemented it using a commercial RDBMS equipped with materialized view facility in Java on Windows 2000 Professional environment. XML documents in TPC-W, Web e-Commerce Benchmark, were used in performance experiments. The experimental results showed that our proposed scheme for XML materialized views was very effective.

  • PDF

원전 계측제어 시험검증설비 개발 및 응용

  • 권기춘;박원만;송순자
    • Proceedings of the Korean Nuclear Society Conference
    • /
    • 1997.10a
    • /
    • pp.317-322
    • /
    • 1997
  • 앞으로 건설되는 원전의 계측제어계통은 디지털 기술로 설계될 전망이다. 그러나 디지털 기술을 원전 계측제어계통에 적용하는데 있어서 디지털 기술이 원전의 안전성이나 신뢰도에 영향을 미치지 않는다는 사실을 보증하여야 하며, 디지털계통의 기능과 성능에 대한 확인/검증은 원전에 설치되기 전에 수행되어야 한다. 계측제어 시험검증설비의 목적은 새롭게 개발되는 디지털 제어 및 보호 알고리즘, 경보축약 알고리즘 또는 운전지원계통등의 성능을 검증하기 위함이다. 시험검증설비의 소프트웨어는 웨스팅하우스형 993 MWe 가압경수로를 모델링한 수학적 모델링과 시험검증설비를 운용하기 위하여 필요한 종합운용프로그램으로 구성된다. 하드웨어는 공학용 워크스테이션, 시험용 패널, 개발되는 계통과의 인터페이스를 위한 VXI 인터페이스 모듈, 그리고 공유메모리의 값을 시험대상 시작품으로 전송하는 Ethernet 모듈 등으로 구성된다. 사용자 인터페이스로 할덴 원자로 프로젝트에서 개발된 Picasso 그래픽 도구를 이용한 화면과 60개의 주요변수의 값을 CRT에 표시하는 기능을 제공한다. 계측제어 시험검증설비를 응용한 계측제어계통 시작품은 정상운전 및 과도상태에서 적절한 시험결과를 제공하였다.

  • PDF