• 제목/요약/키워드: Data Warehouses

검색결과 82건 처리시간 0.027초

데이터 웨어하우스에서 다차원 데이터를 위한 피벗 테이블의 효율적인 처리를 위한 관계 대수 변환 (Relational Algebra Query Transformation for Processing Efficiently Pivot Tables for Multi-dimensional Data in Data Warehouses)

  • 신성현;김진호;문양세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2005
  • 데이터 웨어하우스에서는 데이터를 다양한 관점으로 분석하기 위해 데이터를 다차원 형태로 유지한다. 이 다차원 데이터를 간단하고 편리한 형태로 사용자에게 표현하기 위해 피벗 테이블이 이용된다. 피벗 테이블은 데이터에 대한 요약된 정보를 제공하는데 널리 사용되는 편리한 표현 방법이지만, 실제 값이 열의 제목으로 나오기 때문에 많은 개수의 열을 가질 수 있다. 이러한 피벗 테이블을 그대로 저장할 경우 관계 DBMS의 테이블 컬럼 수에 제약을 받게 되며, 데이터 저장 및 질의 처리에 성능이 떨어질 수 있다. 이 논문은 관계 데이터베이스의 테이블을 이용하여 피벗 테이블을 효율적으로 저장하는 방법을 제안한다. 이때, 피벗 테이블에 대한 질의물 저장된 형태의 테이블에 적용 가능하도록 질의를 변환시켜야 한다. 따라서 이 연구에서는 피벗 테이블에 대한 관계 연산자들(실렉션, 프로젝션, 합집합, 차집합 카디션 곱)을 효율적으로 변환하는 질의 변환 방범을 제안한다.

  • PDF

경로 인덱스를 이용한 데이터 웨어하우스의 질의 처리 기법 (Query Processing Techniques for Data Warehouses using Path Indices)

  • 이정남;조완섭;이충세;김홍기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.281-283
    • /
    • 1999
  • 본 논문에서는 객체-관계형 데이터베이스 관리 시스템(Object-Relational DBMS: ORDBMS) 기반의 데이터 웨어하우스(Data Warehouse)에서 성능 향상을 위한 인덱싱 기법과 이를 이용한 질의 처리 기법을 제안한다. 지금까지 관계형 DBMS를 기반으로 한 데이터 웨어하우스의 성능향상에 관한 연구는 활발히 이루어져 왔으나, ORDBMS에 기반한 데이터 웨어하우스의 구축 및 질의 처리 성능에 관한 연구는 거의 이루어지지 않고 있다. 데이터 웨어하우스는 기존의 데이터베이스와는 비교할 수 없을 만큼의 대용량 데이터를 가정하므로 ORDBMS를 이용하여 데이터 웨어하우스를 구축하는 경우에도 적절한 성능의 보장이 필수적으로 요구된다. 제안된 인덱싱 기법을 사용함으로써 데이터 웨어하우스 분석용 질의에 포함된 비용이 큰 조인과 그루핑 연산은 비용이 저렴한 인덱스 액세스 연산으로 대치되며, 데이터의 량과 거의 무관하게 질의 처리 비용이 고정되는 효과를 얻을 수 있다.

  • PDF

데이터웨어하우스 성능 모니터링을 위한 DBMax의 확장 (An Extension of DBMax, Oracle Performance Monitoring Tool, for Data Warehouses)

  • 김은주;용환승;이상원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.262-264
    • /
    • 2002
  • 데이터웨어하우스는 대용량의 데이터를 대상으로 복잡한 분석을 수행하거나 전략적 의사 결정을 위해 사용되기 때문에 신속한 질의 응답을 위한 성능 관리가 무엇보다 중요하다. 데이터웨어하우스는 일반 운영계 시스템과는 다른 목적과 특성을 가지기 때문에 그에 적합한 성능 모니터링 방법이 필요하다. 본 연구에서는 오라클 데이터베이스를 위한 OLTP(On-Line Transaction Processing)용 국산 성능 모니터링 도구인 DBMax를 데이터웨어하우스 환경에 적용할 수 있도록 기능을 확장한다. 우선 기존의 운영계 시스템과는 구분되는 데이터웨어하우스의 특성을 토대로 오라클9i에서 제공하고 있는 성능 항상 기법인 실체화된 뷰(MV: Materialized View)와 EH(Data Extraction, Transformation and Loading) 화장 기능을 모니터링하기 위한 요구사항을 분석하고 이를 지원하기 위한 DBMax 확장 방안을 설계 및 구현한다. 실체화된 뷰와 ETL 확장 기능을 위해 제공되는 오라클9i의 다양한 스키마 객체에 대한 정보 및 성능 관련 지표를 제시하여 SQL 튜닝 기능을 지원하며 사후 분석을 위한 DBMax의 로그 파일에서 의미 있는 SQL문을 추출하여 잠재적으로 유용한 실체화된 뷰를 권고할 수 있도록 기능을 확장한다.

  • PDF

Perspectives on Clinical Informatics: Integrating Large-Scale Clinical, Genomic, and Health Information for Clinical Care

  • Choi, In Young;Kim, Tae-Min;Kim, Myung Shin;Mun, Seong K.;Chung, Yeun-Jun
    • Genomics & Informatics
    • /
    • 제11권4호
    • /
    • pp.186-190
    • /
    • 2013
  • The advances in electronic medical records (EMRs) and bioinformatics (BI) represent two significant trends in healthcare. The widespread adoption of EMR systems and the completion of the Human Genome Project developed the technologies for data acquisition, analysis, and visualization in two different domains. The massive amount of data from both clinical and biology domains is expected to provide personalized, preventive, and predictive healthcare services in the near future. The integrated use of EMR and BI data needs to consider four key informatics areas: data modeling, analytics, standardization, and privacy. Bioclinical data warehouses integrating heterogeneous patient-related clinical or omics data should be considered. The representative standardization effort by the Clinical Bioinformatics Ontology (CBO) aims to provide uniquely identified concepts to include molecular pathology terminologies. Since individual genome data are easily used to predict current and future health status, different safeguards to ensure confidentiality should be considered. In this paper, we focused on the informatics aspects of integrating the EMR community and BI community by identifying opportunities, challenges, and approaches to provide the best possible care service for our patients and the population.

농촌 공공기반시설 현황 조사 및 문제점 분석 (The Survey and Analysis of Public Infrastructures in Korean Rural Areas)

  • 허학영;남상채;최상운;오민근;안동만
    • 농촌계획
    • /
    • 제8권1호
    • /
    • pp.105-113
    • /
    • 2002
  • This investigation aims to provide basic data for rural village planning and rehabilitation planning. Public infrastructures of forty selected villages have been surveyed. Provision of facilities, user satisfaction, perceived problems, and conditions of maintenance have been surveyed for three classified types of infrastructures; 1) public utility spaces such as community hall, and parking lots, 2) public production infrastructures such as warehouses, and irrigation facilities, and 3) public infrastructures for living environments such as roads, water supply, and sewage system. All twenty smaller villages (ki-cho-ma-ul) had problems of poor conditions and insufficient spaces with community halls. Most of the smaller villages suffered from lack of public production infrastructures, or had problems of insufficient spaces and poor maintenance conditions. They also lacked good access roads with adequate right of ways. Only three villages were provided with sewage systems. In the twenty larger villages (myun-bo-ma-ul), though public utility spaces were provided for most of them (as an example, sixteen villages had welfare centers), they were not large enough and they were maintained in poor condition too. On the one hand twelve of the larger villages had farm machine service centers, only a few villages were equipped with warehouses. Many more public infrastructures for living environments were found in larger villages. However, only a few villages had pollution control facilities. Multidimensional scaling revealed groups of distinctive characteristics, in terms of public infrastructures, among smaller villages. It did not show any noticeable distinctions among larger villages.

효율적인 항만공사의 운영과 관리를 위한 데이터 웨어하우스 구현방안에 관한 연구 (A Study on Implementing a Data Warehouse for Efficient Operating and Managing a Port Authority)

  • 김태훈;김상열
    • 한국항만경제학회지
    • /
    • 제29권2호
    • /
    • pp.195-209
    • /
    • 2013
  • 데이터 웨어하우스는 운영 시스템이 아닌 "경영층의 의사결정지원을 위한, 통합적, 시계열적, 주제 지향적, 비휘발성적인 데이터의 집합"으로 정의된다. 데이터 웨어하우스는 기업정보처리를 위한 기본적인 아키텍처로 데이터가 공급되었다고 해서 정보의 창조와 사용과 직결되지는 않는다. 데이터 웨어하우징 시스템은 데이터 공급이 아니라, 정보의 사용을 주목적으로 하고 있다. 현재의 항만공사 운영시스템인 Port-MIS에서는 데이터베이스 구성이 전체적인 데이터 아키텍처 하에서 구성되지 않고 업무별 데이터베이스, 목적별 데이터베이스 형태로 구성되어 있다. 이러한 점들 때문에 데이터베이스 확장에 한계가 있고 데이터 불일치 등이 발생할 수 있으며, 전사적 데이터 자산관리가 이루지기 어렵다고 볼 수 있다. 이에 본 연구에서는 항만공사의 운영을 위한 데이터 웨어하우스 구현 방안을 개념적 연구로 제안하였다.

DW에서의 질의어처리 성능향상을 위한 데이터 구조화 방법 (A Data Structuring Technique for Performance Enhancement of Query Processing in the Data Warehouses)

  • 이덕근;오미화;조재훈;최인수
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.7-14
    • /
    • 2005
  • OLAP(On-Line Analytical Processing) 시스템은 사용자가 다양한 각도에서 정보에 접근하여 대화식으로 정보를 분석할 수 있는 의사결정 지원 시스템이다. 그러나 기존 OLAP 시스템의 구축방법에는 사용자 요구사항의 변경에 따른 복잡한 MDX(Multidimensional Expressions) 쿼리문 사용으로 시간과 비용이 증가되는 비효율성이 생기게 된다. 이와 같은 문제를 해결하고자 사실테이블 내에 유니트 컬럼 메트릭스를 추가하는 새로운 개념의 데이터 구성 방법을 제안하고 있다. 이러한 데이터 구성 방법을 사용함으로써 OLAP시스템에서의 처리 시간과 비용을 줄일 수 있었다.

  • PDF

Trajectory Data Warehouses: Design and Implementation Issues

  • Orlando, Salvatore;Orsini, Renzo;Raffaeta, Alessandra;Roncato, Alessandro;Silvestri, Claudio
    • Journal of Computing Science and Engineering
    • /
    • 제1권2호
    • /
    • pp.211-232
    • /
    • 2007
  • In this paper we investigate some issues and solutions related to the design of a Data Warehouse (DW), storing several aggregate measures about trajectories of moving objects. First we discuss the loading phase of our DW which has to deal with overwhelming streams of trajectory observations, possibly produced at different rates, and arriving in an unpredictable and unbounded way. Then, we focus on the measure presence, the most complex measure stored in our DW. Such a measure returns the number of distinct trajectories that lie in a spatial region during a given temporal interval. We devise a novel way to compute an approximate, but very accurate, presence aggregate function, which algebraically combines a bounded amount of measures stored in the base cells of the data cube. We conducted many experiments to show the effectiveness of our method to compute such an aggregate function. In addition, the feasibility of our innovative trajectory DW was validated with an implementation based on Oracle. We investigated the most challenging issues in realizing our trajectory DW using standard DW technologies: namely, the preprocessing and loading phase, and the aggregation functions to support OLAP operations.

국내 식품냉동창고 온도분포 실태 및 확률분포모델 분석 (Analysis of Temperature and Probability Distribution Model of Frozen Storage Warehouses in South Korea)

  • 박명수;김가람;박경진
    • 한국식품위생안전성학회지
    • /
    • 제34권2호
    • /
    • pp.199-204
    • /
    • 2019
  • 본 연구는 국내 냉동보관창고 보관온도에 대한 조사자료를 활용하여, 온도분포를 추정하였고 이를 미생물 위해 평가(microbial risk assessment; MRA)의 입력변수로 활용할 수 있도록 적정 확률분포 모델을 제시하였다. 조사에 참여한 8곳의 냉동보관창고에서 측정된 공간상의 온도는 최저 $-25.8^{\circ}C$, 최고 $-10.3^{\circ}C$, 평균 $-20.48{\pm}3.08^{\circ}C$이었으며, $-18^{\circ}C$이상의 냉동창고 비율은 20.4%로 조사되었다. 공간별 온도분포는 자연대류를 이용하는 냉동창고의 경우 상단(2.4~4 m) $-22.57{\pm}0.84^{\circ}C$, 중단(1.5~2.4 m) $-22.49{\pm}1.05^{\circ}C$, 하단(0.7~1.5 m) $-22.68{\pm}1.03^{\circ}C$, 최고온도차이는 $1.78^{\circ}C$이었으며, 강제대류를 이용하는 냉동창고의 온도분포는 상단(2.4~4 m) $-17.81{\pm}1.47^{\circ}C$, 중단(1.5~2.4 m) $-17.94{\pm}1.44^{\circ}C$, 하단(0.7~1.5 m) $-18.08{\pm}1.42^{\circ}C$, 최고온도차이는 $0.94^{\circ}C$로 조사되었다. 보관온도는 냉동창고 모든 공간에서 온도가 일정하게 유지되는 것이 아니라 편차가 존재하는 것으로 나타났다. 이상의 수집된 온도자료는 @RISK를 이용, 적합성 검정(GOF: A-D, K-S test)을 수행하여, MRA에서 활용할 수 있는 국내 냉동보관창고 온도분포에 대한 가장 적합한 확률분포모델로 Lognormal [5.9731,3.3483, shift(-26.4281)]이 선정하였다.

전역 스키마 생성 도구를 이용한 데이터베이스 통합 및 질의 시스템 (Design of Database Integration System and Query System based on Global View Generation Tool)

  • 박우창
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.65-74
    • /
    • 2007
  • 기업에서 데이터베이스, 데이터웨어하우스, 데이터마트, OLAP 등의 활용이 증가함에 따라 데이터베이스 통합은 일반적이며 해결해야하는 문제가 되었다. 데이터베이스를 통합하여 공유하는 방법은 여러 가지가 있지만 데이터베이스 시스템의 진정한 상호작동은 각 시스템의 데이터베이스를 의미적으로 비교하여 합병하여야 한다. 본 연구는 기존의 데이터베이스 연합 방식을 개선하여 데이터베이스 관리자가 데이터베이스의 의미를 쉽고 효율적으로 찾아내는 통합 시스템을 제안한다. 연구에서 데이터베이스 의미 정보 통합은 전역 뷰를 생성하는 도구를 사용하여 해결하였다. 전역 뷰를 구성하는 것은 복잡한 지식과 경험을 요구하기 때문에 아직까지 구성 도구가 개발된 사례가 많지 않은 핵심적인 문제이다. 제안된 기법과 도구는 데이터베이스 관리자가 사용하기에 간단하고 고기능이며 대부분의 통합 질의를 지원하도록 충분한 표현력을 갖도록 하였다.

  • PDF