• 제목/요약/키워드: 데이터웨어하우스

검색결과 294건 처리시간 0.029초

DW보안관리...프로세스 개선이 핵심

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 2호통권81호
    • /
    • pp.12-15
    • /
    • 2000
  • 웹의 등장은 보안이라는 문제를 더욱 중요하게 부각시켰다. 특히 데이터웨어하우스처럼 핵심적인 대규모의 시스템 환경에 있어서의 보안의 거의 기업의 사활과 직결된다고 볼 수 있다. 고급수준의 제어 기능을 지원하는 보안환경은 이제 필수적인 요소이다. 보안 문제는 다이나믹하고도 지속적으로 변화되고 있다. 따라서 데이터웨어하우스 보안 관리자는 프로세스를 계속해서 관리해야 한다. 훌륭한 보안 프로그램은 사용자에게 보안의 중요성을 지속적으로 알리고 동기를 부여해야 하며, 지속적인 업데이트가 가능해야 한다. 외부 침입에 대비하기 위해 시스템 전체를 지속적으로 스캔하는 것도 필수적이다.

  • PDF

웨어하우스 환경하에서 데이터 통합에 관한 연구 (A Study on Data Integration in a Warehouse Environment)

  • 이현창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1643-1646
    • /
    • 2003
  • 데이터 웨어하우스 시스템은 사용자에게 다양하고 고품질의 정보 서비스를 제공하며, 의사 결정을 지언하는데 빠른 질의 처리 요구에 적합한 시스템이다. 고품질의 정보 서비스를 제공하기 위해서는 축적된 많은 정보가 요구되며, 이들 데이터들에 대한 분석을 수행함으로써 경영자의 의사 결정에 최적의 정보를 추출하여 제공해주는 시스템이다. 이러한 의사 결정을 위한 기존의 관계형 데이터베이스 환경하에서는 많은 시간적인 낭비 요소가 존재한다. 이에 본 논문에서는 데이터 통합을 보다 향상시킬 수 있는 전략을 제시하고 기존에 알려진 방법들과 이에 대한 비친 분석을 통하여 향상된 곁과에 대해 살펴본다.

  • PDF

데이터웨어하우스에서 유전자 알고리즘을 이용한 구체화된 뷰 선택 기법 (A Genetic Algorithm for Materialized View Selection in Data Warehouses)

  • 이민수
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.325-338
    • /
    • 2004
  • 데이터 웨어하우스는 복잡한 질의 및 분석을 위해서 다양한 종류의 여러 정보 출처들로부터 정보를 모아서 저장한다. 일반적으로 웨어하우스에는 자주 실행되는 질의들을 미리 계산해서 구체화된 뷰의 형태로 저장한다. 웨어하우스를 설계할 때 가장 중요한 일들 중의 하나는 웨어하우스에서 유지될 구체화된 뷰의 선택이다. 이것은 뷰들의 유지를 위해 제한된 시간이 주어졌을 때, 모든 질의들에 대한 총 질의 응답 시간을 최소화하는 방법으로 일련의 뷰들을 선택하는 것이다(유지-비용 뷰 선택 문제). 본 논문에서는 최적에 가까운 일련의 뷰들을 계산하기 위해 유전자 알고리즘을 사용하여 유지-비용 뷰 선택 문제에 대한 효율적인 해결책을 제안한다. 특히 OR 뷰 그래프들의 관점에서의 유지-비용 뷰 선택 문제를 다룬다. 본 논문의 접근방식은 휴리스틱 방법을 사용한 기존의 탐색-기반 접근 방식들에 비해서, 시간 복잡도에서 큰 향상을 보여준다. 본 논문의 알고리즘은 최적의 질의 비용에 비해 10%이내의 추가비용만을 갖는 해결책을 제시하면서도 실행시간 측면에서는 매우 향상된 선형 증가만을 보인다. 본 논문의 알고리즘에 대한 프로토타입을 구현하였으며 이것을 사용하여 논문에서 제안하는 접근방식의 분석을 수행하였다.

Staging 영역을 활용한 분산 의료정보시스템 통합 (Integration of Distributed Medical Information System using Staging Area)

  • 전영희;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.184-188
    • /
    • 2008
  • 최근 국내 디지털 병원들이 점차 기업화 되면서 각 지역별 분산 및 독립 운영되는 의료통계 정보 활용의 중요성이 증대되고 있다. 또한 각종 연구목적 및 의료 서비스 경쟁력 향상 등을 위해 신속 정확한 의사결정지원 시스템인 데이터 웨어하우스(DW; Data Warehouse) 구축의 필요성이 대두되고 있다. 본 논문에서는 단일 병원 내의 데이터 웨어하우스가 아닌, 전국적으로 분산 운영되고 있는 병원의 다양한 의료정보를 통합하고자 한다. 따라서 Staging 영역을 활용한 분산된 의료정보시스템 통합 방안을 제시한다.

  • PDF

건설생산성 관리 시스템 구축을 위한 데이터웨어하우스의 적용 (The Application of Data Warehouse for Developing Construction Productivity Management System)

  • 오세욱;김명호;김영석
    • 한국건설관리학회논문집
    • /
    • 제7권2호
    • /
    • pp.127-137
    • /
    • 2006
  • 건설생산성은 단위작업에서 발생되는 자원의 활동과 이로 인한 산출물간의 관계를 지표로 표현한 것을 의미하며 수집된 건설 생산성 정보는 공사 진행의 효율성 파악, 작업여건 및 투입자원의 성능이 공정에 미치는 영향도 분석, 프로젝트별 성과 측정, 향후 공사계획을 위한 참고자료로서의 활용 등 프로젝트 관리를 위한 다양한 목적으로 이용될 수 있다. 본 연구의 목적은 데이터웨어하우스, OLAP, 데이터 마이닝 기술을 활용하여 PDA 및 바코드를 통해 수집된 생산성 데이터를 축적 및 분석하고, 생산성 예측 모델을 제시하기 위한 방법론을 제안하는 것이다. 이를 통해 보다 효율적이고도 다차원적인 생산성 분석이 가능한 건설 생산성 관리 시스템을 개발하는 것이며, 개발된 시스템은 건설 사업의 합리적인 성과 측정과 유사 프로젝트의 공사계획 수립에 활용할 실적데이터를 축적할 수 있을 것이다.

공간 데이터웨어하우스에서 시공간 분석 지원을 위한 비중복 적재기법 (Non-Duplication Loading Method for supporting Spatio-Temporal Analysis in Spatial Data Warehouse)

  • 전치수;이동욱;유병섭;이순조;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.81-91
    • /
    • 2007
  • 본 논문에서는 공간 데이터 웨어하우스에서 시공간 분석지원을 위한 공간 데이터의 비중복 적재 기법을 제안한다. SDW는 이기종의 다양한 서비스를 지원하는 SDBMS로부터 공간 데이터를 추출한다. 제안 기법에서는 SOW에 소스로 참여하는 SDBMS에서 변경된 부분만을 추출하고, 이를 공간연산을 통해 중복된 데이터를 제거한 후 통합된 형태로 적재함으로써 빠른 공간 데이터 분석을 지원할 수 있으며, 저장 공간의 낭비를 줄일 수 있다. 이는 공간 마이닝등의 시간에 따른 분석 및 예측 분야에 효율적인 형태로 공간 데이터를 적재한다.

  • PDF

인터넷 데이터웨어하우스 구축을 위한 메타데이터 스키마 충돌 제어 (Control of metadata schema conflicts for internet datawarehouse)

  • 김병곤
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.499-507
    • /
    • 2007
  • 인터넷을 통한 웹서비스에 대한 사용자들의 요구가 증가하고 다양해지면서 정보들을 수집하고 통합하여 특정집단 또는 일반인들의 의사결정을 지원하기 위한 인터넷 데이터웨어하우스에 대한 중요성이 갈수록 증대되고 있다. 초기의 인터넷 데이터웨어하우스는 기존의 데이터베이스와 XML을 이용한 형태로 연구되었으나, 정보 표현상의 한계로 인하여 점차 RDFS와 같은 메타데이터 스키마를 이용한 시스템 형태로 변화하고 있다. 인터넷의 특성상 분산된 시스템 환경에서 서로 상이한 메타데이터 스키마들을 통합과 저장이 중요한 요소이다. 그러나, 서로 상이한 스키마간에는 충돌할 수 있는 요소들이 존재하므로 지역 스키마들 간에 발생할 수 있는 의미적, 구조적 충돌을 감지하고 고려하여 저장이나 질의 처리 등에서 완벽한 처리가 가능하도록 시스템을 구성하여야 한다. 본 논문에서는 이와 같이 분산된 환경에서 지역 메타데이터 스키마들 간의 통합시 충돌이 발생하는 경우를 분석하고, 이에 따른 충돌 해결 기법을 제시하여 완벽한 스키마 통합이 가능하도록 한다.

  • PDF

데이터웨어하우징에서 MIN/MAX질의를 고려한 뷰관리 정책 (View Maintenance Policy for considering MIN/MAX query in Data warehousing)

  • 김근형;김두경
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1336-1345
    • /
    • 2002
  • 데이터웨어하우스에서 실체뷰는 사용자의 정보처리 요구에 신속하게 응답하기 위한 주요한 수단이다. 데이터웨어하우스내에 실체뷰의 개수가 많을수록 사용자의 질의요구를 실체뷰내에서 처리할 수 있는 확률이 높아지므로 신속한 응답이 가능하다. 데이터웨어하우스내에 유지할 수 있는 실체뷰의 개수에 대한 주요 제약은 기본릴레이션의 변화에 기인하는 실체뷰 갱신시간이다. 본 논문에서는 MIN/MAX 함수를 포함하는 실체뷰에 대해서 기본릴레이션의 MIN/MAX값의 변화가 빈번할 경우에도 실체뷰 갱신시간을 절약할 수 있는 효율적인 실체뷰 갱신정책을 제안한다. 기본릴레이션의 MIN/MAX값의 변경을 삽입/삭제연산으로 구분하여 실체뷰를 갱신하면 실체뷰의 MIN/MAX값 갱신을 위하여 기본릴레이션에 접근해야 할 횟수가 줄어든다.

공간 데이터 웨어하우스에서 개념 계층을 지원하는 공간 데이터 큐브 (A Spatial Data Cubes with Concept Hierarchy on Spatial Data Warehouse)

  • 옥근형;이동욱;유병섭;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2006
  • 데이터 웨어하우스에서는 OLAP(On-Line Analytical Processing) 연산을 제공하기 위해 다차원 데이터를 큐브의 형태로 관리한다. 특히, 공간 차원과 같이 데이터 큐브의 차원에 개념 계층이 존재하는 경우 사용자는 특정 계층에 대한 집계 결과를 요구한다. 기조의 데이터 큐브의 구조들은 차원의 개념 계층을 지원하지 못하거나 지원하더라도 시간이나 공간적 비용에 대해 비효율적이다. 본 논문에서는 공간 데이터 웨어하우스에서 공간 개념 계층을 이용하여 효율적인 계층별 영역 집계연산을 지원하는 공간 데이터 큐브를 제안한다. 이는 개념 계층을 DAG(Directed Acyclic Graph) 형태로 표현하여 구성된 여러 개의 차원들을 공간차원의 지역성을 기준으로 연결한 구조이다. 이러한 구조를 갖는 큐브를 이용하면, 데이터 검색 시 상위 계층부터 아래 방향으로 탐색하기 때문에 각 차원에 대한 효율적인 검색이 가능하다. 특히, 공간 개념 계층에 대한 DAG를 이용하면, 공간적 지역성에 따른 영역 검색을 지원할 수 있다. 성능평가에서 개념 계층이 적용된 질의에 대한 실험을 통해 제안 기법이 기존 기법들에 비해 저장 공간 효율성 및 질의 응답 성능이 우수함을 증명한다.

  • PDF

데이터웨어하우스 환경에서의 설명기반 데이터마이닝 (Explanation-Based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 지능정보연구
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF