• Title/Summary/Keyword: 데이터웨어하우스

Search Result 294, Processing Time 0.022 seconds

Building Data Warehouse System for Weblog Analysis (웹로그 분석을 위한 데이터 웨어하우스 시스템 구축)

  • Lee, Joo-Il;Baek, Kyung-Min;Shin, Joo-Hahn;Lee, Won-Suk
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2010.05a
    • /
    • pp.291-295
    • /
    • 2010
  • 최근 급격한 하드웨어 기술과 데이터베이스 시스템의 발전은 우리 주변에서 발생하는 다양한 분야의 데이터를 자동으로 수집하는 것을 가능하게 하였다. 흔히 데이터 스트림(data stream)이라고 언급되는 끊임없이 생산되는 대용량의 데이터를 효율적으로 처리하여 유용한 정보를 얻어내는 기술은 이미 많은 응용 분야에서 광범위하게 연구되고 있다. 인터넷은 이러한 데이터 스트림을 양산해 내는 주요 원천 중의 하나이다. 인터넷 비즈니스의 활성화와 더불어 웹로그 데이터 스트림은 마케팅, 전략 수립, 고객관리 등 여러 부분에 광범위하게 활용되기 시작했으며, 보다 정확하고 효율적인 분석에 대한 요구사항도 점점 늘어나고 있다. 데이터 웨어하우스(Data Warehouse)는 수집된 데이터를 주제 기반으로 통합하여 시계열 형태로 적재하는 저장소서 유용한 분석이나 의사결정에 많이 사용되어 왔다. 데이터웨어하우스는 데이터를 요약하고 통합 및 정제하는 기능을 제공하여 대용량의 데이터 처리에 적합하고 데이터의 품질을 향상시키기 때문에 데이터 마이닝 분야에서 전처리 과정으로도 많이 이용되어 왔다. 본 논문에서는 웹로그 데이터 스트림에 대한 데이터 웨어하우스를 구축하여 보다 고품질의 유용한 정보를 효율적으로 얻어내는 시스템을 제안한다.

  • PDF

Design and Analysis of Metrics for Enhancing Productivity of Datawarehouse (데이터웨어하우스의 개발생산성 향상을 위한 측정지표의 설계 및 분석)

  • Park, Jong-Mo;Cho, Kyung-San
    • Journal of Internet Computing and Services
    • /
    • v.8 no.5
    • /
    • pp.151-160
    • /
    • 2007
  • A datawarehouse which extracts and saves the massive analysis data is used for marketing and decision support of business. However, the datawarehouse has the problem of increasing the process time and cost as well as has a high risk of process errors because it integrates vast amount of data from distributed environments. Thus, we propose a metrics for measurement in the area of productivity, process quality and data quality. Also through the evaluation using the proposed metrics, we show that our proposal provides productivity enhancement and process improvement.

  • PDF

Explanation-based Data Mining in Data Warehouse (데이터 웨어하우스 환경에서의 설명기반 데이터 마이닝)

  • 김현수;이창호
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터 마이닝 기법들이 연구되어왔다. 특히 데이터 웨어하우스의 등장은 이러한 데이터 마이닝에 있어 필요한 데이터 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성 없는(trivial, spurious and irrelevant)내용만 무수히 쏟아낼 수 있다. 그러므로 데이터 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라도 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문에서는 데이터 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이터 웨어하우스로부터 연관규칙을 검증하는 일련의 아텍쳐(architecture)를 제시하고다 한다. 먼저 데이터 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이터 웨어하우스와 데이터 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이터 웨어하우스으 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기위한 지식표현 방법으로 Relational Predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이터 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 도메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이터 마이닝 접근을 제시하였다는데 있다.

  • PDF

산업재해 관리 시스템 구축을 위한 데이터 웨어하우스 마이닝 기법의 활용

  • Han, Jung-Hoon;Yoo, Hoon;Lee, Won-Geun;Sim, Jong-Chil;Kim, Chang-Eun
    • Proceedings of the Korean Institute of Industrial Safety Conference
    • /
    • 1998.11a
    • /
    • pp.225-230
    • /
    • 1998
  • 데이터 마이닝은 대용량 데이터베이스의 데이터 사이에 묻혀 있는 '패턴'을 발견하여 규칙을 추론함으로 여러 가지 유용한 지식을 캐내는 기법이다. 본 논문에서는 효과적인 재해관리 시스템을 구축하기 위해서 재해를 분석하고 대책을 마련할 수 있는 데이터 마이닝을 적용한 '데이터베이스 웨어하우스 마이닝 재해관리 데이터베이스 시스템'을 제시하고자 한다. 데이터 웨어하우스 마이닝은 다차원 데이터베이스로 구축되며 재해데이터간의 상호관련성, 특성요인별 패턴을 찾고 재해발생 가능성을 예측함으로써 재해예방의 의사결정을 지원할 수 있다.

  • PDF

데이터마이닝 시장이 떠오른다

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.8 s.63
    • /
    • pp.40-46
    • /
    • 1998
  • 최근 데이터 웨어하우스 구축붐이 일면서 데이터 마이닝 시장이 서서히 부상하고 있다. 데이터 웨어하우스 시장을 기반으로 특히 고객 성향 분석을 필요로 하는 유통, 카드, 보험, 통신 업체 등을 중심으로 데이터 마이닝 시장이 확산되고 있다. 이제 도입단계에 들어선 데이터 마이닝의 개념과 국내 시장 동향을 살펴본다.

  • PDF

AMaterialized View Maintenance Methodology for Customer Management in a Distributed Database Environment (분산 데이터베이스 환경에서 고객관리를 위한 실체화된 뷰 유지 방법론)

  • Lee, Hyun-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1851-1854
    • /
    • 2002
  • 일반적으로 고객 관리를 위한 고객 데이터는 운영 시스템 환경 여건상 다양한 분산 데이터베이스 시스템에 저장되어 있다. 이와 같이 분산 저장된 데이터들로부터 고객들의 향후 경향이나 추세 분석 등 의사 결정에 필요한 데이터로 활용하고자 할 때는 데이터베이스에 저장된 대량의 데이터가 고객 분석에 적합한 형태로 구성되어 서비스되어야 한다. 이에 적절한 구조가 데이터 웨어하우스 구조이며, 데이터 웨어하우스는 분산 저장된 각각의 소스들로부터 발생된 변경 정보들을 실시간으로 데이터 웨어하우스에 반영되어야한다. 이렇게 함으로써 정확한 의사 결정을 수행할 수 있게 된다. 이에 본 논문에서는 분산 컴퓨팅 환경에서 고객 관리를 정확하고 효과적으로 이루어질 수 있도록 기본 소스에서 발생된 데이터 변경을 웨어하우스에 실시간으로 전달하여 정확한 데이터를 유지할 수 있는 방법론을 제시하고자 한다. 또한 제시된 방법의 실험 평가 결과를 간략하게 도시하여 나타내었다.

  • PDF

DW 활용사례 - Ingram Book사

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.10 s.65
    • /
    • pp.66-73
    • /
    • 1998
  • Ingram Book사의 데이터 웨어하우스 관리자가 데이터 웨어하우스의 장기적 목적을 희생시키지 않은 동 회사의 신속한 DSS 구축과 운영 성공 사례를 소개한다.

  • PDF

데이터웨어하우징

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.9 s.64
    • /
    • pp.60-62
    • /
    • 1998
  • 한국오라클은 최근 자사의 데이터 웨어하우스 솔루션을 이용해 보험개발원의 보험통계 시스템을 구축했다. 이를 통해 보험개발원은 다차원적 통계분석, 전략적 의사결정 지원 등 데이터의 전사적 관리가 가능하게 되었다. 보험개발원의 데이터 웨어하우스의 도입배경, 구축과정, 시스템 구성, 구축효과에 대해 살펴봤다.

  • PDF

Design and Implementation of Medical Data Warehouse Architecture (의료용 데이터 웨어하우스 아키텍쳐의 설계 및 구현)

  • 김종호;김태훈;민성우;이희석
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.393-402
    • /
    • 1999
  • 과거와 다르게 최근의 병원들은 정보화로 인해서 상당한 양의 의료 데이터가 저장되어 있어서 이의 효과적인 이용에 관심을 가지고 있다. 그러나 기존 통합병원정보시스템 (Integrated Hospital Information System)은 아직까지 일반관리와 원무관리 중심에서 벗어나지 못하고 있다. 품질 좋은 의료 서비스를 제공하기 위해서 환자 중심의 진료 및 진료지원, 임상연구 등을 종합적으로 지원하기 위한 데이터 웨어하우스 (Data Warehouse)의 필요성이 대두되기 시작했다. 이에 본 연구는 병원 전체 차원에서 데이터 웨어하우스의 아키텍쳐를 설계하고 개발하는 데 주안점을 두었다. 특히, 임상 데이터 웨어하우스 (Clinical Data Warehouse)에 초점을 두었으며 이에 대한 프로토타입은 J 병원에 적용되어서 개발되었다.

  • PDF

An Algorithm for Selecting Materialized Views based on Join Cost in Data Warehouse Environments (데이터 웨어하우스 환경에서 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘)

  • Yun, Won-Sik;Sin, Dong-Cheon
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.31-41
    • /
    • 2001
  • 데이터 웨어하우스 환경에서 데이터 분석을 위한 OLAP 질의에 대한 응답 시간을 줄이기 위해 실체 뷰 도입을 고려할 수 있다. 데이터 웨어하우스 환경에서 실체 뷰는 차원 테이블 과 사실 테이블의 조인으로 구성되어 있는 조인 뷰로 이루어지므로 지인 비용은 실체 뷰 선택에 영항을 미치는 가장 중요한 요소이다. 본 논문에서는 실체 뷰의 차원 속성 레벨을 이용하여 조인 테이블 추적하는 방법을 정형화하고 조인 비용을 기반으로 한 실체 뷰 선택 알고리즘을 제안한다.

  • PDF