• 제목/요약/키워드: 웨어하우스 구성

검색결과 48건 처리시간 0.024초

ER 도형의 연결 위상구조를 이용한 스타 스키마 추출 알고리즘 (A Star Schema Extraction Algorithm Using Connection Topologies of ER Diagrams)

  • 신성현;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2002
  • 관계형 OLAP 시스템에서는 다차원 분석에 사용될 데이터를 하나의 사실과 여러 개의 차원 테이블로 구성된 스타 스키마로 표현한다. 사실 테이블은 측정치의 속성을 포함하며, 차원 테이블들은 이러한 사실 테이블에서 중심으로 뻗어져 나온 형태로써, 측정치에 대한 정보를 제공한다. 방대한 크기의 OLTP 소스 데이타베이스로부터 사실과 차원 테이블로 구성된 스타 스키마 설계하기 위해서는 풍부한 경험과 많은 시간을 필요로 한다. 따라서 스타 스키마를 효과적으로 설계하기 위한 체계적인 설계 방법이 필요하다. 본 논문에서는 소스 데이터베이스들에 대한 개념적 모델인 ER 도형을 이용하여 여러 개의 사실 엔터티를 추출하는 알고리즘과 이를 통해 자동적으로 스타 스키마를 설계하는 알고리즘을 제시하였다. 스타 스키마가 하나의 사실 테이블에 여러 개의 차원 테이블이 M:1의 관계로 연결되었다는 성질을 활용하여, 이 방법에서는 EH 도형이 연결된 위상 구조를 이용하여 각 엔터티에 연결된 M:1 관계의 개수에 근거하여 사실과 차원을 추출하는 방법을 제시하였다. 본 논문에는 이러한 방법을 통해 데이터 웨어하우스의 스타 스키마들 자동적으로 쉽게 설계하여 소요되는 시간과 노력을 줄일 수 있도록 하였다.

  • PDF

데이터웨어하우스에서 단순화된 격자를 이용한 데이터큐크의 실체뷰 선택 (Materialized View Selection for Datacube using Simplified Lattice in Datawarehouse)

  • 장지숙;서은주;이전영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.604-612
    • /
    • 1999
  • 데이터웨어하우스는 데이터분석을 위한 특수 목적의 데이터베이스로, 주로 데이터분석을 위한 질의(이하 OLAP 질의)가 던져진다. 그런데 OLAP질의는 수백만개의 레코드를 가지 테이블에 대해 하나 이상의 aggregation 함수와 group-by 연산자가 포함되므로, 질의 처리 시간은 수 분에서 수 시간이 걸린다. 이를 개선하기위하여 데이터 큐브를 구현함에 있어서의 문제는 디스크 공간이 한정되어 있기 때문에 평균 질의 처리 시간이 훨씬 짧아진다하더라도 모든 셀들을 실체화할수 없다. 따라서 한정된 디스크 공간을 최대한 활용하면서 가능한 빠른 평균 질의 처리 시간을 얻을 수 있도록 데이터 큐브의 일부만을 실체화 시켜야한다. 본 논문의 주제와 관련된 연구로는 Harinarayan[4] 이 제안한 greedy 알고리즘이 있다. 이 알고리즘은 1) 데이터 큐브를 격자구조로 표현한후, 2) 격자의 위에서부터 아래로 차례로 뷰들을 방문하면서 방문한 뷰가 실체화되 경우 데이터 큐브에 주는 이익을 계산한다. 3) 그 중 가장 이익이 큰 것을 선택한다. 3) 그중 가장 이익이 큰 것을 선택한다. 2)와 3)의 과정은 k개의 뷰를 선택할 경우, k번 반복된다. 이 알고리즘의 운영 시간은 데이터 큐브를 구성하는 뷰의 개수가 n개이고 그 중에서 k개를 실체화할 경우에 O(kn2)이다. 본 논문에서는 운영 시간을 향상시킨 수정된 greedy 알고리즘을 제안한다. 알고리즘 내부에서 실체화할 뷰를 선택할 때 격자를 단순화시킨 트리를 사용함으로써, 알고리즘 운영시간을 O(kn2)에서 O(kn)으로 향상시켰다.

공간 데이터 웨어하우스에서 공간 데이터의 개념계층기반 사전집계 색인 기법 (Pre-aggregation Index Method Based on the Spatial Hierarchy in the Spatial Data Warehouse)

  • 전병윤;이동욱;유병섭;김경배;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1421-1434
    • /
    • 2006
  • 공간 데이터 웨어하우스는 SOLAP(Spatial On-Line Analytical Processing)을 이용하여 의사 결정에 필요한 분석 정보를 제공한다. SOLAP은 대용량 데이터를 분석하기 때문에 사전집계를 이용하여 분석비용을 줄이기 위한 많은 연구가 진행되었다. 기존 기법들은 고정크기노드를 갖는 색인을 이용하여 개념계층을 지원하였다. 따라서 산개분포 영역에는 빈 공간이 많이 발생하며, 밀집분포 영역에는 개념계층을 지원할 수 없다. 본 논문은 공간 데이터의 개념계층기반으로 사전집계 색인의 동적 구성 기법을 제안한다. 제안 기법은 트리구조를 이용하여 개념계층의 레벨을 트리의 레벨과 같도록 지원한다. 하나의 노드는 데이터가 적을 경우 엔트리를 분할하여 서로 다른 부모 엔트리를 가질 수 있으며, 데이터가 많을 경우 노드의 연결리스트를 이용하여 같은 레벨에 순차적으로 저장한다. 따라서 데이터가 산개된 분포의 노드에 대해서 저장 공간의 낭비를 최소화하며, 데이터가 밀집한 영역의 노드에 대해서도 노드의 연결리스트로 노드가 분할되지 않으므로 개념계층을 지원할 수 있다. 성능평가를 통하여 색인 구축 시간이 다른 기법과 비슷하고, 색인의 저장 공간이 감소하며, 집계정보의 검색 성능이 다른 기법에 비해 우수한 것을 보인다.

  • PDF

집계큐브리트리 :효율적인 범위-집계 질의의 수행을 위한 큐브트리 (Aggregate Cubetree : Cubetree for Efficient Execution of Range-Aggregate Query)

  • 홍석진;송병호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2001
  • 데이터웨어하우스 환경에서는 범위-집계 질의를 효율적으로 수행하기 위해 데이터큐브로 저장뷰를 구성한다. 큐브트리란 이러한 저장뷰를 R-Tree형태로 구성하는 기법으로, 효율적인 데이터 접근성을 제공하지만 범위-집계 질의 범위 내의 모든노드를 접근해야 하는 단점이 있다. 이 논문에서는 중간노드의 MBR에 자식 노드 레코드들의 집단함수 값을 저장하여, 질의 범위에 포함되는 중간노드의 경우 단말노드를 접근하지 않고 효율적으로 범위-집계 질의를 수행할 수 있는 집계큐브트리를 제안하였다. 집계큐브트리는 기존의 큐브트리에 비해, 항상 적은 수의 노드 접근으로 질의를 수행하며 질의 범위의 크기가 커질수록 좋은 성능을 보인다.

  • PDF

재정비촉진사업 마스터플랜 지원 데이터웨어하우스 프로토타입 (Data-warehouse Prototype for Supporting Master Plan of Renewal Promotion Projects)

  • 조동현;구교진
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6376-6384
    • /
    • 2015
  • 재정비촉진사업 실무에서 참여자 간 구두 협의에 의존하고 있어 계획안 자체가 빈번히 변경되는 문제가 발생하고 있다. 마스터플랜이 참여자 의견조율을 위한 수단으로 활용될 수 있지만, 소수의 총괄계획가 및 총괄계획팀이 사업과 관련된 대규모의 정보항목들을 고려하여 마스터플랜을 신속하고 효과적으로 수립하는 것은 한계가 있다. 마스터플랜 수립에 필요한 정보항목들을 체계적 효율적으로 저장하고, 검색이 가능하도록 구성하여 효과적인 의사결정을 지원할 수 있는 시스템이 필요하다. 본 연구에서는 사업초기단계에서의 마스터플랜 수립을 지원하는 데이터웨어하우스 프로토타입을 제안한다. 전문가 면담 및 사례분석을 바탕으로 재정비촉진사업 운영상의 문제점을 도출하고 개선방안을 제시하였다. 마스터플랜을 작성할 때 기본적인 근거자료로 활용되는 기초조사결과와 마스터플랜사례 정보항목을 도출하여 메타데이터 인덱스 데이터베이스를 구축하고 정보검색 사용자 인터페이스를 제시하였다. 프로토타입을 실제 마스터플랜 수립업무 사례에 적용한 결과, 메타데이터를 통한 필요한 정보의 효과적인 검색이 가능하였다.

센서 네트워크와 3G 통신 기반 스마트 생장환경 관리시스템 개발 (The Implementation of Smart Raising Environment Management System based on Sensor Network and 3G Telecommunication)

  • 정경진;김원중
    • 한국전자통신학회논문지
    • /
    • 제6권4호
    • /
    • pp.595-601
    • /
    • 2011
  • 본 논문에서는 u-IT기술을 농업에 적용하여 시설하우스 식물들에게 최적의 생장 환경을 자동으로 조절하는 시스템을 제안한다. 본 시스템은 온도, 습도 등의 환경 센서와 EC, PH 등의 생체 센서 그리고 자동제어장치들로 구성되어 있고, 이는 자동조절 소프트웨어로 제어된다. 농민은 이 시스템을 기반으로 시설하우스의 생장환경을 정밀하게 제어하여 생산비를 절감하고 고품질의 농산물을 생산하게 된다. 본 시스템은 각 시설하우스에 설치되는 클라이언트 시스템과 클라이언트의 데이터를 취합하는 서버시스템으로 구축이 되었고, 인터넷과 3G망을 통해 각 농가의 자료를 취합한다. 수집된 생장환경 데이터는 최적의 작물 생장환경을 찾아내기 위해 다양한 방법으로 분석되고, 시각화되어 농가 컨설팅 자료로 활용된다.

GIS 기반의 물통합관리시스템 구축 방안 (Strategies for the Integrated Water Management System based on GIS)

  • 서동조;송동하;이상진
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.463-466
    • /
    • 2009
  • 수질 및 유량 등에 관한 하천유역의 종합적이고 체계적인 관리를 위하여 GIS의 도입을 통한 물통합관리시스템의 구축 방안을 제시하였다. 이를 위하여 물통합관리에 필요한 각종 정보요소를 파악하여 GIS와 연계할 수 있는 DB의 주요 항목과 주제도의 내용을 제시하였다. 개별 오염원의 공간적인 위치정보와 함께 다양한 조건에서 발생하는 오염부하량, 유역 내수문변화를 모의하고 이로 인한 하천의 유량 및 수질변화 추적을 위한 DB의 종류 및 구성 내용도 제시하였다. 위치자료와 속성정보의 연계, 관측 자료의 검색과 시계열 분석, 각종 위치관련 정보를 시각적으로 확인할 수 있는 기능 등 GIS와 연계된 물통합 정보 제공 기능도 정리하였다. 또한 기존의 물환경정보시스템, 오염총량관리지원시스템, 각 시군구에서 자체적으로 추진하고 있는 수질 및 수량 측정자료들과의 연계와 통합 DB 구축 및 물통합관리 데이터 웨어하우스 구축을 제안하였다.

  • PDF

전역 스키마 생성 도구를 이용한 데이터베이스 통합 및 질의 시스템 (Design of Database Integration System and Query System based on Global View Generation Tool)

  • 박우창
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.65-74
    • /
    • 2007
  • 기업에서 데이터베이스, 데이터웨어하우스, 데이터마트, OLAP 등의 활용이 증가함에 따라 데이터베이스 통합은 일반적이며 해결해야하는 문제가 되었다. 데이터베이스를 통합하여 공유하는 방법은 여러 가지가 있지만 데이터베이스 시스템의 진정한 상호작동은 각 시스템의 데이터베이스를 의미적으로 비교하여 합병하여야 한다. 본 연구는 기존의 데이터베이스 연합 방식을 개선하여 데이터베이스 관리자가 데이터베이스의 의미를 쉽고 효율적으로 찾아내는 통합 시스템을 제안한다. 연구에서 데이터베이스 의미 정보 통합은 전역 뷰를 생성하는 도구를 사용하여 해결하였다. 전역 뷰를 구성하는 것은 복잡한 지식과 경험을 요구하기 때문에 아직까지 구성 도구가 개발된 사례가 많지 않은 핵심적인 문제이다. 제안된 기법과 도구는 데이터베이스 관리자가 사용하기에 간단하고 고기능이며 대부분의 통합 질의를 지원하도록 충분한 표현력을 갖도록 하였다.

  • PDF

전사 수준의 통합 비즈니스 룰 리포지토리 구축을 위한 비즈니스 룰 관리 아키텍처에 관한 연구

  • 허종원;최상호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.362-366
    • /
    • 2007
  • 최근 기업 경영활동의 의사결정시 사용되는 비즈니스 룰(Business Rule)을 정형화하고 하나의 시스템으로 구축하여 효과적으로 기업의 경쟁력을 제고하기 위한 노력이 다양하게 시도되고 있다. 비즈니스 룰 시스템 구축 작업의 경우 기업 내부에 비정형적으로 존재하는 비즈니스 룰을 체계적으로 관리하기 위해 BRMS(Business Rule Management System)와 같은 전문 관리 도구를 도입하나, 대부분의 경우 비즈니스 룰 리포지토리(Repository)를 단순히 기능별 혹은 업무별로 구성함으로 인해 동일한 내용의 룰이 서로 다른 룰 리포지토리에 중복 존재하게 되는 등 구조상의 문제점을 발생시킨다. 이로 인해 각 어플리케이션 간의 룰 또는 룰 세트(Rule Set) 공유 관계가 수동 관리되거나 중복 룰의 수정으로 인한 룰 세트별 버전 관리 문제 등 비즈니스 룰 리포지토리 운영의 어려움에 봉착하게 된다. 본 연구에서는 금융보험사의 룰웨어하우스 구축 사례를 통해 다양한 어플리케이션에서 참조되는 전사 수준의 비즈니스 룰 관리 아키텍처 구성 방법 및 각 방법이 지닌 장단점에 대해 분석한다. 본 연구의 결과를 토대로 다양한 어플리케이션에서 참조되고 수시로 변경되는 전사 수준의 통합 비즈니스 룰 관리 시스템 구축 방안에 대한 연구가 활성화되기를 기대한다.

  • PDF

인터넷 소매상의 경제적 경쟁요인에 관한 실증연구 (An Empirical Study on the Economical Competition Factors of Internet Retailers)

  • 이수정;남순해;고석하
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.3-13
    • /
    • 2002
  • 고석하 등(2002)은 인터넷 소매상이 상품 품목의 명목 가격과 배송료를 이용해서 고객의 일회 총 구매 비용을 조절한다는 것을 밝혔다. 고석하 등(2002)은 같은 내용의 상품 조합을 인터넷 시장에서 구매하기 위한 비용과 전통 시장에서 구매하기 위한 비용을 비교하였다. 분석 결과, 그 교호작용과 함께, 상품 종류와 일회 구매액/가격의 크기의 두 요소가 인터넷 시장의 전통 시장에 대한 총 구매비용 할인율의 변동의 약 60%내지 80%를 설명할 수 있다는 것을 보여주었다. 한편, 구매액/가격은 인터넷 시장에서의 해당 산포도(전통 시장의 그것에 대비한)에는 거의 영향을 미31지 못하며, 상품의 종류도 산포도에는 할인율에서와 같이 큰 영향을 미치지 않았다. 인터넷 시장의 가격이나 구매비용 산포도는 상품 특성이나 구매액 크기 이외의 다른 요인에 의해서 주로 영향을 받는 것으로 나타났다. 따라서, 본 논문에서는 가격 요인 이외의 경제적 경쟁요인에 관한 실증연구로서, 2002년 6월 17일부터 20일까지, 소프트웨어, PC와 주변기기, 휴대폰, 가전제품, CD, 화장품, 그리고 책의 7가지 산업 전문 쇼핑몰과 종합 쇼핑몰을 대상으로, 인터넷 시장에서 수행되고 있는 경제적인 비가격 경쟁요인에 관한 실증 조사를 실시하였다. 조사 결과, 인터넷 시장에서 수행되고 있는 경제적인 비가격 경쟁요인은 매우 다양하며, 상품별로도 다른 특성을 보이고 있는 것으로 밝혀졌다. 인터넷 소매상의 경제적인 비가격 경쟁요인은 크게 배송료 면제와 배송료 외 인센티브 제도로 구분된다. 본 논문에서는 경제적인 비가격 경쟁요인의 모든 경우의 수를 고려할 수 있도록, 코드표를 작성하여 정리하고 분석하였다.기호로 인식하였다. 실험결과, 표준패턴을 음표와 비음표의 두개의 그룹으로 나누어 인식함으로써 DP 매칭의 처리 속도를 개선시켰고, 국소적인 변형이 있는 패턴과 특징의 수가 다른 패턴의 경우에도 좋은 인식률을 얻었다.리되고 이원화된 코드체계와 데이터 형태의 이질화를 통일하는 방법으로 데이터웨어하우스 시스템을 제시하였다. 결국 병원에서 데이터웨어하우스 시스템의 구축은 임상, 연구, 교육의 유기적 순환관계를 정립하여 지식의 순환적 고리인 수집, 공유, 확산, 재창출을 지속적 유지할 수 있는 인프라를 구축해 준다. 반면 상이한 정보들간의 충돌과 이에 따른 해석의 오류로 잘못된 의사결정을 위한 정보를 제공할 수 있고 기초정보의 접근 및 추출의 유용성에 의해서 정보유출에 대한 문제가 한계점으로 나타났다.로세스 개선을 위해서 무엇을 정말로 필요로 하는지를 밝힘으로써, 한국 소프트웨어 산업의 현실적인 특수성을 고려한 소프트웨어 프로세스 평가와 개선 모델의 개발을 위한 기초적인 자료를 제공할 것으로 예상된다. 또한, 본 연구 결과는, 우리나라 소프트웨어 조직들이 실제로 무엇을 필요로 하는지를 밝힘으로써, 우리나라의 소프트웨어 산업을 육성하기 위한 실효성 있는 정책 입안을 위한 기초 자료를 제공할 것으로 예상된다.를 검증하려고 한다. 협력체계 확립, ${\circled}3$ 전문인력 확보 및 인력구성 조정, 그리고 ${\circled}4$ 방문보건사업의 강화 등이다., 대사(代謝)와 관계(關係)있음을 시사(示唆)해 주고 있다.ble nutrient (TDN) was highest in booting stage (59.7%); however no sig

  • PDF