• 제목/요약/키워드: 다차원 데이터베이스

검색결과 147건 처리시간 0.022초

다차원 데이터베이스에서 차원속성 레벨을 이용한 조인 테이블 추적의 정형화 (Formalization of Tracing Join Table Using Dimension Attribute Level in Multidimensional Databases)

  • 윤원식;신동천
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.129-131
    • /
    • 1999
  • 다차원 데이터베이스에서 데이터분석을 위한 OLAP질의에 대한 응답 시간을 줄이기 위해 실체 뷰를 고려할 수 있다. 다차원 데이터베이스에서의 실체 뷰는 차원 테이블과 사실 테이블의 조인으로 구성되어 있는 조인 뷰를 형성하며 적절한 개수의 실체 뷰를 선택하는 일은 중요하다. 조인비용은 다차원 데이터베이스의 실체 뷰 선택에 있어서 가장 중요한 요소이다. 본 논문에서는 조인 비용을 구하기 위해서 실체 뷰의 계층정보를 이용하여 조인 테이블 추적하는 방법을 정형화하고 구현한다.

  • PDF

데이터 웨어하우스의 개념적 설계를 위한 스타 스키마에서 ER 도형으로의 변환 기법 (Translation of Star Schema into Entity-Relationship Diagrams for Data Warehouse Conceptual Design)

  • 최은하;김진호;옥수호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.142-144
    • /
    • 2002
  • 데이터 웨어하우스는 기업의 의사 결정을 지원하기 위해 기업의 운영 데이터베이스로부터 추출한 데이터의 집합으로써 OLAP 분석에 이용된다. OLAP은 이들 데이터를 다양하게 분석할 수 있도록 다차원 데이터로 표현하고 이를 활용하여 복잡한 분석 질의 처리 및 다차원 데이터 분석에 활용한다. 이러한 OLAP의 다차원 데이터를 관계형 데이터베이스에서 표현하기 위해 스타 스키마가 널리 사용된다. 또한 다차원 데이터와 데이터 웨어하우스는 방대한 분량를 갖는 전체 기업의 데이터를 표현하고 있어 이를 설계하는 것이 매우 복잡하고 많은 노력이 소요된다. 따라서 이를 설계하기 위한 체계적인 설계 방법론이 필요하다. 데이터 웨어하우스의 원천 데이터가 되는 운영 데이터베이스는 현재 ER 도형을 이용하여 개념적인 방법으로 널리 설계되고 있다. 따라서 이 논문에서는 ER 도형으로 설계된 운영 데이터베이스로부터 데이터 웨어하우스를 설계하는 개념적인 방법론을 제시한다. 이에 따라 OLAP 분석을 위해 사용할 수 있는 다양한 유형의 스타 스키마에 대해 ER 도형으로 표현/변환하는 방법을 제시한다. 이를 통해 자신이 원하는 다차원 데이터를 얻기 위해 유지해야 할 데이터 웨어하우스를 ER 도형을 이용하여 개념적으로 편리하게 설계하는 방법/지침을 제공하며, 나아가 해당 유형의 스타 스키마가 갖는 의미를 개념적으로 쉽게 전달할 수 있도록 하였다.

  • PDF

XML 소스 데이터로부터 스타 스키마를 생성하기 위한 XML2Star 알고리즘 (XML2Star Algorithm Creating Star Schema from Source Data in XML)

  • 최은하;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 웨어하우스는 기업의 의사 결정을 지원하기 위해 기업의 운영 데이터베이스로부터 추출한 데이터의 집합으로써 OLAP 분석에 이용된다. OLAP은 데이터에 대한 다양한 분석을 위해 이들 데이터를 다차원 데이터 모델로 표현하고 이를 활용하여 복잡한 질의 처리 및 다차원 데이터 분석에 이용한다. 이러한 OLAP의 다차원 데이터를 관계형 데이터베이스에서 표현하기 위해 스타 스키마가 널리 사용된다. 지금까지의 데이터 웨어하우스는 일반적으로 ER 도형으로 설계된 소스 데이터로부터 스타 스키마를 설계하고 구축하였다. 하지만, 최근 인터넷의 급성장으로 인해 차세대 웹 문서의 표준인 XML을 통한 인터넷 상의 문서 전송 및 정보 교환이 활발해 지고 있으며, XML 문서에 대한 다차원적인 분석이 요구됨에 따라 데이터 웨어하우스는 XML 문서로부터의 스타 스키마 설계 및 저장이 필요하게 되었다. 따라서 본 논문에서는 XML DTD로부터 애트리뷰트 트리를 생성하여 스타 스키마를 설계하고 이 DTD를 따르는 XML 문서에서 스타 스키마의 인스턴스를 추출하여 관계형 데이터베이스에 저장하기 위한 XML2Star 알고리즘을 개발하였다. 이것을 통해 기업 및 사용자는 OLAP에서 XML 기반의 스타 스키마를 이용한 다차원적인 분석이 가능하게 된다.

  • PDF

빅 데이터 분석정보 공유를 위한 다차원 이벤트 데이터베이스의 동기화 효과 연구 (A Study on Synchronization Effect of A Multi-dimensional Event Database for Big Data Information Sharing)

  • 이춘열
    • 디지털융복합연구
    • /
    • 제15권10호
    • /
    • pp.243-251
    • /
    • 2017
  • 효과적인 데이터 분석 및 활용을 위해서는 빅 데이터를 내부 데이터와 유연하게 연계할 수 있는 방안이 필요하다. 빅 데이터 분석 정보를 내부 정보시스템과 연계시키기 위한 방안으로서 본 연구는 다차원 이벤트 온톨리지를 제시하였다. 이를 위해서 먼저 빅 데이터 분석 정보를 이벤트 모형을 사용하여 온톨리지로 표현하고, 다차원 데이터베이스 또한 OWL-DL 온톨리지로 변환하여 표현하였다. 다차원 이벤트 온톨리지에서 빅 데이터 분석정보들은 차원 계층구조를 통하여 다차원 데이터베이스에 저장된 모든 개체들에게 공유되는데, 본 연구에서는 이를 이벤트의 하향공유, 상향 공유 및 복합 이벤트 공유로 구분한다. 이들 정보공유 유형별로 빅 데이터 분석 정보의 공유 및 활용 방안들을 제시하였으며, Protege를 사용하여 시험적으로 구현하였다. 본 연구는 외부의 빅 데이터 분석 정보를 내부의 다차원 데이터베이스와 연계하는 방안을 실험적으로 제시하였다는 점에서 의의를 가진다고 할 수 있다.

시계열 데이터베이스에서 DFT-기반 다차원 인덱스를 위한 물리적 데이터베이스 설계 (Physical Database Design for DFT-Based Multidimensional Indexes in Time-Series Databases)

  • 김상욱;김진호;한병일
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1505-1514
    • /
    • 2004
  • 시퀀스 매칭은 시계열 데이터베이스로부터 질의 시퀀스와 변화의 추세가 유사한 데이터 시퀀스들을 검색하는 연산이다. 기존의 대부분의 연구에서는 효과적인 시퀀스 매칭을 위하여 다차원 인덱스를 사용하며, 데이터 시퀀스를 이산 푸리에 변환(Discrete Fourier Transform: DFT)한 후, 단순히 앞의 두 개 내지 세 개의 DFT 계수만을 구성 속성 (organizing attributes)으로 사용함으로써 고차원의 경우 발생하는 차원 저주(dimensionality curse) 문제를 해결한다. 본 논문에서는 기존의 단순한 기법이 가지는 성능 상의 문제점들을 지적하고, 이러한 문제점들을 해결하는 최적의 다차원 인덱스 구성 기법을 제안한다. 제안된 기법은 대상이 되는 시계열 데이터베이스의 특성을 사전에 분석함으로써 변별력이 뛰어난 요소들을 다차원 인덱스의 구성 속성으로 선정하며, 비용 모델(cost model)을 기반으로 한 시퀀스 매칭 비용의 추정을 통하여 다차원 인덱스에 참여하는 최적의 구성 속성의 수를 결정한다. 제안된 기법의 우수성을 규명하기 위하여 실험을 통한기존 기법과의 성능 비교를 수행하였다 실험 결과에 의하면, 제안된 기법은 기존의 기법에 비교하여 매우 큰 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당 (Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases)

  • 이정아;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

지문인식을 위한 다차원공간 인덱스의 설계 (Multidimensional Index for Fingerprint Identification)

  • 김갑영;심현보;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.222-224
    • /
    • 1999
  • 지문은 가장 효율적인 사용자 인증방법으로 이용되어져 왔다. 또한 컴퓨터의 발달과 더불어 자동지문 인식은 더욱 많이 연구되어졌고, 또한 급속도로 발전하였다. 이런 대부분의 연구들은 지문 인식에서 특징점 추출 및 정합부분에 관한 연구가 주류를 이루고 있다. 그런, 대단위 데이터베이스 검색 향상을 위한 방법의 연구는 아직도 미진한 실정이다. 본 연구는 기존의 지문 데이터베이스에 공간 인덱스를 추가시켜 지문을 효과적으로 추출하는 방법을 제시한다. 이 방법으로, 데이터베이스의 지문을 다차원공간 인덱스에 저장시킨다. 그리고, 지문을 검색을 할 때에는, 다차원공간상에서 미지 지문과 유사한 지문들을 추출하여, 후보지문을 만든다. 그리고, 매칭 작업은 이 후보지문들하고만 매칭 하여도 전체를 한 것과 같은 효과를 얻을 수 있다. 이러한 방법으로, 전체 지문 검색 시간을 단축시킬 수 있다.

  • PDF

다차원 텍스트 큐브를 이용한 호텔 리뷰 데이터의 다차원 키워드 검색 및 분석 (Multi-Dimensional Keyword Search and Analysis of Hotel Review Data Using Multi-Dimensional Text Cubes)

  • 김남수;이수안;조선화;김진호
    • 정보화연구
    • /
    • 제11권1호
    • /
    • pp.63-73
    • /
    • 2014
  • 웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.

객체 데이타베이스를 위한 다차원 중포 색인구조의 운용과 할당 (Operations And Assignments Of Multidimensional Nested Indexs For Object Databases)

  • 이정아;임윤주;이종학
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.624-627
    • /
    • 2004
  • 지난 몇 년간 체세대 데이터베이스 시스템으로서 객체 데이터베이스 시스템의 객체 질의연구가 이루어지고 있으며, 특히 고급 질의의 처리비용을 줄이기 위한 연구가 활발하다. 최근에 제안된 중포 속성 색인기법은 객체지향 질의 처리의 성능 향상에 크게 기여하고 있다. 하지만 이들 색인구조들은 기존의 관계형 데이터베이스에서 사용된 단순 속성에 대한 색인구조에 비해 저장 공간과 갱신 유지비용이 크다. 또한 클래스 상속에 의한 객체 데이터 모델의 특징을 반영하지 못하며 타켓 클래스 및 도메인 클래스 대치가 있는 경로식으로 표현된 질의는 지원하지 못한다. 따라서 본 논문에서는 객체 데이터베이스의 주요 특징을 반영할 수 있는 색인구조인 다차원 중포 색인구조와 경로 색인구조에 대한 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 효율적인 색인할당방법을 제시한다. 이로써 객체지향 데이터베이스 시스템에서의 고급 질의의 처리비용을 줄일 수 있다.

  • PDF

전력 부하 패턴 분석을 위한 3차원 큐브 마이닝과 캘랜더 패턴 기반 시간 데이터 마이닝 (3D Cube Mining and Calendar Pattern Based Temporal Mining for Analyzing Power Load Pattern)

  • 박진형;신진호;;이헌규;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.200-203
    • /
    • 2008
  • 최근 전력산업에서의 에너지 가격 및 공급과 수요의 변동, 그리고 기후의 변화에 의해서 부하 예측은 전력회사 경영방침 계획에 있어 중요한 요소가 되었다. 이 논문에서 전력계통의 최적 운용 계획을 위하여 우리가 제안한 기법은 다차원 분석이 가능한 3D 큐브 마이닝과 시간의 변화에 따른 패턴 예측이 가능한 캘린더 기반 시간 데이터 마이닝 기법이다. 이를 통하여 무선 부하 감시 시스템의 부하 데이터의 다차원 분석이 가능하고, 시간 변화에 따른 서로 다른 부하 패턴의 예측이 가능하도록 한다.