• 제목/요약/키워드: 다차원 데이터베이스

검색결과 147건 처리시간 0.027초

다차원 시퀀스 데이터베이스를 위한 효율적인 범위 검색 기법 (Efficient Range Search Method for Multi-dimensional Sequence Database)

  • 이상준;김범수;이석호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.613-620
    • /
    • 1999
  • 시간의 흐름에 따라 순차적으로 생성되는 연속적인 데이터의 모임을 시퀀스라 한다. 저장된 시퀀스에서 질의로 주어진 시퀀스와 유사한 것을 찾는 문제에 대한 기존의 연구는 대부분 하나의 속성만을 대상으로 한것이며, 여러 속성으로 구성된 다차원 시퀀스에 대해서는 아직까지 활발한 연구가 이루어지지않고 있다. 본 논문에서는 유사도에 기반한 다차원 시퀀스의 범위 검색 문제를 정의하고 세 가지 검색 기법을 기술한다. 순차 검색 기법, 속성별 인덱스 구조, 차원 감소 기법을 이용한 다차원 시퀀스의 검색 기법을 기술하고 질의에 대해 어떤 검색 기법이 효율적인지 실험을 통해 보인다.

Hellinger 엔트로피를 이용한 다차원 연속패턴의 생성방법 (Learning Multidimensional Sequential Patterns Using Hellinger Entropy Function)

  • 이창환
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.477-484
    • /
    • 2004
  • 데이터 마이닝에서 연속패턴(sequential pattern) 생성기술은 시차를 두고 발생한 사건들에 대하여 잠재해있는 패턴을 발견하는 기술을 의미한다. 본 연구는 정보이론을 이용하여 데이터베이스로부터 연속패턴을 자동으로 발견하는 방법에 관한 내용이다. 기존의 방법들이 한 속성내에서의 연속패턴만을 탐지하는 일차원 연속패턴을 생성하는데 비하여 본 연구에서 제시하는 방법은 데이터베이스내의 모든 속성간의 연속패턴 관계를 탐지할 수 있는 다차원 연속패턴을 생성할 수 있다. 본 연구에서는 연속패턴 생성을 위하여 헬링거(Hellinger) 변량을 사용하였으며 이를 이용하여 발견된 연속패턴들의 중요도를 측정할 수 있었다. 또한 헬링거 변량의 함수적인 특성을 분석하여 연속패턴 추출의 복잡도를 줄이기 위한 두 가지의 법칙이 제안되었고 다수의 실험 데이터를 통하여 다차원의 연속패턴을 생성할 수 있음을 보였다.

시퀀스 데이터베이스를 위한 타임 워핑 기반 유사 검색 (Time-Warping-Based Similarity Search in Sequence Databases)

  • 감상욱;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.202-204
    • /
    • 2001
  • 본 논문에서는 대형 시퀀스 데이터베이스에서 타임 워핑을 지원하는 유사 검색을 효과적으로 처리하는 방안에 관하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 주는 변환이다. 타임 워핑 거리는 삼각형 부등식 성질을 만족하지 못하므로 기존의 기법들은 착오 기각 없이 다차원 인덱스를 사용할 수 없었다. 본 논문에서는 타임 워핑을 지원하는 새로운 인덱스 기반 유사 검색 기법을 제안한다. 제안된 주요 목표는 착오 기각 없이 대형 데이터베이스에서도 좋은 검색 성능을 보장하는 것이다. 다양한 실험을 통하여 제안된 기법의 우수성을 규명한다. 실험 결과에 의하면, 제안된 기법은 기존의 기법과 비교하여 약 4배에서 43배까지의 성능 개선 효과를 가지는 것을 나타났다.

  • PDF

Orthologous 데이터베이스의 효율적인 구축 방안 (An Efficient Methodology For The Construction Of Orthologous Database)

  • 오정수;조완섭;김태경;김선신;이충세;권혜룽;김영창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.277-279
    • /
    • 2004
  • 생물을 진화적으로 분석할 때, 보전적인 유전자(Conserved gene)득은 기능이 알려지지 못했던 다양한 생물학적 정보를 얻어내는데 유용하게 쓰일 수 있다. 특히 완전히 서열이 밝혀진 지놈(Genome) 데이터로부터 진화적으로 보존적인 유전자 서열의 상동성에 따른 분류를 통한 2차 데이터베이스의 구축은 생물학자들에게 다차원적인 정보를 제공 할 수 있다. 이미 이러한 데이터베이스가 다양한 방법에 따라 구축되었고 생물학자들의 연구에 활용되고 있다. 그러나 기 구축된 데이터베이스들은 생물학자들이 이용하기에 Paralogs의 포함 문제점으로 인해 신뢰성이 떨어지거나 데이터베이스 생성기간이 오래 걸린다는 단전이 있다 본 연구는 기존에 구축된 데이터베이스들의 구축방법을 응용하고, 정보기술을 활용하여 빠르고 효과적으로 정확성을 높인 새로운 구축 방법론과 데이터베이스를 활용한 분석 시스템에 대해 제시하고자 한다.

  • PDF

다차원 인덱싱 구조에서의 k-근접객체질의 처리 방안 (k-Nearest Neighbor Query Processing in Multi-Dimensional Indexing Structures)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.85-92
    • /
    • 2005
  • 최근에 데이터베이스 응용분야에서 내용기반의 검색이 가능한 이미지 데이터와 같은 다차원 정보 처리에 대한 관심이 고조되고 있다. 따라서 다차원 데이터를 효율적으로 저장하고. 사용자가 원하는 질의 결과를 신속히 제공하는 것이 중요한 연구분야이다 다차원의 데이터에 대한 질의는 대표적으로 영역질의 (Range query)와 최근접객체검색질의(Nearest Neighbor Query)로 나눌 수 있다. 본 논문에서는 $R^*-tree$와 같은 다차원의 인덱싱 구조에서 효율적이고 빠른 k-근접객체검색질의를 수행하기 위한 방안을 제시한다. k-근접객체검색질의는 질의 객체로부터 가장 근접한 k개의 객체를 반환하는 것이다. 본 논문은 이를 위하여 가지치기(Pruning) 기법을 이용하여 검색 공간을 줄이는 방법을 사용하였다. 실험을 통하여 제안된 전략의 오버헤드와 이득을 보였으며, 마지막으로 가장 효율적인 전략의 사용을 제안하였다.

  • PDF

다차원 지리정보시스템을 위한 저장기법 및 분리된 저장구조 (Storage Strategy and Separated Storage Structure for Multi-dimensional Geographic Information System)

  • 박동선;배해영
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.1-11
    • /
    • 2000
  • 최근에 기존의 2차원적인 지리정보시스템에 시간차원을 포함하는 다차원 지리정보 데이터를 저장하기 위한 연구가 진행되고 있지만 대부분이 실제 구현에는 적용하기 어려운 개념적인 데이터모델의 설계단계에 머물고 있다. 본 논문에서는 기존 모델들의 문제점인 데이터 중복을 최소로 하고, 시간을 포함하는 질의에 대한 연산을 빠르게 수행할 수 있는 저장 기법인 MBNF기법을 설계하고, 데이터의 시간적 특성을 고려해서 과거 데이터베이스와 현재 데이터베이스에 분리하여 저장하는 분리된 저장구조를 설계하며, 분리된 데이터베이스간의 데이터 이동 알고리즘과 시간을 포함하는 질의를 효율적으로 수행하기 위한 검색 알고리즘을 설계한다.

  • PDF

이동체 데이터베이스를 위한 메인 메모리 색인의 성능 결정 요소에 관한 연구 (A Study of Performance Decision Factor for Moving Object Database in Main Memory Index)

  • 이창우;안경환;홍봉희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1575-1578
    • /
    • 2003
  • 이동통신 기술의 발달로 인하여 무선 이동 기기의 사용이 보편화되면서 LBS(Location Based System)의 요구가 나날이 증대되고 있다. 이와 같은 위치 기반 서비스에서 클라이언트인 이동체들은 일정한 보고 주기를 가지고 서버에 위치 데이터를 보고하게 되는데, 빈번한 보고 데이터를 실시간으로 처리하기 위해서 서버에서는 메인 메모리 DBMS를 유지하는 것이 필요하다. 기존에 제시된 메인 메모리 색인으로는 T-tree 가 있는데, 이는 1차원 데이터를 위한 것이므로 이동체 데이터베이스 환경에 적합하지 못하다. 그리고, 디스크 기반의 다차원 색인으로는 R-tree 계열이 있는데, 이는 메인 메모리에서 효율적인 사용을 보장하지 못한다. 이 논문에서는 이동체 데이터베이스 환경에 적합한 메인 메모리 색인을 고려함에 있어서, 기존의 디스크 기반의 다차원 색인으로 가장 널리 알려진 R-tree 계열의 색인을 메인 메모리에 적재 후 메인 메모리 환경에서 성능에 영향을 주는 요소를 실험을 통하여 제시한다. 실험은 메인 메모리에서는 간단한 알고리즘을 사용하는 것이 성능에 좋고, 삽입 시에는 삽입할 노드를 찾기 위해서 비교하는 엔트리의 수가, 검색 시에는 노드간의 중첩으로 인하여 비교하는 노드의 수와 엔트리의 수가 성능에 영향을 주는 요소임을 보여준다.

  • PDF

공간 데이터베이스의 효율적인 검색을 위한 X-트리와 kd-트리의 병합 알고리즘 (An Integration Algorithm of X-tree and kd-tree for Efficient Retrieval of Spatial Database)

  • 유장우;신영진;정순기
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3469-3476
    • /
    • 1999
  • 공간적인 자료구조를 기반으로 하는 공간 데이터베이스에서는 일차원 색인구조와는 달리 공간객체들의 다차원적인 특성에 부합되는 새로운 색인구조가 요구되고 있다. 본 논문에서는 이러한 요구사항을 충족시키기 위하여 기존 다차원 색인구조들의 특징 분석을 통하여 공간 데이터베이스의 효율적인 검색을 위한 새로운 색인구조를 제안하였다. 기존 X-트리에서 슈퍼노드의 순차적인 검색방법의 개선과 방대한 슈퍼노드가 생성되는 경우에도 검색시간의 단축이 가능하도록 하기 위하여, 포인트 색인구조를 갖는 kd-트리를 X-트리에 병합시킨 색인구조를 제안하였다. 제안된 색인구조를 실제로 구현하여 실험 데이터의 차원과 분포에 따라 검색시간을 분석하였다.

  • PDF

XML 데이터베이스 다차원 타입상속 색인구조의 조율 알고리즘 (A Tuning Algorithm for the Multidimensional Type Inheritance Index of XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.269-281
    • /
    • 2011
  • XML 데이터베이스에서 타입상속 개념의 질의처리를 지원하기 위한 다차원 타입상속 색인구조(Multidimensional Type Inheritance Index: MD-TIX)에 대하여, 본 논문에서는 질의 패턴에 따라 색인성능을 향상시키기 위한 색인구조의 조율 알고리즘을 제안한다. MD-TIX는 중첩 엘리먼트와 타입상속 계층이 포함된 복합 형태의 XML 질의처리를 지원하기 위하여 다차원 색인구조를 이용한다. MD-TIX의 조율 알고리즘에서는 먼저 사용자 질의 형태에 대한 질의 정보로서 색인구조를 구성할 색인 페이지 영역들의 모양을 결정하고, 이러한 모양의 페이지 영역들을 갖도록 하는 구간반분 전략을 적용함으로써 최적의 MD-TIX 색인구조를 구성한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 제안한 조율 알고리즘을 적용함으로서 최적의 MD-TIX를 구성할 수 있었으며, 경로 길이가 2인 경우에 주어지는 중첩 술어에 대한 삼차원 질의 영역의 경우, 모양이 편향된 정도에 따라 질의처리의 성능이 매우 크게 향상됨을 알 수 있었다.

OLAP을 위한 객체-관계 DBMS 기반 다차원 데이터 모델의 설계 및 구현 (Design and Implementation of Multidimensional Data Model for OLAP Based on Object-Relational DBMS)

  • 김은영;용환승
    • 한국통신학회논문지
    • /
    • 제25권6A호
    • /
    • pp.870-884
    • /
    • 2000
  • OLAT(On-Line Analytical Processing) 기법에서 스타 또는 눈송이(snowflake) 스키마에 기반한 ROLAP(Relational OLAP)은 성능 저하라는 문제가 있고, 다차원 데이터베이스에 기반한 MOLAP(Multidinmensional OLAP)은 데이터 크기 증가에 따른 공간 문제가 있다. 본 논문에서는 기존의 OLAP 시스템이 이러한 문제점을 해결하기 위해서 객체-관계 DBMS에 기반한 다차원 데이터 모델을 제안하였다. 객체-관계 DBMS가 가지는 확장성 특징을 사용하여 다차원 데이터 모델에 최적화된 다차원 개념과 함수를 정의할 수 있었다. 또한 객체-관계 DBMS의 객체간 계승 기능을 통하여 상위 테이블을 계승받는 요약 다차원 데이터 큐브의 다차원 데이터 모델을 설계하였다. 이와 같은 OLAP을 위한 데이터 타입과 함수가 정의되면, 새로운 객체-관계 DBMS 엔진과 같이 내장된 기능처럼 동작되어 성능향상이 가능하다. 또한 객체 관계 DBMS의 하나인 Informix Universal Server와 클라이언트 개발 도구를 이용하여 제안된 다차원 데이터 모델을 구현하였다.

  • PDF