• 제목/요약/키워드: 시간 집계 연산

검색결과 22건 처리시간 0.025초

u-GIS 환경에서 다중 공간 집계 질의의 중복연산 비용을 감소시키기 위한 자원공유 기법 (Resource Sharing Method to Reduce Duplicate Operation Cost of Multiple Spatial Aggregates in u-GIS Environment)

  • 서민호;김상기;백성하;이연;이동욱;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.344-347
    • /
    • 2009
  • 데이터 스트림을 처리하기 위한 연속집계질의 수행 시 중복연산 및 메모리의 절약을 위하여 큐를 공유하는 자원공유기법이 연구되었다. 기존의 자원공유 기법들은 질의의 프리디킷이 일치할 때만 처리하기 때문에, 질의의 프리디킷이 차이가 나는 경우가 많은 다중공간 집계질의가 자주 요청되는 u-GIS 환경에서 효율적으로 중복영역을 처리할 수 있는 자원공유 기법이 요구된다. 본 논문에서는 공간영역을 효율적으로 그룹화하는 R-tree 의 특징을 이용하여 질의간의 중복영역을 그룹화하고 중복영역의 자원을 패인(Pane)구조를 이용하여 공유한다. 노드 수에 제한이 없고 레벨을 1로 하는 R-tree 로 유사한 위치의 질의들을 그룹화 한 후, 그 질의들의 영역이 겹쳐지는 부분을 패인을 이용해 집계 값을 공유하여 중복계산을 피하는 방법이다. 제안 기법은 공간 집계질의를 처리할 수 있고, 기존의 계층구조의 자원공유 기법을 사용할 때에 비해 자원을 적게 사용하고 질의 처리 시간을 단축시켰다. 성능평가를 통하여 제안기법이 메모리 사용량을 감소시키는 것을 보였으며, 질의 처리 속도가 증가하였다.

AVL 트리를 사용한 효율적인 스트림 큐브 계산 (Efficient Computation of Stream Cubes Using AVL Trees)

  • 김지현;김명
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.597-604
    • /
    • 2007
  • 스트림 데이터는 끊임없이 고속으로 생성되는 데이터로써 최근 이러한 데이터를 분석하여 부가가치를 얻고자 하는 노력이 활발히 진행 중 이다. 본 연구에서는 스트림 데이터의 다차원적 분석을 위해 큐브를 고속으로 계산하는 방법을 제안한다. 스트림 데이터는 비즈니스 데이터와는 달리 정렬되지 않은 채로 도착하며, 데이터의 끝에 도달하지 않은 상태에서는 집계 결과를 낼 수 없어서, 고속으로 집계하는 과정에서 저장 공간의 낭비를 심하게 초래한다. 또한 큐브에 속한 집계 테이블들을 모두 생성하는 것은 시간/공간 측면에서 비효율적이라는 점이 지적되고 있다. 이러한 문제를 해결하기 위해 본 연구에서는 기존 연구들과 마찬가지로 큐브에 포함시킬 집계 테이블들을 사용자가 미리 정하도록 하였고, 정렬되지 않은 스트림 데이터를 고속으로 집계하는 과정에서 배열과 AVL 트리들로 구성된 자료구조를 집계 테이블의 임시 저장소로 사용하였다. 제안한 알고리즘은 생성하려는 큐브가 메모리에 상주할 수 없을 정도로 큰 경우에도 집계 연산을 수행할 수 있다. 이론적 분석과 성능 평가를 통해 제안한 큐브 계산 알고리즘이 실용적임을 입증하였다.

시간지원 데이터베이스의 질의처리 시스템 구현 (Implementation of Query Processing System in Temporal Databases)

  • 이언배;김동호;류근호
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1418-1430
    • /
    • 1998
  • 시간지원 데이터베이스는 유효시간과 거래시간을 통해 객체에 대한 효율적인 이력관리를 제공한다. 유효시간은 현실세계에서 객체에 발생한 시간을 의미하며, 거래시간은 객체가 데이터베이스에서 정의된 연산 뿐만 아니라 사용자 질의에 내포된 이력정보에 관련된 연산을 처리할 수 있도록 확장되어야 한다. 따라서 이 논문에서는 시간지원 질의언어인 TQuel(temporal query language)을 대상으로 하는 이전에 제안된 시간지원 질의 처리 시스템에 대하여 시간지원 구문분석과 시간지원 의미분석, 그리고 시간지원 코드 생성 및 시간지원 실행기 등의 기본적인 요소를 기반으로 거래시간 관리, 시간지원 집계, 시간지원 뷰, 그리고 시간지원 죠인 및 최적화 기능을 추가로 설계 구현하고, 그 처리과정을 예를 들어 설명한다.

  • PDF

공간 데이터 웨어하우스에서 개념 계층을 지원하는 공간 데이터 큐브 (A Spatial Data Cubes with Concept Hierarchy on Spatial Data Warehouse)

  • 옥근형;이동욱;유병섭;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2006
  • 데이터 웨어하우스에서는 OLAP(On-Line Analytical Processing) 연산을 제공하기 위해 다차원 데이터를 큐브의 형태로 관리한다. 특히, 공간 차원과 같이 데이터 큐브의 차원에 개념 계층이 존재하는 경우 사용자는 특정 계층에 대한 집계 결과를 요구한다. 기조의 데이터 큐브의 구조들은 차원의 개념 계층을 지원하지 못하거나 지원하더라도 시간이나 공간적 비용에 대해 비효율적이다. 본 논문에서는 공간 데이터 웨어하우스에서 공간 개념 계층을 이용하여 효율적인 계층별 영역 집계연산을 지원하는 공간 데이터 큐브를 제안한다. 이는 개념 계층을 DAG(Directed Acyclic Graph) 형태로 표현하여 구성된 여러 개의 차원들을 공간차원의 지역성을 기준으로 연결한 구조이다. 이러한 구조를 갖는 큐브를 이용하면, 데이터 검색 시 상위 계층부터 아래 방향으로 탐색하기 때문에 각 차원에 대한 효율적인 검색이 가능하다. 특히, 공간 개념 계층에 대한 DAG를 이용하면, 공간적 지역성에 따른 영역 검색을 지원할 수 있다. 성능평가에서 개념 계층이 적용된 질의에 대한 실험을 통해 제안 기법이 기존 기법들에 비해 저장 공간 효율성 및 질의 응답 성능이 우수함을 증명한다.

  • PDF

프랙탈을 이용한 시공간 데이터웨어하우스 (Spatio-Temporal Data Warehouses Using Fractals)

  • 최원익;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.46-48
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 적응적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

  • PDF

공간 데이타 큐브의 선택적 실체화에 관한 연구 (A Study on the Selective Materialization of Spatial Data Cube)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.69-76
    • /
    • 1999
  • 최근에 공간 데이타 웨어하우스에서 자주 사용되어지고 질의 응답 시간이 많이 걸리는 복잡한 공간 집계 질의들은 미리 그 결과를 계산하여 실체화시키는 방법들이 연구되고 있다. 본 논문에서는 기존의 선택적 실체화 알고리즘에 대한 개선 방안으로 공간 뷰의 공간 측정에 대한 공간 연산의 계산 시간과 접근 빈도를 고려하여 선택적 실체화에 대한 방법을 제시하고 개선된 선택적 실체화 알고리즘을 제안한다.

  • PDF

USN환경에서 효율적인 공간영역질의를 위한 적응형 영역 집계 인덱스 기법 (Adaptive Range Aggregation Index Method for Efficient Spatial Range Query in Ubiquitous Sensor Networks)

  • 이연;어상훈;조숙경;이순조;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.93-107
    • /
    • 2007
  • 본 논문에서는 유비쿼터스 센서 네트워크 환경에서의 공간 영역 질의를 효과적으로 처리하는 공간 영역 집계 인덱스 기법을 제안한다. 새로운 정보화 패러다임인 네트워킹과 컨버전스 기반의 유비쿼터스 환경의 중요성이 부각되면서 유비쿼터스 센서 네트워크 환경에서의 에너지 효율적인 실시간 공간질의에 대한 연구가 활발히 진행되고 있다. 센서 네트워크에서 공간영역질의는 사용자가 지정한 일정한 시간 동안의 특정 지리적 영역의 온도, 습도 등 스칼라 데이터를 감지한다. 공간 질의를 효과적으로 수행하기 위하여 Rectangle 기반의 SPIX기법 등 공간 인덱스 기법들이 많이 진행되었지만 기존 연구에서는 공간 영역질의의 질의 결과 값 전달 경로를 질의 전달 경로의 역방향으로 지정하였다. 센서 네크워크의 공간 영역 질의에서 질의 영역 내의 센서들은 대부분이 인접되어 있지만 질의 전달 경로가 틀리면 질의 영역 내에서 집계되지 못하고 전달되므로 불필요한 에너지를 낭비하게 된다. 본 논문에서는 유비쿼터스 센서 네트워크에서 공간 영역 질의를 수행 할 때 질의 영역 내에서 센서 노드들 간의 통신거리를 고려하여 질의 결과 값 전달 경로를 재선정하고, 적응적으로 집계 영역 내에서 집계연산을 하여 질의 결과 값을 전달하는 인덱스 기법을 제안한다. 성능평가를 통하여 제안 기법이 기존 기법보다 우월함을 보여주었다.

  • PDF

시공간 데이타웨어하우스를 위한 힐버트큐브 (Hilbert Cube for Spatio-Temporal Data Warehouses)

  • 최원익;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.451-463
    • /
    • 2003
  • 최근 시공간 데이타에 대한 OLAP연산 효율을 증가시키기 위한 여러 가지 연구들이 행하여지고 있다. 이들 연구의 대부분은 다중트리구조에 기반하고 있다. 다중트리구조는 공간차원을 색인하기 위한 하나의 R-tree와 시간차원을 색인하기 위한 다수의 B-tree로 이루어져 있다. 하지만, 이러한 다중트리구조는 높은 유지비용과 불충분한 질의 처리 효율로 인해 현실적으로 시공간 OLAP연산에 적용하기에는 어려운 점이 있다. 본 논문에서는 이러한 문제를 근본적으로 개선하기 위한 접근 방법으로서 힐버트큐브(Hilbert Cube, H-Cube)를 제안하고 있다. H-Cube는 집계질의(aggregation query) 처리 효율을 높이기 위해 힐버트 곡선을 이용하여 셀들에게 완전순서(total-order)를 부여하고 있으며, 아울러 전통적인 누적합(prefix-sum) 기법을 함께 적용하고 있다. H-Cube는 대상공간을 일정한 크기의 셀로 나누고 그 셀들을 힐버트 값 순서로 저장한다. 이러한 셀들이 시간순서로 모여 규브형태를 이루게 된다. 또한 H-Cube는 시간의 흐름에 따라 변화되는 지역적인 데이타 편중에 대처하기 위해 적응적으로 셀을 정제한다. H-Cube는 정적인 공간 차원에서 움직이는 짐 객체에 초점을 두고 있는 적웅적이며, 완전순서화되어 있으며, 또한 누적합을 이용한 셀 기반의 색인구조이다. 본 논문에서는 H-Cube의 성능 평가를 위해서 다양한 실험을 하였으며, 그 결과로서 유지비용과 질의 처리 효율성면 모두에서 다중트리구조보다 높은 성능 향상이 있음을 보인다.

건강 스트림 데이터의 다차원적 분석을 위한 저장 구조 (A Storage Scheme of Health Data Stream for Multidimensional Analysis)

  • 신혜원;임윤선;김명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2005
  • 유비쿼터스 의료 기술이 본격화되면서 센서 네트워크를 통해 환자의 건강 관련 데이터 스트림을 수집하여 위험상황을 탐지하고 지속적인 건강 상태를 모니터링할 수 있게 되었다. 그러나 방대한 양의 스트림 데이터로부터 의미 있는 데이터를 효과적으로 찾아내기 위해서는 실시간으로 데이터의 갱신과 집계 연산이 가능해야 하고 데이터의 압축이 효율적으로 처리 될 수 있는 다차원 저장구조가 필요하다. 기존의 다차원 데이터 분석 도구인 OLAP 큐브 저장구조는 실시간 업데이트가 힘들고, 스트림 데이터 저장 구조인 DSMS들은 다차원 데이터 분석이 용이하지 않다. 이에 본 연구에서는 건강 스트림 데이터의 특징과 질의를 분석하고, 이러한 스트림 데이터에 적합한 저장구조의 요건을 제시하였다. 또한 점진적 갱신이 가능하고, 대용량 데이터를 시간 차원으로 압축, 삭제하기 용이하며 실시간에 분석 데이터 구축이 가능한 저장구조를 제안하고 그 효율성을 보였다.

  • PDF

다차원 데이터 분석을 위한 비트맵 인덱스 (A Bitmap Index for Multi-Dimensional Data Analysis)

  • 임윤선;박영선;김명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.298-300
    • /
    • 2002
  • 다차원 데이터를 배열에 저장하는 Multidimensional OLAP (MOLAP) 시스템은 배열내의 위치 정보를 통해 데이터를 신속하게 엑세스할 수 있는 장점을 갖는다. 그러나 실생활의 다차원 데이터는 대체로 희박하여 저장될 때 압축되고, 데이터가 검색될 때는 원래의 위치 정보를 찾기 위해 인덱스를 필요로 하게 된다. 다양한 종류의 다차원 인덱스가 테이블 형태의 데이터를 대상으로 개발되어 있으나, 이들은 데이터의 삽입과 삭제에 유연하게 대처할 수 있도록 하기 위해서 인덱스 공간과 데이터 검색 시간에 약간의 낭비를 초래한다. 본 연구에서는 OLAP 데이터가 주기적으로 갱신되며, 분석에 필요한 집계 데이터도 점진적으로 갱신되기보다 실제로는 새로 생성되고 있다는 점을 고려하여, 읽기 전용 MOLAP 데이터를 위한 인덱스 구조를 제안한다. 데이터는 청크들로 나뉜 후 압축 저장되며, 각 청크는 위치 정보를 유지하면서 비트로 표현되어 인덱스에 저장되도록 하였다. 제안한 비트맵 인덱스는 높은 압축률을 보이며, 범위 질의(range query)를 포함한 OLAP 주요 연산들 처리에 특히 효율적이다.

  • PDF