• 제목/요약/키워드: Tree data

검색결과 3,320건 처리시간 0.03초

모바일 소프트웨어를 위한 효율적인 공간 인덱스 (Efficient Spatial Index for Mobile Software)

  • 오병우
    • Spatial Information Research
    • /
    • 제16권1호
    • /
    • pp.113-127
    • /
    • 2008
  • 최근 모바일 환경의 급속한 발달로 이동 중인 사용자의 위치에 기반한 다양한 서비스가 가능하게 되면서 모바일 기기에서 지도를 처리하는 모바일 소프트웨어의 개발이 증대되고 있다. 본 논문은 지도를 처리하는 모바일 소프트웨어에서 성능을 결정짓는 가장 중요한 요소인 공간 인덱스를 효율적으로 구성하는 새로운 방법을 제시한다. 본 논문에서 제시하는 $AR^*$-tree는 기존의 $R^*$-tree를 변형하여 2차원 공간 데이터의 x축 및 y축에 면적 (a) 축을 추가하여 3차원 데이터를 저장한다. 그리고, 검색 시에도 면적 축에 대한 조건을 추가함으로써 작은 화면을 갖는 모바일 기기에서의 지도 가독성을 증대시키고 시간 효율성도 동시에 향상시킨다.

  • PDF

MongoDB에서 B-트리 인덱스와 Fractal 트리 인덱스를 이용한 성능 비교 (Performance Comparisons on MongoDB with B-Tree Indexes and Fractal Tree Indexes)

  • 장성호;김수희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.622-625
    • /
    • 2014
  • 빅데이터가 다양한 가치를 만들어내기 시작하면서, 더 다양하면서도 막대한 량의 데이터를 수용할 수 있는 데이터베이스가 필요하게 되었다. 그래서 기존 RDBMS의 복잡도와 용량 한계를 극복하기 위한 목적으로 NoSQL 데이터베이스가 등장하게 되었고, 그 중 대표적으로 MongoDB가 많이 사용되며, 오픈 소스로 제공되고 있다. MongoDB에서 사용되는 B-트리 인덱스는 데이터양이 증가함에 따라 그 성능이 현저히 떨어진다. Fractal 트리 인덱스는 B-트리의 삽입 알고리즘을 개선하여 상당한 성능향상을 가능하게 한다. 이 논문에서는 MongoDB에서 B-트리 인덱스를 사용하는 경우와 Fractal 트리 인덱스를 사용하는 경우를 구별하여 그 성능을 비교해 본다.

  • PDF

대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성 (Incremental Generation of A Decision Tree Using Global Discretization For Large Data)

  • 한경식;이수원
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.487-498
    • /
    • 2005
  • 최근 들어, 대용량의 데이터를 처리할 수 있는 트리 생성 방법에 많은 관심이 집중되고 있다 그러나 대용량 데이터를 위한 대부분의 알고리즘은 일괄처리 방식으로 데이터를 처리하기 때문에 새로운 데이터가 추가되면 이 데이터를 반영한 결정 트리를 생성하기 위해 처음부터 트리를 다시 생성해야 하다. 이러한 재생성에 따른 비용문제에 보다 효율적인 접근 방법은 결정 트리를 순차적으로 생성하는 접근 방법이다. 대표적인 알고리즘으로 BOAT와 ITI를 들 수 있으며 이들 알고리즘은 수치형 데이터 처리를 위해 지역적 범주화를 이용한다. 그러나 범주화는 정렬된 형태의 수치형 데이터를 요구하기 때문에 대용량 데이터를 처리해야하는 상황에서 전체 데이터에 대해 한번만 정렬을 수행하는 전역적 범주화 기법이 모든 노드에서 매번 정렬을 수행하는 지역적 범주화보다 적합하다. 본 논문은 수치형 데이터 처리를 위해 전역적 범주화를 이용하여 생성된 트리를 효율적으로 재생성하는 순차적 트리 생성 방법을 제안한다. 새로운 데이터가 추가될 경우, 전역적 범주화에 기반 한 트리를 순차적으로 생성하기 위해서는 첫째, 이 새로운 데이터가 반영된 범주를 재생성해야 하며, 둘째, 범주 변화에 맞게 트리의 구조를 변화시켜야한다. 본 논문에서는 효율적인 범주 재생성을 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안하며 범주 변화에 맞는 트리 구조 변화를 위해 신뢰구간과 트리 재구조화기법을 이용한다. 본 논문에서 피플 데이터베이스를 이용하여 기존의 지역적 범주화를 이용한 경우와 비교 실험하였다.

H*-tree/H*-cubing: 데이터 스트림의 OLAP를 위한 향상된 데이터 큐브 구조 및 큐빙 기법 (H*-tree/H*-cubing-cubing: Improved Data Cube Structure and Cubing Method for OLAP on Data Stream)

  • 심상예;이연;이동욱;김경배;배해영
    • 정보처리학회논문지D
    • /
    • 제16D권4호
    • /
    • pp.475-486
    • /
    • 2009
  • 데이터 큐브는 다차원 데이터 분석 및 멀티레벨 데이터 분석에 많이 사용되고 있는 중요한 데이터 구조이다. 최근 데이터 스트림의 온라인 분석에 대한 수요가 증가하면서 스트림 큐브, Flow 큐브, S-큐브 등의 다양한 데이터 큐브 구조와 기법이 제안되었다. 그러나 기존 기법들은 데이터 큐브 생성 시 고비용이 요구되는 단점을 가지고 있어 효과적인 데이터 구조, 질의 방법 및 알고리즘에 대한 연구가 필요하다. 스트림 큐브 기법에서는 H-큐빙 기법을 사용하여 큐보이드를 선택하고, 계산된 셀들을 인기 패스에 있는 큐보이드들로 구성된 H-트리에 저장한다. 그러나 스트림 큐브 기법에서는 H-트리에 데이터를 비순차적으로 삽입하기 때문에 H-큐빙 기법을 사용하여 질의를 처리할 때 제한성을 갖고 있다. 본 논문에서는 데이터의 트리 구조의 각 층에 대한 인덱스를 구축하여 스트림 데이터에 대한 빠른 삽입 연산을 지원하는 $H^*$-tree 구조와, popular-path에 존재하지 않는 큐보이드를 빨리 계산하여 스트림 데이터에 대한 빠른 애드 혹 질의 응답을 지원하는 $H^*$-cubing 기법을 제안한다. 성능평가를 통하여 제안한 $H^*$-tree 기법은 보다 적은 큐브 구축 시간을 지원하며, $H^*$-cubing 기법이 stream cube 기법보다 빠른 애드 혹질의 응답 시간을 소요하며, 보다 적은메모리를 사용함을 보여준다.

Hadoop을 이용한 R-트리의 효율적인 병렬 구축 기법 (An Efficient Parallel Construction Scheme of An R-Tree using Hadoop)

  • ;김종민;권오흠;송하주
    • 한국멀티미디어학회논문지
    • /
    • 제22권2호
    • /
    • pp.231-241
    • /
    • 2019
  • Bulk-loading an R-tree can be a good approach to build an efficient one. However, it takes a lot of time to bulk-load an R-tree for huge amount of data. In this paper, we propose a parallel R-tree construction scheme based on a Hadoop framework. The proposed scheme divides the data set into a number of partitions for which local R-trees are built in parallel via Map-Reduce operations. Then the local R-trees are merged into an global R-tree that covers the whole data set. While generating the partitions, it considers the spatial distribution of the data into account so that each partition has nearly equal amounts of data. Therefore, the proposed scheme gives an efficient index structure while reducing the construction time. Experimental tests show that the proposed scheme builds an R-tree more efficiently than the existing approaches.

HD-Tree: 고성능 Lock-Free NNS KD-Tree (HD-Tree: High performance Lock-Free Nearest Neighbor Search KD-Tree)

  • 이상기;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.53-64
    • /
    • 2020
  • KD-Tree에서 NNS의 구현은 다차원 데이터를 다루는 응용 프로그램에서 필수적이다. 본 논문에서는 자료구조의 동시 수정, 검색이 일어나는 멀티스레드 상황에서 NNS를 지원하는 고성능 Lock-Free KD-Tree인 HD-Tree를 제안한다. HD-Tree는 동기화에 사용되는 노드 수를 최소화하고, 사용하는 원자 연산자의 수를 감소시켜 성능을 개선하였다. 실험 결과 HD-Tree는 8코어 16스레드의 멀티코어 시스템에서 기존의 NNS보다 성능이 최대 95% 향상되었고, 삽입/삭제연산은 코어보다 스레드가 많은 상황에서 기존 알고리즘보다 최대 15%향상된 성능을 보여준다.

Design and Implementation of System for Estimating Diameter at Breast Height and Tree Height using LiDAR point cloud data

  • Jong-Su, Yim;Dong-Hyeon, Kim;Chi-Ung, Ko;Dong-Geun, Kim;Hyung-Ju, Cho
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 논문은 LiDAR 점군 데이터를 사용하여 흉고 직경과 수고를 예측하는 ForestLi 시스템을 제안한다. ForestLi 시스템이 LiDAR 점군 데이터를 처리하는 과정은 다음과 같이 여러 단계로 진행된다. 다운샘플링, 이상점 제거, 지표면 분할, 지표면 정규화, 수간 추출, 개체목 분할, 흉고 직경 측정, 수고 측정. LiDAR 점군 데이터를 처리하는 상용 시스템 LiDAR360은 하측 식생과 개체목 분할 오류를 사용자가 직접 수정해야 한다. ForestLi 시스템은 하측 식생에 해당하는 LiDAR 점군 데이터를 자동으로 제거한다. 결과적으로 ForestLi 시스템이 LiDAR360보다 전체 수행시간을 줄이고, 흉고 직경과 수고 예측의 정확성을 높였다. 실험을 통해서 제안된 ForestLi가 LiDAR360 시스템보다 흉고 직경과 수고 측정의 정확성과 전체 실행시간 측면에서 우수하다는 것을 보여주었다.

이동객체의 궤적처리를 위한 트리기반 색인기법의 성능분석 (Performance Analysis of Tree-based Indexing Scheme for Trajectories Processing of Moving Objects)

  • 심춘보;신용원
    • 한국지리정보학회지
    • /
    • 제7권4호
    • /
    • pp.1-14
    • /
    • 2004
  • 본 연구에서는 GIS 응용에서 이동객체의 궤적을 인덱싱하기 위해 기존에 제안되었던 TB(Trajectory-Bundle)-트리의 성능을 개선시킬 수 있는 연결테이블(LinkTable:L-Table) 기반의 확장된 TB-트리(L-Table TB-Tree:LTB-Tree)를 제안하고 아울러 제안하는 색인기법의 성능평가를 위해 다음과 같은 사항을 고려한다. 첫째, 기존의 R*-트리, TB-트리, 그리고 제안하는 LTB-트리를 성능평가 대상으로 선정한다. 둘째, 실험 데이타 집합으로는 랜덤 데이타 집합 및 실제 데이타 집합을 이용한다. 셋째, 시스템의 가용 메모리의 제약을 고려해 메모리 버퍼 크기에 따른 성능평가를 수행한다. 넷째, 다양한 데이타 분포도를 가지고 있는 실험 데이타를 이용하여 성능평가를 수행한다. 마지막으로 삽입성능 및 검색성능(궤적질의 및 영역질의)을 평가한다. 성능평가를 분석한 결과, 제안하는 색인기법이 기존의 색인기법들에 비해 삽입과 궤적질의의 검색 측면에서 더 우수함을 보인다.

  • PDF

결정목을 이용한 유도전동기 결함진단 (Fault Diagnosis of Induction Motors using Decision Trees)

  • Tran Van Tung;Yang Bo-Suk;Oh Myung-Suck
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 추계학술대회논문집
    • /
    • pp.407-410
    • /
    • 2006
  • Decision tree is one of the most effective and widely used methods for building classification model. Researchers from various disciplines such as statistics, machine teaming, pattern recognition, and data mining have considered the decision tree method as an effective solution to their field problems. In this paper, an application of decision tree method to classify the faults of induction motors is proposed. The original data from experiment is dealt with feature calculation to get the useful information as attributes. These data are then assigned the classes which are based on our experience before becoming data inputs for decision tree. The total 9 classes are defined. An implementation of decision tree written in Matlab is used for four data sets with good performance results

  • PDF

데이터마이닝을 위한 동적 결정나무 (Dynamic Decision Tree for Data Mining)

  • 최병수;차운옥
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.959-969
    • /
    • 2009
  • 결정나무는 데이터마이닝에서 데이터를 분류하는 기법으로 가장 많이 사용되고 있으며, 데이터 탐색 소프트웨어 DAVIS에서는 동적 기능을 사용하여 데이터 시각화를 하는 것이 가능하다. 본 논문에서는 동적 데이터 분석의 기본 원리와 이를 결정나무에 적용하는 방법을 소개하고, 생성되는 동적 결정나무의 효율성과 유용성을 실제 데이터를 사용하여 분석한다.