• 제목/요약/키워드: Tree Compare

검색결과 404건 처리시간 0.029초

자기 조직화 맵 기반 유사 검색 시스템 (SOM-Based $R^{*}-Tree$ for Similarity Retrieval)

  • 오창윤;임동주;오군석;배상현
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.507-512
    • /
    • 2001
  • 특징 기반 유사성은 멀티미디어 데이터베이스 시스템에서 중요한 연구 쟁점이 되고 있다. 멀티미디어 데이터의 특징이 멀티미디어 객체들을 구별하는데 유용하다지만 특징 벡터의 차원의 수가 증가함에 따라 종래의 다차원 데이터 구조의 성능은 떨어지는 경향이 있다. $R^{*}-Tree$는 R-Tree의 가장 성공적인 병형으로 본 논문에서 고차원 특징 벡터를 위한 새로운 인덱싱 방법으로서 자기 조직화 맵 기반 $R^{*}-Tree$를 제안한다. 자기 조직화 맵 기잔 $R^{*}-Tree$는 고차원 데이터를 좀더 스칼라화해서 탐색할 수 있도록 SOM과 $R^{*}-Tree$를 결합하여 구축한 인덱싱 기법이다. 자기 조직 맵은 고차원 특징 벡터들로부터 2차원 공간으로의 맵핑을 제공한다. 그러나 맵을 위상 특징 맵이라 하고 인접 노느에서 서로 유사한 특징 벡터들을 모아서 입력데이터의 특징 공간들 속에 유사성을 보존하는데 위상 특징 맵의 각 노드는 코드북 벡터를 가지고 있다. 실험적으로 4만개의 이미지로부터 추출된 색깔 특징 벡터들을 이용하여 자기 조직화 맵 기반 $R^{*}-Tree$의 검색시간 비용과 자기 조직화 맵과 $R^{*}-Tree$의 검색 시간 비용을 비교한다. 그 결과 $R^{*}-Tree$를 구축하는데 필요한 노드 수와 검색 시간 비용이 감소됨으로써 자기 조직화 맵 기반 $R^{*}-Tree$는 자기 조직화 맵과 $R^{*}-Tree$보다 훨씬 우수한 성능을 나타냄이 입증되었다.

  • PDF

일반적인 GPU 트리 탐색과의 비교실험을 통한 GPU 기반 병렬 Shifted Sort 알고리즘 분석 (Analysis of GPU-based Parallel Shifted Sort Algorithm by comparing with General GPU-based Tree Traversal)

  • 김희수;박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1151-1156
    • /
    • 2017
  • 일반적으로 GPU 기반 트리 탐색을 수행할 경우 병렬 처리 속도가 생각보다 크게 향상되지 않는 경우가 대부분이다. 본 논문에서는 이러한 원인을 분석하고 그 분석 결과로 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위인 warp 내에서 분기문(if문)으로 인한 warp divergence가 일어나기 때문임을 제시한다. 또한 이러한 warp divergence를 최소화할 수 있는 병렬 shifted sort 알고리즘과의 비교를 통해 shifted sort 알고리즘이 일반적인 GPU 내 트리 탐색에 비해 우수한 성능을 보이는 구조임을 제시하였다. 분석 결과 GPU 기반 kd-tree 탐색에 비해 warp divergence가 발생하지 않은 shifted sort 탐색은 3차원 공간에서 데이터나 쿼리의 수가 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이 성능 차이는 데이터나 쿼리의 개수가 증가함에 따라 더 커지는 경향을 보였다.

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF

추출 연산을 활용한 이동 점 객체 색인 기법 (An Indexing Technique of Moving Point Objects using Projection)

  • 정영진;장승연;안윤애;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.52-63
    • /
    • 2003
  • 현실 세계에서 시간에 따라 연속적으로 위치나 모양이 변하며 이동하는 데이타를 시공간 이동 객체라 한다. 기존의 이동 객체 색인은 R-트리의 구조를 가지기 때문에, dead spare, overlap 등 R-트리의 문제점을 그대로 갖고 있을 뿐만 아니라 고려하는 초점에 따라 이 문제가 더 커진다. 따라서, 이 논문에서는 이 문제점을 해결하기 위하여 MPR-트리(Moving Point R-tree)를 제안한다. 제안된 MPR-트리는 추출 연산을 활용하여 특정 시점 질의 및 시공간 범위 질의를 효과적으로 처리하며, 동일한 이동 객체 위치를 시간에 따라 연결리스트로 연결하여 궤적 질의 처리를 용이하게 처리한다. 기존 이동 객체 색인과 비교한 실험으로부터 이동 객체 질의 처리 및 공간 활용에 대해 추출 연산이 유용하게 산임을 확인하였다. 제안된 MPR-트리는 LBS, GPS를 활용한 차량 관리 시스템, 항법 시스템 등 이동 객체 관리를 위한 시스템에서 활용될 수 있다.

A Comparison of Capabilities of Data Mining Tools

  • Choi, Youn-Seok;Kim, Jong-Geoun;Lee, Jong-Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제8권2호
    • /
    • pp.531-541
    • /
    • 2001
  • In this study, we compare the capabilities of the data mining tools of the most updated version objectively and provide the useful information in which enterprises and universities chose them. In particular, we compare the SAS/Enterprise Miner 3.0, SPSS/Clementine 5.2 and IBM/Intelligent Miner 6.1 which are well known and easily gotten.

  • PDF

트리 기반 센서네트워크에서 전력 소모 균형을 위한 슬랏 스케쥴링 알고리즘 (A Slot Scheduling Algorithm for Balancing Power Consumption in Tree-based Sensor Networks)

  • 김제욱;오훈
    • 한국통신학회논문지
    • /
    • 제36권5A호
    • /
    • pp.502-510
    • /
    • 2011
  • 본 논문에서는 트리 기반의 센서네트워크에서 전력소모의 균형을 이루기 위한 시간 슬랏을 할당하는 알고리즘을 제안한다. 트리 토폴로지를 갖는 센서네트워크에서는 낮은 트리 깊이를 갖는 노드들이 더 많은 패킷을 처리하기 때문에 더 많은 전력을 소모한다. 따라서, 네트워크 생명이 단축되는 문제가 있다. 본 논문에서 제안하는 슬랏 스케줄링 알고리즘은 각 노드에게 수신 슬랏들을 먼저 할당하고 송신 슬랏들을 할당한다. 이러한 할당 방식은 패킷 결합과 필터링을 용이하게 하기 때문에 낮은 트리 깊이에 위치한 노드들의 부하를 감소시키는 효과가 있다. 시뮬레이션을 사용하여 제안한 알고리즘을 TreeMAC 에서 제안한 프레임-슬랏 할당 알고리즘과 비교함으로써 전력소모의 균형을 이룬다는 것을 확인하였다.

POTENTIAL OF MULTI-BAND SAR DATA FOR CLASSIFYING FOREST COVER TYPE

  • Shin, Jung-Il;Yoon, Jong-Suk;Kang, Sung-Jin;Lee, Kyu-Sung
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.258-261
    • /
    • 2007
  • Although there have been lack of studies using X-band SAR data particularly for forestry application as compared to C-, and L-band SAR data, it has a potential to distinguish tree species because most signals are backscattered on the top of canopy. This study aimed to compare signal characteristics of multi-band SAR data including X-band for classifying tree species. The data used for the study are SIR-C/X-SAR data (X-, C-, L-band) obtained on Oct. 3, 1994 over the forest area near Seoul, S. Korea. Thirty ground sample plots were collected per each tree species. Initial comparison of backscattering coefficients among three SAR bands shows that X-band data showed better separation of tree species than C- and L-band SAR data irrespective of polarization. The weak penetrating in canopy layer might be possible source of information for X-band data to be useful for the classification of forest species and cover type mapping.

  • PDF

Prediction of the number of public bicycle rental in Seoul using Boosted Decision Tree Regression Algorithm

  • KIM, Hyun-Jun;KIM, Hyun-Ki
    • 한국인공지능학회지
    • /
    • 제10권1호
    • /
    • pp.9-14
    • /
    • 2022
  • The demand for public bicycles operated by the Seoul Metropolitan Government is increasing every year. The size of the Seoul public bicycle project, which first started with about 5,600 units, increased to 3,7500 units as of September 2021, and the number of members is also increasing every year. However, as the size of the project grows, excessive budget spending and deficit problems are emerging for public bicycle projects, and new bicycles, rental office costs, and bicycle maintenance costs are blamed for the deficit. In this paper, the Azure Machine Learning Studio program and the Boosted Decision Tree Regression technique are used to predict the number of public bicycle rental over environmental factors and time. Predicted results it was confirmed that the demand for public bicycles was high in the season except for winter, and the demand for public bicycles was the highest at 6 p.m. In addition, in this paper compare four additional regression algorithms in addition to the Boosted Decision Tree Regression algorithm to measure algorithm performance. The results showed high accuracy in the order of the First Boosted Decision Tree Regression Algorithm (0.878802), second Decision Forest Regression (0.838232), third Poison Regression (0.62699), and fourth Linear Regression (0.618773). Based on these predictions, it is expected that more public bicycles will be placed at rental stations near public transportation to meet the growing demand for commuting hours and that more bicycles will be placed in rental stations in summer than winter and the life of bicycles can be extended in winter.

신경망과 의사결정 나무를 이용한 충수돌기염 환자의 재원일수 예측모형 개발 (Length-of-Stay Prediction Model of Appendicitis using Artificial Neural Networks and Decision Tree)

  • 정석훈;한우석;서용무;이현실
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1424-1432
    • /
    • 2009
  • 충수돌기염 환자의 LoS(Length of Stay)를 예측하는 것은 병상의 운영에 적지 않은 영향을 준다. 본 논문에서는 Neural Networks와 Decision Tree를 이용하여 LoS와 연관이 높은 입력변수들을 찾아 그 의미를 분석하며, 찾아낸 입력변수들을 이용하여 다양한 LoS 예측 모형을 개발하고 그 성능을 비교하였다. 모형의 예측 정확성을 높이기 위하여 Bagging과 Boosting 등의 Ensemble 기법도 적용하였다. 실험 결과, Decision Tree 모형이 Neural Networks 모형보다 좀 더 적은 수의 속성을 가지고도 거의 통일한 예측력을 보였으며, Ensemble 기법 중에서는 Bagging 기법이 Boosting 기법보다 좋은 결과를 보여주었다. 의사결정나무 기법은 Neural Networks 기법에 비해 설명력이 있으며, 충수돌기염의 LoS 예측에 매우 효과적이었고, 중요 입력 변수의 선정에도 좋은 결과를 보여줌에 따라 향후 적극적인 기법의 도입이 필요하다고 할 수 있다.

독립적인 벡터 근사에 의한 분산 벡터 근사 트리의 성능 강화 (Performance Enhancement of a DVA-tree by the Independent Vector Approximation)

  • 최현화;이규철
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.151-160
    • /
    • 2012
  • 지금까지 제안된 분산 고차원 색인의 대부분은 균일한 분포를 가지는 데이터 집합에서 좋은 검색 성능을 나타내나, 편향되거나 클러스터를 이루는 데이터의 집합에서는 그 성능이 크게 감소된다. 본 논문은 강하게 클러스터를 이루거나 편향된 분포를 가지는 데이터 집합에 대한 분산 벡터 근사 트리의 k-최근접 검색 성능을 향상시키는 방법을 제안한다. 기본 아이디어는 전체 데이터를 클러스터링하는 상위 트리의 말단 노드가 담당하는 데이터 공간의 크기를 계산하고, 그 공간 상의 특징 벡터를 근사하는 데 사용되는 비트의 수를 달리하여 벡터 근사의 식별 능력을 보장하는 것이다. 즉, 고밀도 클러스터에는 더 많은 수의 비트를 할당하는 것이다. 우리는 합성 데이터와 실세계 데이터를 가지고 분산 hybrid spill-tree와 기존 분산 벡터 근사 트리와의 성능 비교 실험을 수행하였다. 실험 결과는 확장된 분산 벡터 근사 트리의 검색 성능이 균일하지 않은 분포의 데이터 집합에서 크게 향상되었음을 보인다.