• 제목/요약/키워드: Tree data

검색결과 3,320건 처리시간 0.03초

Multivariate Decision Tree for High -dimensional Response Vector with Its Application

  • Lee, Seong-Keon
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.539-551
    • /
    • 2004
  • Multiple responses are often observed in many application fields, such as customer's time-of-day pattern for using internet. Some decision trees for multiple responses have been constructed by many researchers. However, if the response is a high-dimensional vector that can be thought of as a discretized function, then fitting a multivariate decision tree may be unsuccessful. Yu and Lambert (1999) suggested spline tree and principal component tree to analyze high dimensional response vector by using dimension reduction techniques. In this paper, we shall propose factor tree which would be more interpretable and competitive. Furthermore, using Korean internet company data, we will analyze time-of-day patterns for internet user.

상호 노드 정보를 이용한 클러스터 기반 퍼지 모델트리 (Cluster Based Fuzzy Model Tree Using Node Information)

  • 박진일;이대종;김용삼;조영임;전명근
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.41-47
    • /
    • 2008
  • 클러스터 기반 퍼지 모델트리에서 훈련 데이터의 과잉 적응은 검중 데이터의 성능을 저하시키는 문제점을 가지고 있다. 이러한 문제점을 해결하기 위한 방법으로 본 논문에서는 상호 노드간의 정보를 고려하는 방법을 제안하고자 한다. 제안된 방법은 우선 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력 속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 예측 단계에서는 입력된 데이터가 잎노드에 도달하기까지 경유하게 되는 노드들의 중심벡터들과 입력 데이터간의 거리값에 따른 소속도를 계산한 후 최종적으로 각 노드의 선형모델들과 계산된 소속도를 이용하여 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 벤치마크 데이터를 대상을 실험한 결과, 기존의 클러스터 기반 퍼지 모델트리보다 향상된 성능을 보임을 알 수 있었다.

IEEE 802.11 무선 메쉬 네트워크에서의 성능 이상 현상 고려를 위한 트리 기반 채널 할당 프로토콜 (A Tree based Channel Assignment Protocol for Considering the Performance Anomaly in IEEE 802.11 Wireless Mesh Networks)

  • 김석형;김동욱;서영주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.341-345
    • /
    • 2010
  • 무선 메쉬 네트워크(Wireless Mesh Network, WMN)는 무선 링크를 이용한 무선 백본 네트워크를 형성하여 사용자에게 인터넷 서비스를 효율적으로 제공할 수 있는 해결책 중의 하나이다. WMN에서 널리 사용되고 있는 기술은 IEEE 802.11 이며, 이는 멀티 채널 (multichannel)과 멀티 레이트(multirate)를 제공한다. WMN에서 중요한 이슈 중의 하나는 네트워크 용량(capacity) 이며, 이를 높이기 위한 멀티 채널 프로토콜이 절실하다 하지만, 다른 레이트로 동작하는 무선 링크가 같은 채널에서 동작하면, 높은 레이트(high-rate) 링크의 성능이 낮은 레이트(low-rate) 링크로 인해 저하되는 성능 이상(performance anomaly) 현상이 발생한다. 이러한 문제를 완화하기 위해 본 논문에서는 데이터 레이트를 멀티채널로 분산시키기 위한 트리기반 채널 할당(Tree-based Channel Assignment, TreeCA) 프로토콜을 제안한다. TreeCA는 인터넷 트래픽을 효율적으로 전달하기 위해 트리 WMN 구조를 기반으로 채널 할당을 수행한다. 부모 노드는 다른 레이트로 연결된 자식 노드를 다른 채널로 분산시켜서, 성능 이상 현상을 완화한다. 시뮬레이션을 통해 TreeCA가 기존 멀티 채널 WMN 프로토콜 보다 향상된 성능을 보임을 관찰하였다.

Zigbee 네트워크에서 Depth를 이용한 효율적인 중간 경로 감소 알고리즘 (An Efficient Shortcut Path Algorithm using Depth in Zigbee Network)

  • 김덕영;정우섭;조성호
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1475-1482
    • /
    • 2009
  • ZigBee 네트워크에서 ZigBee 노드는 배터리로 동작하기 때문에 에너지의 효율적인 사용은 필수적이다. 에너지를 효율적으로 사용하기 위해서는 불필요한 네트워크 트래픽을 줄이는 것은 하나의 방법이다. 본 논문에서는 ZigBee 네트워크에서 목적지 노드의 depth를 이용한 효율적인 중간 경유지 감소 알고리즘을 제시한다. 기존 tree 라우팅에서는 각 노드가 오직 자신의 부모 노드 또는 자식 노드에게만 데이터를 전송하는 비효율적인 방식을 채택하고 있다. 마찬가지로 본 논문에서 제안하는 효율적인 중간 경로 감소 알고리즘도 tree 라우팅을 기반으로 하고 있다. 하지만 네이버 테이블과 목적지의 depth를 이용하여 부모나 자식노드만이 아닌 다른 이웃노드에게 전송 가능케 함으로서 그 동안 Tree 라우팅에서 발생했던 coordinator 데이터 병목 현상과 불필요 중간 경로를 최소화시킬 수 있는 알고리즘을 제안한다.

GPU를 활용한 R*-tree에서의 부분 노드 병렬 처리 방법 (A Parallel Processing Method for Partial Nodes in R*-tree Using GPU)

  • 김성;오병우
    • Spatial Information Research
    • /
    • 제20권6호
    • /
    • pp.139-144
    • /
    • 2012
  • 공간 데이터 처리는 GIS, 텔레매틱스 등 광범위한 분야에서 널리 사용되고 있다. 그러나 현재 사용되고 있는 공간 데이터 질의 처리 기법은 CPU를 사용하여 순차적으로 질의 처리를 수행하므로 질의 처리 시간이 상대적으로 오래 걸린다는 단점이 존재한다. 그러나 공간 데이터 질의 처리를 병렬로 수행했을 때 처리 시간을 줄이는 것이 가능하다. 따라서 본 연구에서는 GPU를 활용하여 공간 데이터 질의 처리를 병렬로 수행하는 연구를 진행한다. 또한, CPU를 이용하여 질의 처리를 수행한 결과와 비교하여 속도 향상 정도에 대한 결과를 제시한다.

Risk analysis of offshore terminals in the Caspian Sea

  • Mokhtari, Kambiz;Amanee, Jamshid
    • Ocean Systems Engineering
    • /
    • 제9권3호
    • /
    • pp.261-285
    • /
    • 2019
  • Nowadays in offshore industry there are emerging hazards with vague property such as act of terrorism, act of war, unforeseen natural disasters such as tsunami, etc. Therefore industry professionals such as offshore energy insurers, safety engineers and risk managers in order to determine the failure rates and frequencies for the potential hazards where there is no data available, they need to use an appropriate method to overcome this difficulty. Furthermore in conventional risk based analysis models such as when using a fault tree analysis, hazards with vague properties are normally waived and ignored. In other word in previous situations only a traditional probability based fault tree analysis could be implemented. To overcome this shortcoming fuzzy set theory is applied to fault tree analysis to combine the known and unknown data in which the pre-combined result will be determined under a fuzzy environment. This has been fulfilled by integration of a generic bow-tie based risk analysis model into the risk assessment phase of the Risk Management (RM) cycles as a backbone of the phase. For this reason Fault Tree Analysis (FTA) and Event Tree Analysis (ETA) are used to analyse one of the significant risk factors associated in offshore terminals. This process will eventually help the insurers and risk managers in marine and offshore industries to investigate the potential hazards more in detail if there is vagueness. For this purpose a case study of offshore terminal while coinciding with the nature of the Caspian Sea was decided to be examined.

컬러항공사진과 LiDAR 데이터를 이용한 수목 개체 및 수고 추정 (Estimation of Individual Tree and Tree Height using Color Aerial Photograph and LiDAR Data)

  • 장안진;김용일;이병길;유기윤
    • 대한원격탐사학회지
    • /
    • 제22권6호
    • /
    • pp.543-551
    • /
    • 2006
  • 산림의 효율적인 관리를 위해 최근 원격탐사 기법을 이용하여 산림에 관련된 정보를 추출하려는 노력들이 활발히 이루어지고 있다. 하지만 단일 원격탐사 데이터를 이용하는 경우 수목 인식의 정확도 및 추출되는 정보의 양적인 면에서 많은 한계를 가진다. 본 연구는 최근의 수목모델링을 위한 핵심기술들을 컬러 항공사진과 LiDAR 데이터에 적용하여 국내 환경에서의 수목 모델링을 수행하고, 그 결과를 평가하는데 그 목적을 두고 있다. 대전광역시 내에 존재하는 소규모 산림 지역 중 침엽수만으로 이루어진 단순림을 대상 지역으로 하였다. 컬러항공사진과 LiDAR 데이터를 이용하여 추정된 개체수의 정확도 평가 결과 $R^2$값이 0.77로 나타났다. 수고의 경우 집단 정확도 평가 결과 최근 변화가 일어나지 않은 지역은 측정값과 추정값의 차이가 없는 것으로 나타났고, 개별 정확도 평가의 경우 $R^2$값이 0.83으로 높은 상관도를 보였다.

실시간 모바일 GIS 응용 구축을 위한 주기억장치 데이터베이스 시스템 설계 및 구현 (Design and Implementation of a Main-Memory Database System for Real-time Mobile GIS Application)

  • 강은호;윤석우;김경창
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.11-22
    • /
    • 2004
  • 최근 들어 계속되는 램 가격 하락으로 인해 대용량의 램을 사용하는 주기억장치 데이터베이스 시스템의 구축이 실현 가능하게 되었다. 주기억장치 데이터베이스는 여러 다양한 실시간 응용 분야를 위해 사용되며, 매년 CPU 속도가 60% 정도 증가되고, 메모리 속도가 10% 증가되는 현실에서, 케쉬 미스(Cache miss)를 얼마나 줄이느냐 하는 문제가 주기억장치 데이터베이스의 검색 성능 측면에서 가장 중요한 문제로 대두되고 있다. 본 논문에서는 이러한 환경을 고려한 실시간 모바일 GIS응용을 위한 주기억장치 데이터베이스 시스템을 설계 및 구현한다. 본 시스템은 크게 PDA를 사용하는 모바일 사용자를 위한 인터페이스 관리기와 가상 메모리 기법을 사용해 전체 데이터를 주기억장치에 상주시키며 관리하는 주기억 데이터 관리기, 공간 및 비 공간 질의를 처리하는 질의처리기, 새롭게 제시하는 공간 데이터를 위한 MR-트리 인덱스와 비 공간 데이터를 위한 T-트리 인덱스 구조를 관리하는 인덱스 관리기, 데이터를 디스크에 저장하기 위한 GIS 서버 인터페이스로 구성된다. 새롭게 제시하는 공간 인덱싱을 위한 MR-트리는 노트 분할이 발생될 경우, 입력 경로 상에 하나 이상의 빈 엔트리를 지니는 노드가 존재할 경우에만, 노드 분할을 상위로 전송한다. 그러므로 중간 노드들은 항상 100%에 가깝게 채워져 있게 된다. 본 논문의 실험 결과, 2차원의 MR-트리는 기존의 R-트리에 비해 2.4배 이상의 빠른 검색 속도를 나타냈다. 한편, 주 기억 데이터 관리기는 가상 메모리 제공을 위해 전체 벡터 데이터 및 MR-트리, T-트리, 데이터 객체 텍스트 정보를 페이지 단위로 분할하여 관리하고, 간접 주소 기법을 사용하여 디스크로부터의 재 로딩시 발생할 수 있는 문제점을 제거하였다.

Enabling Efficient Verification of Dynamic Data Possession and Batch Updating in Cloud Storage

  • Qi, Yining;Tang, Xin;Huang, Yongfeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권6호
    • /
    • pp.2429-2449
    • /
    • 2018
  • Dynamic data possession verification is a common requirement in cloud storage systems. After the client outsources its data to the cloud, it needs to not only check the integrity of its data but also verify whether the update is executed correctly. Previous researches have proposed various schemes based on Merkle Hash Tree (MHT) and implemented some initial improvements to prevent the tree imbalance. This paper tries to take one step further: Is there still any problems remained for optimization? In this paper, we study how to raise the efficiency of data dynamics by improving the parts of query and rebalancing, using a new data structure called Rank-Based Merkle AVL Tree (RB-MAT). Furthermore, we fill the gap of verifying multiple update operations at the same time, which is the novel batch updating scheme. The experimental results show that our efficient scheme has better efficiency than those of existing methods.

유전자발현데이터의 군집분석을 위한 나무 의존 성분 분석 (Tree-Dependent Components of Gene Expression Data for Clustering)

  • 김종경;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.4-6
    • /
    • 2006
  • Tree-dependent component analysis (TCA) is a generalization of independent component analysis (ICA), the goal of which is to model the multivariate data by a linear transformation of latent variables, while latent variables fit by a tree-structured graphical model. In contrast to ICA, TCA allows dependent structure of latent variables and also consider non-spanning trees (forests). In this paper, we present a TCA-based method of clustering gene expression data. Empirical study with yeast cell cycle-related data, yeast metaboiic shift data, and yeast sporulation data, shows that TCA is more suitable for gene clustering, compared to principal component analysis (PCA) as well as ICA.

  • PDF