• 제목/요약/키워드: Data Tree

검색결과 3,320건 처리시간 0.031초

부스팅 트리에서 적정 트리사이즈의 선택에 관한 연구 (The guideline for choosing the right-size of tree for boosting algorithm)

  • 김아현;김지현;김현중
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.949-959
    • /
    • 2012
  • 범주형 목표변수를 잘 예측하기 위한 데이터마이닝 방법 중에서 최근에는 여러 단일 분류자를 결합한 앙상블 기법이 많이 활용되고 있다. 앙상블 기법 가운데 부스팅은 재표본 시 분류하기 어려운 관찰치의 가중치를 높여 분류자가 해당 관찰치에 보다 집중할 수 있도록 함으로써 다른 앙상블 기법에 비해 오차를 효과적으로 감소시키는 방법으로 알려져 있다. 부스팅을 구성하는 분류자를 의사결정나무로 둔 부스팅 트리 모형의 경우 각 트리의 사이즈를 결정해야 하는데, 본 연구에서는 자료 별로 부스팅 트리에 가장 적합한 트리사이즈가 서로 다를수 있다고 가정하고, 주어진 자료에 맞는 트리사이즈를 추정하는 문제에 대해 논의하였다. 우선 트리사이즈가 부스팅 트리의 정확도에 중요한 영향을 미치는가를 파악하기 위하여 28개의 자료를 대상으로 실험을 수행하였으며, 그 결과 트리사이즈를 결정하는 문제가 모형 전체의 성능을 결정하는데 상당한 역할을 한다는 것을 확인할 수 있었다. 또한 그 결과를 바탕으로 최적의 트리사이즈에 영향을 미칠 것으로 판단되는 몇 가지 특성 변수를 정의하고, 해당 변수를 이용하여 부스팅 트리에서의 최적 트리사이즈를 설명하는 모형을 구성해 보았다. 자료 별로 고유한 최적의 트리사이즈는 자료의 특성에 의존적일 가능성도 있으므로 본 연구에서 제안하는 추정방법은 최적 트리사이즈를 결정하기 위한 출발점 또는 가이드라인으로 활용하는 것이 적절할 것이다. 기존에는 부스팅 트리의 사이즈에 대한 값으로 목표변수의 범주의 개수를 활용하였는데, 본 모형에서 제안하는 트리사이즈의 추정치로 부스팅 트리를 구축한 경우 기존방법에 비해 분류정확도를 유의미하게 개선하는 것을 확인할 수 있었다.

항공 라이다데이터를 이용한 개별수목탐지 및 평균수고추정 (Detection of Individual Trees and Estimation of Mean Tree Height using Airborne LIDAR Data)

  • 황세란;이미진;이임평
    • Spatial Information Research
    • /
    • 제20권3호
    • /
    • pp.27-38
    • /
    • 2012
  • 산림의 보존과 관리에 대한 필요성이 점차 증가하면서 항공 라이다데이터를 이용한 산림연구가 활발히 수행되고 있다. 이러한 산림연구에서 수목고도는 정량적인 산림측정을 위한 중요한 변수로 이용된다. 이에 본 연구는 항공 라이다데이터로부터 수목고도 추정을 위한 대표적인 두 종류의 방법을 적용하고 그 결과를 비교분석한다. Local maximum 필터링에 기반한 개별수목탐지 방법으로 개별수목의 수, 위치, 높이 및 평균수고를, 수목고도모델 또는 히스토그램을 이용한 평균수고 추정방법으로 개별격자 또는 전체영역에 대한 최대, 평균수고, 평균 수관고를 추정한다. 현장에서 실측한 검증데이터와 비교한 결과 개별 수목은 76.6%의 정확도로 탐지되었으며 개별수고는 전체 수종의 경우 1.91m, 침엽수종에 대해서는 0.75m의 RMSE로 추정되었다. 반면 수목고도모델을 이용하여 추정된 평균수고는 약 1~2m의 RMSE를 보였으며, 히스토그램을 이용하여 추정된 평균수고는 약 0.6m 과소 추정되었다. 정확하고 다양한 산림정보 추출을 위해 수종 및 추정인자에 따라 적합한 상호보완적인 방법을 선택하고 융합하는 것이 필요하다.

유전 목 지도의 동적 확장 (Dynamic Extension of Genetic Tree Maps)

  • 하성욱;권기향;강대성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.386-395
    • /
    • 2002
  • 본 논문에서는, 인식될 데이타에서 최적 특징을 구성할 수 있는 새로운 신경망 구조인 동적 유전 트리맵(DGTM)을 제안한다. DGTM은 기존의 신경망(neural networks)에서 고려되지 못한 데이터의 특징(feature)에 대한 중요도를 유전 알고리즘(genetic algorithm)으로 구성하고, 특징의 우선순위에 따라 트리 구조를 도입한 GTM(genetic tree-map)을 적용한다. 데이타의 유사성에 따라서 신경망의 뉴런이 동적으로 분리되고 병합될 수 있도록 동적인 기능을 갖는 DGTM(dynamic GTM)으로 확장한 방식을 제안한다.

CST-트리를 채택한 Mint 시스템을 이용한 멀티미디어 콘텐츠 검색 개선 (CST-Tree with improved Mint system multimedia content using the refine)

  • 정명진;조성제
    • 디지털산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.145-153
    • /
    • 2013
  • Multimedia contents' searching methods in existing mobile computer environment tend to be brought with many over heads when attempting to search data in large bulks. The MINT system has been studied to resolve such problem. However, MINT system delivers many over heads by searching multimedia contents through applying B-Tree. The suggested method is said to be CST-MCR searching system based on CST-Tree. The specific characteristic of this method is improved MINT system by applying CST-Tree's index. The result of capacity evaluation came out with improved capacity of 4.27% from MINT system and CST-MCR methods in average. Conclusively, it has been proven that the suggested method is superior.

I-Tree: A Frequent Patterns Mining Approach without Candidate Generation or Support Constraint

  • Tanbeer, Syed Khairuzzaman;Sarkar, Jehad;Jeong, Byeong-Soo;Lee, Young-Koo;Lee, Sung-Young
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.31-33
    • /
    • 2007
  • Devising an efficient one-pass frequent pattern mining algorithm has been an issue in data mining research in recent past. Pattern growth algorithms like FP-Growth which are found more efficient than candidate generation and test algorithms still require two database scans. Moreover, FP-growth approach requires rebuilding the base-tree while mining with different support counts. In this paper we propose an item-based tree, called I-Tree that not only efficiently mines frequent patterns with single database scan but also provides multiple mining scopes with multiple support thresholds. The 'build-once-mine-many' property of I-Tree allows it to construct the tree only once and perform mining operation several times with the variation of support count values.

  • PDF

A Study on Decision Tree for Multiple Binary Responses

  • Lee, Seong-Keon
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.971-980
    • /
    • 2003
  • The tree method can be extended to multivariate responses, such as repeated measure and longitudinal data, by modifying the split function so as to accommodate multiple responses. Recently, some decision trees for multiple responses have been constructed by Segal (1992) and Zhang (1998). Segal suggested a tree can analyze continuous longitudinal response using Mahalanobis distance for within node homogeneity measures and Zhang suggested a tree can analyze multiple binary responses using generalized entropy criterion which is proportional to maximum likelihood of joint distribution of multiple binary responses. In this paper, we will modify CART procedure and suggest a new tree-based method that can analyze multiple binary responses using similarity measures.

설악산 지역의 Tree-ring 자료를 이용한 연 강수량 재생성 (Annual Precipitation Reconstruction Based on Tree-ring Data at Seorak)

  • 곽재원;한희찬;이민정;김형수;문장원
    • 한국물환경학회지
    • /
    • 제31권1호
    • /
    • pp.19-28
    • /
    • 2015
  • The purpose of this research is reconstruction of annual precipitation based on Tree-ring series at Seorak mountain and examine its effectiveness. To do so we performed nonlinear time series characteristics test of Tree-ring series and reconstructed annual precipitation of Gangneung from 1687 to 1911 using Artificial neural network and Nonlinear autoregressive exogeneous input (NARX) model which reflects stochastic properties. As a result, Tree-ring series at Seorak Mountain shows nonlinear time series property and reconstructed annual precipitation series drawn from NARX is similar in statistical characteristics of observed annual time series.

변화된 스레드 트리를 이용한 점진적 LR 파싱 알고리즘 구현 및 설계 (On Design and Implementation of Incremental LR Parsing Algorithm Using Changed Threed Tree)

  • 이대식
    • 융합보안논문지
    • /
    • 제5권4호
    • /
    • pp.19-25
    • /
    • 2005
  • 스레드 트리란 LR 파싱표를 사용하여 파스 트리인 동시에 파스 스택을 표현 할 수 있는 자료구조이다. $Larchev\^{e}que$는 스택을 사용하여 스레드 트리들 구성하고 점진적 파싱을 한다. 본 논문에서는 재 파싱 노드와 파싱속도를 줄이기 위해 스택을 사용하지 않는 변화된 스레드 트리를 구성하는 알고리즘을 제안한다. 또한 노드의 재 파싱 과정을 없애기 위해 변화된 스레드 트리와 LR 파싱표를 사용하는 점진적 파싱 알고리즘을 제안한다.

  • PDF

PSN: A Dynamic Numbering Scheme for W3C XQuery Update Facility

  • Hong, Dong-Kweon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권2호
    • /
    • pp.121-125
    • /
    • 2008
  • It is essential to maintain hierarchical information properly for efficient XML query processing. Well known approach to represent hierarchical information of XML tree is assigning a specific node number to each node of XML tree. Insertion and deletion of XML node can occur at any position in a dynamic XML tree. A dynamic numbering scheme allows us to add nodes to or delete nodes from an XML tree without relabeling or with relabeling only a few existing nodes of XML tree while executing XML query efficiently. According to W3C XQuery update facility specifications a node can be added as first or last child of the existing node in XML tree. Generating new number for last child requires referencing the number of previous last child. Getting the number of last child is very costly with previous approaches. We have developed a new dynamic numbering scheme PSN which is very effective for insertion of a node as last child. Our approach reduces the time to find last child dramatically by removing sorting of children.

Evaluation Method of College English Education Effect Based on Improved Decision Tree Algorithm

  • Dou, Fang
    • Journal of Information Processing Systems
    • /
    • 제18권4호
    • /
    • pp.500-509
    • /
    • 2022
  • With the rapid development of educational informatization, teaching methods become diversified characteristics, but a large number of information data restrict the evaluation on teaching subject and object in terms of the effect of English education. Therefore, this study adopts the concept of incremental learning and eigenvalue interval algorithm to improve the weighted decision tree, and builds an English education effect evaluation model based on association rules. According to the results, the average accuracy of information classification of the improved decision tree algorithm is 96.18%, the classification error rate can be as low as 0.02%, and the anti-fitting performance is good. The classification error rate between the improved decision tree algorithm and the original decision tree does not exceed 1%. The proposed educational evaluation method can effectively provide early warning of academic situation analysis, and improve the teachers' professional skills in an accelerated manner and perfect the education system.