• Title/Summary/Keyword: 트리비교

Search Result 987, Processing Time 0.048 seconds

A Tree-Compare Algorithm for Similarity Evaluation (유사도 평가를 위한 트리 비교 알고리즘)

  • Kim, Young-Chul;Yoo, Chae-Woo
    • The KIPS Transactions:PartA
    • /
    • v.11A no.2
    • /
    • pp.159-164
    • /
    • 2004
  • In the previous researches, tree comparison methods are almost studied in comparing weighted or labeled tree(decorated tree). But in this paper, we propose a tree comparison and similarity evaluation algorithm can be applied to comparison of two normal trees. The algorithm converts two trees into node string using unparser, evaluates similarity and finally return similarity value from 0.0 to 1.0. In the experiment part of this paper, we visually presented matched nodes and unmatched nodes between two trees. By using this tree similarity algorithm, we can not only evaluate similarity between two specific programs or documents but also detect duplicated code.

Detecting Changes in Structured Documents using Message Digest (메시지 다이제스트를 이용한 구조화된 문서의 변화 탐지)

  • 김동아;이석균
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.151-153
    • /
    • 2002
  • XML/HTML 문서와 같이 트리 구조로 표현되는 데이터의 변화 탐지는 NP-hard의 문제로 이에 대한 효율적인 구현은 매우 중요하다. 본 논문에서는 효율적인 변화 탐지를 위해 트리 구조의 데이터를 X-tree로 표현하고 이에 기초한 휴리스틱 알고리즘을 제안한다. X-tree에서는 모든 서브트리의 루트 노드에 서브트리의 구조와 소속 노드들의 데이터들을 128비트의 해시값으로 표현하여 저장함으로 신ㆍ구 버전의 X-tree들에 속한 서브트리들의 비교가 매우 효율적이다. 제시한 변화 탐지 알고리즘에서는 구 버전의 X-tree의 모든 서브트리들에 대해 신 버전의 X-tree에서 동등한 서브트리들을 찾고, 이들에 기초하여 이동 연산이 발생한 서브트리들과 갱신 연산이 발생한 서브트리들을 순차적으로 찾는다. 이때 이동 연산과 갱신 연산으로 대응되는 서브트리는 동등 서브트리로부터 루트 노드로 대응 관계를 확장하는 가운데 발견된다. 이후 깊이 우선으로 검색하면서 나머지 노드들을 대응시킨다. X-tree의 구조적 특징에 기인하여 노드들 간의 비교를 통해 대응 여부를 검사하는 대부분의 기존 연구와는 달리 서브트리의 비교를 통해 대부분의 대응 관계를 결정하므로 효율적인 변화 탐지가 가능하다. 본 알고리즘은 최악의 경우에서도 N을 신ㆍ구 버전 문서의 전체 노드 수라 할 때 O(N)의 시간 복잡도를 갖는다.

  • PDF

XML Change Detection with Inavariant Conditions (불변조건을 이용한 XML 비교 방법)

  • Lee, Eun-Jung;Ku, Yong-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.43-46
    • /
    • 2005
  • 최근 데이터 표현 형식으로 XML 데이터가 많이 도입되면서 두 개의 XML 트리를 비교하여 차이를 구하는 것이 데이터 웨어하우징이나 XML 네이티브 데이터베이스 등에서 중요한 요소가 되었다. 기존의 XML 트리 비교 방법은 일반적으로 가격 모델 기반 노드 매핑을 도입하고 있다. 이러한 최소 가격 기반 노드 매핑을 통해 트리의 차이를 구하는 방식은 원래 데이터의 의미와 조건을 유지하지 못하는 경우가 생기는데, 본 논문에서는 이러한 문제를 해결하기 위하여 트리의 변경 과정에서 유지되는 불변 조건의 개념을 소개하고 이를 이용하여 트리 비교를 수행하기 위한 모델을 제시한다.

  • PDF

Comparison of Multicast Routing Trees (멀티캐스트 라우팅 트리의 비교)

  • Park, Jung-Soo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1999.11a
    • /
    • pp.300-302
    • /
    • 1999
  • The multicast routing trees that have recently been proposed can be classified into three types: source-based trees, renter-based shared trees and non-renter based shared trees. In this paper, those multicast trees are compared and evaluated in term of the link costs and the maximum delay on the tree by experiments.

  • PDF

Research on Comparing System with Syntactic-Semantic Tree in Subjective-type Grading (주관식 문제 채점에서의 구문의미트리 비교 시스템에 대한 연구)

  • Kang, WonSeog
    • The Journal of Korean Association of Computer Education
    • /
    • v.20 no.5
    • /
    • pp.79-88
    • /
    • 2017
  • To upgrade the subjective question grading, we need the syntactic-semantic analysis to analyze syntatic-semantic relation between words in answering. However, since the syntactic-semantic tree has structural and semantic relation between words, we can not apply the method calculating the similarity between vectors. This paper suggests the comparing system with syntactic-semantic tree which has structural and semantic relation between words. In this thesis, we suggest similarity calculation principles for comparing the trees and verify the principles through experiments. This system will help the subjective question grading by comparing the trees and be utilized in distinguishing similar documents.

Research on Subjective-type Grading System Using Syntactic-Semantic Tree Comparator (구문의미트리 비교기를 이용한 주관식 문항 채점 시스템에 대한 연구)

  • Kang, WonSeog
    • The Journal of Korean Association of Computer Education
    • /
    • v.21 no.6
    • /
    • pp.83-92
    • /
    • 2018
  • The subjective question is appropriate for evaluation of deep thinking, but it is not easy to score. Since, regardless of same scoring criterion, the graders are able to produce different scores, we need the objective automatic evaluation system. However, the system has the problem of Korean analysis and comparison. This paper suggests the Korean syntactic analysis and subjective grading system using the syntactic-semantic tree comparator. This system is the hybrid grading system of word based and syntactic-semantic tree based grading. This system grades the answers on the subjective question using the syntactic-semantic comparator. This proposed system has the good result. This system will be utilized in Korean syntactic-semantic analysis, subjective question grading, and document classification.

Cell-based Signature Tree: Efficient Indexing Structures for Similarity Search in High-Dimensional Feature Space (셀기반 시그니쳐 트리: 고차원 데이터의 유사어 검색을 위한 효율적인 색인 구조)

  • 송광택;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.134-136
    • /
    • 2000
  • 본 논문에서는 고차원의 특징 벡터 공간에서의 객체에 대한 효율적인 검색을 지원하는 셀기반 시그니쳐 트리 색인 구조(CS-트리, CI-트리)를 제안한다. 특징 벡터 공간을 셀로써 분할하고 특징 벡터는 셀의 시그니쳐로 표현되며 트리에 저장된다. 특징 벡터 대신 시그니쳐를 사용하여 트리의 깊이가 낮아짐으로서 검색을 효율적으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 이용한 유사성 검색 알고리즘으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 성능 비교를 수행하여, 성능비교 결과 본 논문에서 제안하는 CS-트리와 CI-트리가 검색 시간 측면에서 최대 30%의 검색 성능이 개선됨을 보인다.

  • PDF

Discriminator of Similar Documents Using the Syntactic-Semantic Tree Comparator (구문의미트리 비교기를 이용한 유사문서 판별기)

  • Kang, Won-Seog
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.10
    • /
    • pp.636-646
    • /
    • 2015
  • In information society, the need to detect document duplication and plagiarism is increasing. Many studies have progressed to meet such need, but there are limitations in increasing document duplication detection quality due to technological problem of natural language processing. Recently, some studies tried to increase the quality by applying syntatic-semantic analysis technique. But, the studies have the problem comparing syntactic-semantic trees. This paper develops a syntactic-semantic tree comparator, designs and implements a discriminator of similar documents using the comparator. To evaluate the system, we analyze the correlation between human discrimination and system discrimination with the comparator. This analysis shows that the proposed discrimination has good performance. We need to define the document type and improve the processing technique appropriate for each type.

Estimation of performance for random binary search trees (확률적 이진 검색 트리 성능 추정)

  • 김숙영
    • Journal of the Korea Computer Industry Society
    • /
    • v.2 no.2
    • /
    • pp.203-210
    • /
    • 2001
  • To estimate relational models and test the theoretical hypotheses of binary tree search algorithms, we built binary search trees with random permutations of n (number of nodes) distinct numbers, which ranged from three to seven. Probabilities for building binary search trees corresponding to each possible height and balance factor were estimated. Regression models with variables of number of nodes, height, and average number of comparisons were estimated and the theorem of O(1g(n)) was accepted experimentally by a Lack of Test procedure. Analysis of Variance model was applied to compare the average number of comparisons with three groups by height and balance factor of the trees to test theoretical hypotheses of a binary search tree performance statistically.

  • PDF

A Comparative Analysis of the Teaching-Learning Program for the Thinking Extension of Information-Gifted by Models (정보영재의 사고력 신장을 위한 교수-학습 프로그램의 모형별 결과 비교 분석)

  • Deok-Gil Jung;Byung-Joe Kim;Young-Uhg Lho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.1162-1165
    • /
    • 2008
  • 이 논문은 정보영재 교육 중에서 프로그래밍을 위한 사고력 신장에 적합한 교육 프로그램 모형을 개발하고 이의 구현을 위하여 실제적인 예를 보여 교육 프로그램의 타당성과 유효성을 검증하였다. 이 논문은 트리와 트리 탐색을 이용한 사고력 신장 교육 프로그램으로 4단계로 구성되는 교육 프로그램을 제안하였으며, 구성되는 트리의 유형과 탐색 방법에 따라 세 가지 모형으로 세분화된다. 이 모델을 통하여 학생들은 문제를 트리로 표현하는 방법을 학습하게 되며, 트리로 구성된 문제를 해결하기 위하여 각각의 트리 모형에 따른 적절한 트리 탐색 방법을 통하여 문제를 해결하는 방법을 배우게 된다. 이 교육 프로그램 모형을 실제 교육 현장에서 적용하여 각 모형별로 그 결과를 비교 분석한다.