• 제목/요약/키워드: XML Tree

검색결과 148건 처리시간 0.022초

Encoding of XML Elements for Mining Association Rules

  • Hu Gongzhu;Liu Yan;Huang Qiong
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제14권3호
    • /
    • pp.37-47
    • /
    • 2005
  • Mining of association rules is to find associations among data items that appear together in some transactions or business activities. As of today, algorithms for association rule mining, as well as for other data mining tasks, are mostly applied to relational databases. As XML being adopted as the universal format for data storage and exchange, mining associations from XML data becomes an area of attention for researchers and developers. The challenge is that the semi-structured data format in XML is not directly suitable for traditional data mining algorithms and tools. In this paper we present an encoding method to encode XML tree-nodes. This method is used to store the XML data in Value Table and Transaction Table that can be easily accessed via indexing. The hierarchical relationship in the original XML tree structure is embedded in the encoding. We applied this method to association rules mining of XML data that may have missing data.

  • PDF

XML 데이터 공유를 위한 리스트 잠금 프로토콜 (List Locking Protocol for XML Data Sharing)

  • 이은정
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1367-1374
    • /
    • 2004
  • XML 트리를 공유하면서 여러 사용자가 동시에 수정할 수 있게 하기 위해서는 부분 트리의 삽입/삭제가 공유될 수 있어야 한다. 이를 위해서는 트리 데이터의 구소 변경 행위에 대한 통시성 제어가 가능해야 한다. 본 논문에서는 DTD 문서 타입 정보를 이용하여 XML 트리의 반복부에 대해서만 부분 트리의 삽입/삭제가 가능한 리스트 데이터 공유 모델을 제안한다. 제안된 리스트 데이터 공유 모델은 구조 변경 행위의 적용 결과가 항상 유효하며, 여러 사용자가 동시에 접근하는 경우에도 문서의 유효성을 보장할 수 있다. 리스트 데이터 공유 모델에서 반복부 자식 노드 리스트를 잠금의 대상으로 하는 리스트 잠금 프로토콜을 제안하였다. 이 잠금 프로토콜은 기존의 방법들과 비교하여 훨씬 간단하면서 적은 수의 잠금 객체만을 다루며, 높은 접근성을 가능하게 한다. 일반적으로 공유되는 XML 트리의 삽입 및 삭제는 흔히 반복부 데이터에 대해서 적용되는 경우가 많으므로 제안된 모델은 터미널 노드 데이터 값에 대한 기존의 접근제어 방법과 함께 사용하였을 때 효과적인 데이터 공유 방법을 제공할 수 있을 것으로 기대된다.

XML 데이타를 위한 효율적인 디스크 블록 할당 방법 (An Efficient Disk Block Allocation Method for XML Data)

  • 김정훈;손진현;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.465-472
    • /
    • 2007
  • XML과 같은 준구조적 데이타가 많이 사용됨에 따라 이를 효과적으로 저장하고 관리하는 것이 중요해지고 있다. XML 데이타는 트리 형태로 모델링이 가능하며, 기본적으로 질의 처리는 트리를 탐색하는 방식으로 이루어진다. 본 논문에서는 XML 데이타를 디스크 블록에 저장하는 알고리즘을 제안한다. 제안하는 알고리즘은 트리의 각 노드마다 아래쪽에서 위쪽으로 숫자를 할당하며 그 숫자를 이용하여 디스크 블록에 노드들을 매핑한다. 제안하는 알고리즘은 접근 패턴 정보를 필요로 하지 않으며 어떠한 접근 패턴에 대해서도 좋은 성능을 보인다. 제안하는 방법의 몇가지 특성을 증명하고, 실험을 통해서 성능을 평가한다.

XML Tree 기반의 XML 스키마 & 스타일시트 생성 도구의 설계 및 구현 (The Design and Implementation of XML Schema & Stylesheet Generation Tools based on XML Tree)

  • 박영수;장덕철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.430-432
    • /
    • 2005
  • 최근 웹 사용자의 기대와 요구사항이 증가하고, 사회 전반의 트렌드가 자주 변하는 등 기존의 웹 서비스에 대한 프로그램 구조의 변경 요인이 자주 발생하고 있다. 본 연구에서는 이전에 개발된 XML Tree의 정보를 이용하여, 웹 기반에서 XML 개발 지원 서버의 도움을 받아 개발자가 웹 서비스를 하기 위한 XML Schema, XML Stylesheet, XML Document를 자동 생성할 수 있는 방법을 제시하고, 설계 및 구현을 하였다. 이렇게 함으로서, 웹 프로그램의 개발 시간 및 개발 비용을 줄일 수 있고 기업에서 각 부서 간에 시스템 통합이나 사용자의 트렌드 변화에 따른 웹 서비스의 구성 요소에 대한 변경 요인이 발생되었을 때, 이를 쉽고 빠르게 대처할 수 있을 것으로 기대한다.

  • PDF

XML 트리의 노드와 레벨을 사용한 군집화 방법 (Clustering Technique Using a Node and Level of XML tree)

  • 김우생
    • 한국정보통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.649-655
    • /
    • 2013
  • 최근 들어 인터넷에서 많이 사용되는 XML 문서들을 효율적으로 접근, 질의, 관리하는 방법들이 연구되고 있다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서의 원소는 대응하는 트리의 노드에 대응하며, 문서에서의 내포 관계는 대응하는 트리의 레벨 관계에 대응한다. 따라서 유사한 XML 문서들은 대응하는 트리들에서 노드의 이름과 레벨이 유사하다. 본 논문에서는 XML 문서의 특징으로 대응하는 트리의 노드 이름과 레벨을 사용하여 군집화를 수행하였다. 제안하는 기법이 좋은 결과를 얻을 수 있음을 실험을 통하여 보였다.

동적 XML 데이터 관리를 위한 트리 분해 기반의 소수 레이블링 기법 (A Prime Number Labeling Based on Tree Decomposition for Dynamic XML Data Management)

  • 변창우
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.169-177
    • /
    • 2011
  • 갱신 연산의 허용으로 동적 XML 데이터의 처리 효율성의 요구가 증대하면서 새로운 동적 XML 레이블링 기법들이 연구되어 왔다. 동적 XML 레이블링 기법의 핵심적인 해결 사항으로는 조상-자손-형제 관계 결정, 레이블 저장공간의 절약, 빠른 응답시간, 갱신에 의한 레이블 재작성의 최소화이다. 대표적인 동적 레이블링 기법으로 소수 기반 레이블링 기법이 있다. 소수 기반 레이블링 기법은 소수의 특성을 이용하여 조상-자손 관계를 쉽게 결정한다. 또한 새로운 엘리먼트를 삽입할 때도 기존 노드의 레이블을 재작성하는 비용이 발생되지 않는 장점을 갖고 있다. 하지만 소수를 많이 사용하면 레이블의 값이 상당히 커지게 되는 레이블 오버플로우 문제가 발생된다. 본 논문에서는 레이블 오버플로우 문제를 효과적으로 줄이는 새로운 방법을 소개한다. 제안하는 방법의 핵심 개념은 트리 분해이다. 레이블 오버플로우가 발생하면 트리를 하부 트리들로 분해하고 레이블은 각 하부 트리에 한해서 부여하는 것이다. 실험을 통해 트리 분해 기반의 소수 기반 레이블링 기법의 효과를 보인다.

XML 어플리케이션을 위한 트리 기반 문서 편집 시스템의 설계 및 구현 (A Design and Implementation of the Tree-based Document Editing System for XML Application)

  • 김영철;강춘길
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.959-966
    • /
    • 2004
  • 본 논문에서는 구조 중심형 환경에서 사용 가능한 트리기반 XML 어플리케이션 문서 편집 시스템의 설계 및 구현에 관하여 논의한다. 본 시스템은 DTD를 ASTD( Syntax Tree Definition)로 변환하여 내장하는 구조로서 잘 설계된(well-formed) 문서는 물론 편집 중에 유효한(valid) 문서를 작성하도록 하기 위하여 구문 지향 편집(syntax-directed editing)을 지원한다. 또한 구조 중심형 환경에서 사용자와의 인터페이스를 담당하는 편집기를 설계함에 있어 새로운 도구의 추가로 인한 기능 확장이 용이하도록 고려하였으며, 편집기의 구현 시 기존의 문법 검증에 대한 비효율성을 감안하여 다중 엔트리(multiple entry)를 적용한 파서를 사용하여 실시간으로 유효성 검증이 가능하도록 하였다. 본 논문은 XML 문서 편집 시스템의 개발 모델을 제시함으로써 관련 어플리케이션 개발에 크게 기여할 것으로 기대된다.

동적 XML 문서에서 효과적인 레이블링을 위해 형제순서 값을 갖는 프라임 넘버링 기법 (A Prime Numbering Scheme with Sibling-Order Value for Efficient Labeling in Dynamic XML Documents)

  • 이강우;이준동
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.65-72
    • /
    • 2007
  • 동적인 XML 문서에서 빈번히 발생하는 갱신에 대한 고려를 하지 않는 레이블링 기법들은 XML 문서 트리의 갱신이 일어날 때 마다 변화된 레이블 정보를 반영하기 위해서 전체 XML 트리를 재탐색하여 전체 노드의 레이블을 다시 계산하는 리레이블링(relabeling)과정이 필요하다. 이러한 리레이블링은 갱신이 빈번히 일어나는 동적인 XML 문서에서는 비용이 상당히 크다는 단점이 있다. 이런 단점을 해결하기 위해 리레이블링 과정이 필요 없는 레이블링 기법으로 프라임 넘버 레이블링 기법(prime number labeling scheme)이 제안되었다. 그러나 프라임 넘버 레이블링 기법은 문서가 갱신될 때 XML 문서 트리의 노드 간 형제순서(sibling order)를 갱신하는 문제는 고려하지 않고 있다. 이러한 형제순서의 갱신과정은 XML 문서 트리의 많은 부분을 재탐색하고 재기록 하여야 하므로 많은 비용이 필요하게 된다. 따라서 본 논문에서는 XML 문서 트리의 재탐색과 재기록이 필요 없이 형제순서를 유지할 수 있는 형제순서 값을 갖는 프라임 넘버 레이블링 기법을 제안한다.

  • PDF

동적 순서 XML 트리에서 레이블링 기법을 이용한 효율적인 수정처리 (An Efficient Updates Processing Using Labeling Scheme In Dynamic Ordered XML Trees)

  • 이강우
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2219-2225
    • /
    • 2008
  • 동적인 XML문서에서 빈번히 발생하는 갱신에 대한 고려를 하지 않는 레이블링 기법들은 XML 문서 트리의 갱신이 일어날 때 마다 변화된 레이블 정보를 반영하기 위해서 전체 XML 트리를 재탐색하여 전체 노드의 레이블을 다시 계산하는 리레이블링 과정이 필요하다. 이러한 리레이블링은 갱신이 빈번히 일어나는 동적인 XML 문서에서는 비용이 상당히 크다는 단점이 있다. 이런 단점을 해결하기 위해 리레이블링 과정이 필요 없는 레이블링 기법으로 프라임 넘버 레이블링 기법이 제안되었다. 그러나 프라일 넘버 레이블링 기법은 문서가 갱신될 때 XML 문서 트리의 노드 간 형제순서를 갱신하는 문제는 고려하지 않고 있다. 이러한 형제순서의 갱신과정은 XML 문서 트리의 많은 부분을 재탐색하고 재기록 하여야 하므로 많은 비용이 필요하게 된다. 따라서 본 논문에서는 XML 문서 트리의 리레이블링과 재계산이 필요 없이 형제순서를 유지할 수 있는 형제순서 값을 갖는 프라임 넘버 레이블링 기법을 제안한다.

모바일 데이터 브로드캐스팅을 위한 트리 기반의 인덱싱 방법 (A Tree-Based Indexing Method for Mobile Data Broadcasting)

  • 박미화;이용규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-150
    • /
    • 2008
  • 무선 모바일 환경에서 통신 장비의 에너지와 전송 대역폭 효율을 위해 방송 기법이 널리 사용되고 있다. 기존에는 비계층적 데이터를 대상으로 한 인덱싱 연구들이 있었으나, 웹과 이동통신 환경에서 널리 사용되는 XML 데이터에 대한 방송 인덱싱 연구는 미미한 실정이다. 본 연구에서는 XML문서에 대한 새로운 방송 인덱싱 방법으로 TOP 트리를 제안한다. TOP 트리는 XML 문서에 포함된 엘리먼트들을 같은 경로를 갖는 엘리먼트 그룹으로 분류한 후, 해당 그룹을 순서화된 고유 ID가 부여된 노드로 구성하고 엘리먼트 그룹간의 관계를 간선으로 연결한 경로 요약 트리이다. 본 논문에서는 TOP 트리 기반 방송 스트림 생성 방법과다중 경로 질의 처리 방법을 제안하고 실험을 통해 제안 방법의 우수성을 입증한다.

  • PDF