• 제목/요약/키워드: XML 트리

검색결과 206건 처리시간 0.028초

빈발 패턴 트리 기반 XML 스트림 마이닝 (Frequent Patten Tree based XML Stream Mining)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.673-682
    • /
    • 2009
  • 웹상에서 데이터 교환과 표현을 위한 표준으로 XML 데이터가 널리 사용되고 있으며 유비쿼터스 환경에서 XML 데이터의 형태는 연속적이다. 이와 관련하여 XML 스트림 데이터에 대한 빈발 구조 추출 및 효율적인 질의처리를 위한 마이닝 방법들이 연구되고 있다. 이 논문에서는 슬라이딩 윈도우 기반으로 하여 XML 스트림 데이터로부터 최근 윈도우 범위에 속하는 데이터에 대한 빈발 패턴 구조를 추출하기 위한 마이닝방법을 제안한다. 제안된 방법은 XML 스트림 데이터를 트리집합 모델, XFP_tree로 표현하고 이를 이용하여 최근의 데이터에 대한 빈발구조 패턴을 빠르게 추출한다.

유전자 알고리즘을 통한 XML 군집화 방법 (XML Clustering Technique by Genetic Algorithm)

  • 김우생
    • 전자공학회논문지CI
    • /
    • 제49권3호
    • /
    • pp.1-7
    • /
    • 2012
  • 최근 들어 인터넷에서 많이 사용되는XML 문서들을 효율적으로 접근, 질의, 관리하는 방법들이 연구되고 있다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서의 원소는 대응하는 트리의 노드에 대응하며, 문서에서 내포 관계는 트리의 부모와 자식 노드간의 관계에 대응한다. 따라서 유사한 XML 문서들은 대응하는 트리들에서 노드의 이름과 레벨 등이 유사하다. 이러한 성질을 유전 알고리즘의 평가 함수로 만들어 군집화를 시도하였다. 실험 결과를 통하여 제안하는 기법이 기존 방법들보다 좋은 결과를 얻을 수 있음을 보였다.

음성 웹서비스를 위한 VoiceXML 해석기의 설계 및 구현 (Design and Implementation of the VoiceXML Interpreter for Voice Web-service)

  • 신현경;강동남;염세훈;유재우
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.42-47
    • /
    • 2001
  • 본 연구의 목적은 비 시각환경에서 웹 서비스를 위한 언어인 VoiceXML을 기존의 자동응답 시스템에 적용하기위해 VoiceXML문서의 마크-업을 인식하고, 문서가 문서 형정의 (DTD)에 적합한지를 검사하여 적합성이 확인되면 추상구문트리를 생성하는 DI 파서 (Document Instance Parser)와 생성된 추상구문트리를 이용하여, Voice-XML문서를 번역해주는 해석기를 제안하고자 한다. VoiceXML해석기는 DI 파서와 실행기로 구성되어 있으며, DI 파서는 Recursive descent 파싱 기법을, 실행기는 VXML 포럼에서 제안한 FIA (Form Interpretation Algorithm)를 사용하였다. 본 시스템은 VoiceXML 언어를 효율적으로 실행할 수 있는 환경 제공 및 시스템 개발의 편의성과 효율성을 위해 모듈화 설계가 가능한 자바언어를 사용함으로써 이 기종간의 이식성이 뛰어난 특징이 있다.

  • PDF

추상구문트리를 이용한 구문지향 XML 문서 편집기 (A Syntax-Directed XML Document Editor using Abstract Syntax Tree)

  • 김영철;유두규
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.117-126
    • /
    • 2005
  • 기존의 XML 문서 편집기는 일반 텍스트 위주의 편집을 하고 내부적으로 구문적 검사를 하지 않는다. 따라서 작성된 XML 문서가 잘 설계(well-formed) 되었는지 유효(valid) 문서인지를 검사하지 못한다. 본 논문에서는 XML 문서를 편집하는데 있어서 구문에 맞도록 설계할 수 있는 구문지향 편집기를 설계하고 구현한다. 또한 트리 기반의 편집기로 구현되어 있기 때문에 향후에 XML 문서 확장이 용이하며, 다른 시스템과는 달리 실시간으로 유효성을 검증할 수 있도록 설계되었다. 본 시스템은 향후에 XML 관련 어플리케이션 개발에 많은 영향을 줄 것으로 기대된다.

  • PDF

XML 데이타를 위한 효율적인 디스크 블록 할당 방법 (An Efficient Disk Block Allocation Method for XML Data)

  • 김정훈;손진현;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.465-472
    • /
    • 2007
  • XML과 같은 준구조적 데이타가 많이 사용됨에 따라 이를 효과적으로 저장하고 관리하는 것이 중요해지고 있다. XML 데이타는 트리 형태로 모델링이 가능하며, 기본적으로 질의 처리는 트리를 탐색하는 방식으로 이루어진다. 본 논문에서는 XML 데이타를 디스크 블록에 저장하는 알고리즘을 제안한다. 제안하는 알고리즘은 트리의 각 노드마다 아래쪽에서 위쪽으로 숫자를 할당하며 그 숫자를 이용하여 디스크 블록에 노드들을 매핑한다. 제안하는 알고리즘은 접근 패턴 정보를 필요로 하지 않으며 어떠한 접근 패턴에 대해서도 좋은 성능을 보인다. 제안하는 방법의 몇가지 특성을 증명하고, 실험을 통해서 성능을 평가한다.

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.

Form을 지원하는 XML 문서 편집기 구현 (An implementation of Form-supporting XML Document Editor)

  • 고탁현;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.331-333
    • /
    • 2001
  • XML이 인터넷 상에서 정보 교환을 위한 새로운 표준으로 채택됨에 따라 XML 문서의 효율적인 작성과 관리를 위한 다양한 형태의 편집기가 계속 개발되고 있다. 본 논문은 기존의 XML 문서 편집기가 가진 제약점을 살펴보고 이를 해결하기 위한 새로운 형태의 XML 문서 편집기를 제안한다. 기존의 XML 문서 편집은 대부분 트리 구조를 기반으로 하여 이루어지고 있으며, 이것은 사용자로 하여금 XML에 대한 어느 정도의 지식을 필요로 한다. 그러나 XML 문서의 작성과 활용이 보편화되기 위해서는 이러한 문서 편집 방식에서 벗어나 누구나 쉽게 작성할 수 있는 환경이 제공되어야 한다. 본 논문에서는 이를 위해 트리 방식의 문서 편집뿐 만 아니라 문서의 양식을 반영하는 form을 기반으로 하는 편집 환경도 지원하는 새로운 XML 문서 편집기를 개발한다. Form외 생성은 template XML 문서와 XSLT을 통해 이루어지며 생성된 form은 내장된 HTML 브라우저를 통해 사용자에게 보여진다. Form에 입력된 사용자 데이터는 해당 XML 문서로 변환되어 데이터베이스에 저장된다.

  • PDF

모바일 데이터 브로드캐스팅을 위한 트리 기반의 인덱싱 방법 (A Tree-Based Indexing Method for Mobile Data Broadcasting)

  • 박미화;이용규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-150
    • /
    • 2008
  • 무선 모바일 환경에서 통신 장비의 에너지와 전송 대역폭 효율을 위해 방송 기법이 널리 사용되고 있다. 기존에는 비계층적 데이터를 대상으로 한 인덱싱 연구들이 있었으나, 웹과 이동통신 환경에서 널리 사용되는 XML 데이터에 대한 방송 인덱싱 연구는 미미한 실정이다. 본 연구에서는 XML문서에 대한 새로운 방송 인덱싱 방법으로 TOP 트리를 제안한다. TOP 트리는 XML 문서에 포함된 엘리먼트들을 같은 경로를 갖는 엘리먼트 그룹으로 분류한 후, 해당 그룹을 순서화된 고유 ID가 부여된 노드로 구성하고 엘리먼트 그룹간의 관계를 간선으로 연결한 경로 요약 트리이다. 본 논문에서는 TOP 트리 기반 방송 스트림 생성 방법과다중 경로 질의 처리 방법을 제안하고 실험을 통해 제안 방법의 우수성을 입증한다.

  • PDF

DOM형식 설계를 이용한 마크업 언어연구 (A Study Markup Language using Design of DOM From)

  • 이돈양;최한용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.341-344
    • /
    • 2005
  • DOM은 기본적으로 XML 문서를 구조적으로 표현한 것이다. 그리고 DOM은 XML문서를 노드의 트리로 인식하며, 이 노드는 동작이 가능한 오브젝트들로 구성되었다. 여기서 각 엘리먼트는 노드이며, 이 노드는 서브트리를 구성할 수 있다. 본 논문에서는 DOM 트리생성을 이용한 XML 스키마의 생성 방법 중 기본적인 사용형태인 사용자 정의 심플타입 DOM 트리 설계의 모든 노드 요소들은 IXMLDOMElement의 형식으로 엘리먼트들을 정의하여 클래스내의 단위 엘리먼트의 속성여부와 모델 내의 클래스 관계를 표현할 수 있도록 하였다. 마크업언어의 생성에서는 XML 스키마를 이용하여 세부적인 데이터타입의 선언이 가능하도록 하고 있다.

  • PDF

XML 소스 데이터로부터 스타 스키마를 생성하기 위한 XML2Star 알고리즘 (XML2Star Algorithm Creating Star Schema from Source Data in XML)

  • 최은하;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 웨어하우스는 기업의 의사 결정을 지원하기 위해 기업의 운영 데이터베이스로부터 추출한 데이터의 집합으로써 OLAP 분석에 이용된다. OLAP은 데이터에 대한 다양한 분석을 위해 이들 데이터를 다차원 데이터 모델로 표현하고 이를 활용하여 복잡한 질의 처리 및 다차원 데이터 분석에 이용한다. 이러한 OLAP의 다차원 데이터를 관계형 데이터베이스에서 표현하기 위해 스타 스키마가 널리 사용된다. 지금까지의 데이터 웨어하우스는 일반적으로 ER 도형으로 설계된 소스 데이터로부터 스타 스키마를 설계하고 구축하였다. 하지만, 최근 인터넷의 급성장으로 인해 차세대 웹 문서의 표준인 XML을 통한 인터넷 상의 문서 전송 및 정보 교환이 활발해 지고 있으며, XML 문서에 대한 다차원적인 분석이 요구됨에 따라 데이터 웨어하우스는 XML 문서로부터의 스타 스키마 설계 및 저장이 필요하게 되었다. 따라서 본 논문에서는 XML DTD로부터 애트리뷰트 트리를 생성하여 스타 스키마를 설계하고 이 DTD를 따르는 XML 문서에서 스타 스키마의 인스턴스를 추출하여 관계형 데이터베이스에 저장하기 위한 XML2Star 알고리즘을 개발하였다. 이것을 통해 기업 및 사용자는 OLAP에서 XML 기반의 스타 스키마를 이용한 다차원적인 분석이 가능하게 된다.

  • PDF