• 제목/요약/키워드: XPATH

검색결과 94건 처리시간 0.038초

XPath패턴들간의 준동형 정보를 효율적으로 유지하기 위한 래티스 구조 (A Lattice Structure for Efficiently Maintaining Homomorphism Information Among XPath Patterns)

  • 유상현;손진현;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.326-333
    • /
    • 2005
  • 많은 XML 응용들은 XML 문서에 대한 질의 언어로 XPath 패턴을 사용한다. XPath 패턴들 사이에는 포함 관계가 존재할 수 있으며, 하나의 XPath 패턴이 다른 XPath 패턴을 포함하는지를 결정하는 문제를 포함 문제라고 한다. 포함 문제는 많은 응용들에서 발생하고 있지만 co-NP complete 문제로 알려져 있다. 한편 XPath 패턴들 사이의 준동형 관계는 포함 관계의 충분 조건이면서 다항 시간에 얻을수 있다. 본 논문에서는 준동형 문제가 포함 문제를 대체하여 유용하게 쓰일 수 있는 응용들에 대해 논의하고, XPath 패턴들 사이의 준동형 정보를 유지하면 많은 이점을 얻을 수 있다는 사실에 대해 논의한다. 그리고 XPath 패턴들 사이의 준동형 관계를 유지하기 위하여 POX(Partially Ordered Set of XPath Patterns)라는 래티스 구조를 제안하고, 그것을 유지할 수 있는 알고리즘을 개발한다. 알고리즘 분석을 보면 알 수 있듯이, 본 논문에서 제안하는 알고리즘은 다항 시간에 POX를 효율적으로 유지할 수 있다.

XPath 표현식의 필터링을 통한 XML 접근 제어 기법 (An XML Access Control Method through Filtering XPath Expressions)

  • 전재명;정연돈;김명호;이윤준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.193-203
    • /
    • 2005
  • XML은 인터넷 상에서 데이타의 표현 및 전송 표준으로 인식되고 있다. XPath는 XML 문서의 특정 부분을 규정하는 표준으로, XML 질의 처리와 접근 제어에 적합한 언어이다 본 논문에서는 XPath를 사용자 질의 및 접근 제어 정보를 표현하는 방법으로 사용하는 XML 접근 제어 방법을 제안한다. 제안하는 방법은 접근 제어 XPath 표현식을 통해 질의 XPath 표현식을 필터링하여 XML 문서에 대한 접근을 제어한다. 이를 위하여 XML 접근 제어 트리(XACT)를 정의하고, 이 트리를 이용하여 질의 XPath 표현식에서 접근 허용되는 부분만을 추출한다. XACT는 XML 엘리먼트들에 대한 구조적 요약으로 에지를 구성하고, 접근 제어 정보로 노드를 구성한 구조이다. 제안하는 방법의 정확성을 보이고, 기존방법과의 성능을 비교한다

XML 구조 문맥을 사용한 효율적인 경로 표현식 조인 알고리즘 (An Efficient Path Expression Join Algorithm Using XML Structure Context)

  • 김학수;신영재;황진호;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.605-614
    • /
    • 2007
  • XML 데이터 검객을 위한 표준 질의 언어로서 XQuery와 XPath가 W3C에 의해 표준으로 제정되었다. XQuery와 XPath를 보편적으로 사용함에 따라, 최근 연구는 방대한 XML 데이터베이스에서 XPath 경고 표현식에 대한 효율적인 질의 처리를 위한 데이터 구조 및 알고리즘 개발에 초점을 두고 있다. 최근에, XPath 경로 표현식을 처리할 때 XML 엘리먼트 사이의 구조적 관계(조상-자손, 부모-자식)를 결정하는 구조적 조인의 개념은 중요한 XPath 프로세싱 기법중의 하나가 되었다. 그러나 XPath 질의 처리에서 자주 발생하는 구조적 조인들은 높은 비용을 요구한다. 본 논문에서, 우리는 XPath 질의들을 효율적으로 처리하기 위해 제안한 구조적 인덱스(SI) 기반의 새로운 구조적 조인 알고리즘(SISJ)을 제안한다. 실험 결과에서는 이전의 알고리즘보다 근소하게 더 효율적인 성능을 보여 준다. 그러나 재귀성이 높은 문서에 대해서는 제안기법의 가지치기 특성으로 인해 약 30% 이상의 성능향상을 보였다.

XPath 후향축 표현식을 위한 타입 추론 기법 (Type Inference for XPath Backward Axis Expressions)

  • 임현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.57-60
    • /
    • 2015
  • XPath는 XML 문서를 탐색하고 필요한 부분을 추출하는데 유용한 W3C 표준 프로그래밍 언어이다. XPath를 기반으로 XSLT, XQuery와 같은 표준 언어가 정의되어 널리 사용되고 있으며, DTD, XML Schema, RelaxNG와 같은 타입 언어를 이용하여 XML 문서를 효과적으로 명세할 수 있음에도 불구하고, XPath 기반 XML 처리 프로그램을 위한 타입 검사 기법은 미비하다. 본 논문에서는 XPath 기반 프로그램을 위한 새로운 양상논리 기반의 타입 추론 기법을 제안한다.

A Study of Main Contents Extraction from Web News Pages based on XPath Analysis

  • Sun, Bok-Keun
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권7호
    • /
    • pp.1-7
    • /
    • 2015
  • Although data on the internet can be used in various fields such as source of data of IR(Information Retrieval), Data mining and knowledge information servece, and contains a lot of unnecessary information. The removal of the unnecessary data is a problem to be solved prior to the study of the knowledge-based information service that is based on the data of the web page, in this paper, we solve the problem through the implementation of XTractor(XPath Extractor). Since XPath is used to navigate the attribute data and the data elements in the XML document, the XPath analysis to be carried out through the XTractor. XTractor Extracts main text by html parsing, XPath grouping and detecting the XPath contains the main data. The result, the recognition and precision rate are showed in 97.9%, 93.9%, except for a few cases in a large amount of experimental data and it was confirmed that it is possible to properly extract the main text of the news.

분할 저장 시스템에 적합한 XPath 질의 처리기 설계 (Design of XPath Query Processor in Decomposition Storage System)

  • 고영기;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.52-54
    • /
    • 2002
  • 인터넷에서 XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고 있으며 XML문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 따라서, XML 문서를 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구는 관계형 데이터베이스(RDBMS)를 통하여 XML문서를 저장하고 검색할 수 있게 하기 위해 XPath 질의어에 적합하도록 하부 저장 스키마를 설계하였다. 그리고, XPath 질의를 SQL문으로 변화시켜 수행함으로써 XML 데이터에 대한 접근을 허용하였다. 더욱이 SQL문 수행 후의 결과를 효율적으로 DOM 형식의 XML 문서를 생성시킴으로써 문서의 재 조작을 가능하게 하였다.

  • PDF

분산 객체 관계 데이터베이스 시스템을 이용한 분산 XML 문서 저장 시스템과 분산 XPath 질의 처리기 설계 및 구현 (Design and Implementation of Distributed XML Storage System and Distributed XPath Query Processor using Distributed ORDBMSs)

  • 이창주;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.235-239
    • /
    • 2006
  • 최근 컴퓨팅 환경은 인터넷 환경의 웹을 기반으로 한 분산 컴퓨팅 환경으로 변화하고 있다. 그에 따라 XML 문서의 사용과 XML 문서의 양이 급속하게 증가하였으며, 언제라도 쉽게 필요한 XML 문서에 접근할 수 있어야 한다. XML 문서에서 정보를 검색하기 위하여 XPath 질의어가 널리 사용 중이며, XML 저장 기법과 XPath를 이용한 질의 처리에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 분산 객체 관계 데이터베이스 시스템을 이용하여 XML 문서를 저장하고 관리하는 시스템을 설계하였으며 분산된 XML 데이터를 접근할 수 있도록 하기 위해 XPath를 분산 SQL로 변환하여 실행하는 분산 XPath 질의 처리기를 설계 및 구현하였다.

  • PDF

조상-자손 관계 탐색을 지원하기 위한 XML 타입상속 색인구조의 계층적 구성기법 (XML Type Inheritance Index Hierarchies for Supporting Ancestor-descendant Exploration)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1133-1148
    • /
    • 2012
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 계층적 구성기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 조상-자손 관계 탐색을 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 그러나 이러한 MD-TIX는 질의에 주어진 Xpath의 길이가 긴 경우에 색인 엔트리의 구성문제 때문에 색인구조의 구축과 유지관리에 어려움이 있다. 이를 극복하기 위해서, 본 논문에서는 먼저 주어진 Xpath에서 인접한 두 타입 사이의 직접 관계 탐색을 지원하는 기본 색인구조들을 구축하고, 이들을 바탕으로 Xpath상의 임의의 두 타입 사이의 간접 관계 탐색을 지원하는 유도 색인구조들을 구축한다. 이러한 과정을 전체 길이의 Xpath를 지원하는 하나의 목표 색인구조를 구축하기까지 계층적으로 구성하는 방법을 제시한다. 또한 Xpath 상에 주어진 몇 개의 부경로 탐색만을 지원하기 위한 부분적인 색인계층을 효율적으로 구축하기 위한 알고리즘을 제안한다.

The XP-table: 다중 연속 XPath 질의의 집단 처리를 위한 실행시간 효율적인 영역 기반 구조체 (The XP-table: Runtime-efficient Region-based Structure for Collective Evaluation of Multiple Continuous XPath Queries)

  • 이현호;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.307-318
    • /
    • 2008
  • XML 메시지 중계기에서의 주요 이슈들 중 하나는 XML 스트림에 대한 다중 연속 XPath질의를 효율적으로 처리하는 방안이다. 본 연구는 이 문제를 효과적으로 해결하기 위한 시스템을 제안한다. 제안되는 시스템에서는 XPath 질의집합을 XP-table이라는 새로운 영역 기반 데이터 구조로 변환한다. XP-table은 대상 질의들의 공통적인 선택조건들을 공유하며, 실행시간 질의 수행 전에 구축된다. XML 스트림은 XP-table과의 효율적 매칭을 위해 스트림 릴레이션(SR)으로 실행시간에 변환된다. 제안된 시스템에서는 XML의 구조적 특성을 반영한 XP-table과 SR 간의 효과적인 매칭 전략이 제시된다. 또한, YFilter나 LazyDFA와 같은 기존 방법론과의 비교를 포함한 일련의 실험들을 통해, 제안 시스템이 질의 처리의 실행시간 부하를 줄임으로써 시간 효율성이 중요한 스트림 환경에서의 안정적 데이타 처리 능력을 보여준다.

X2RD: XPath를 이용한 XML 데이터의 관계형 데이터베이스로의 저장과 질의 (X2RD: Storing and Querying XML Data Using XPath To Relational Database)

  • 오상윤
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.57-64
    • /
    • 2009
  • XML은 웹 환경 정보의 표준으로 자리 잡고 있으며, 웹 서비스, 시멘틱 웹 등의 출현으로 XML을 이용한 정보교환은 더욱 확산될 것으로 예상되고 있다. 대부분의 데이터들은 관계형 데이터베이스에 저장되어 있으므로 XML 데이터의 저장과 질의에 관계형 데이터베이스를 이용하려는 연구가 최근 주목을 받고 있으며, 특별히 XPath, XQauery들과 같은 XML 관련규약들을 지원하는 방식에 대한 시도가 이루어져 왔다. 본 논문에서는 기존에 제안된 XML을 관계형 데이터베이스에 저장하고 질의를 수행하는 구조들의 특성들을 분석하고, 관계형 데이터베이스를 이용한 새로운 XML 저장 및 질의 방식을 제안한다. 제안된 방식은 XML 데이터를 분할 (Shred) 하여 관계로 표현하며, XQuery의 기본이 되는 XPath를 이용한 Query를 SQL로 변환하여 적용하는 구조를 가진다. 본 제안 방법론을 이용하여 Query Processor를 구현하고 실제 RDBMS를 연동하고 실험한 결과, XML 데이터를 효과적으로 RDBMS에 효과적으로 저장하고 질의할 수 있는 것을 확인할 수 있었다.