• 제목/요약/키워드: XPath Query

검색결과 48건 처리시간 0.033초

효율적인 XML 질의 처리를 위한 적응형 경로 인덱스 (Adaptive Path Index for Efficient U Query Processing)

  • 민준기;심규석;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.61-71
    • /
    • 2004
  • XML은 정형적(regular) 구조로부터 비정형적(irregular) 구조, 평탄한(flat) 구조로부터 깊게 내포된(deeply nested) 구조에 이르기까지 다양한 형태의 자료를 표현할 수 있다. 따라서, 현재 XML은 효율적인 데이타 교환 및 통합 기능을 제공하면서 웹 문서 표준으로 부각되고 있다. 또한, XML로 표현되어 있는 정보를 검색하기 위한 다양한 질의 언어들이 제안되었다. XPath와 XQuery같은 XML 질의 언어들은 XML 엘리먼트(element)로 이루어진 비정형적 구조를 탐색하기 위하여 경로 표현식(path expression)을 기반으로 한다. 이러한 경로 표현식을 효율적으로 처리하기 위하여 다양한 경로 인덱스들이 제안되었으나, 기존의 경로 인덱스들은 XML 데이타의 구조 정보만을 이용하여 생성된다. 따라서, 본 논문에서는 XML 데이타의 구조 정보와 질의 부하(workload)를 이용한 적응형 경로 인덱스를 제안한다. 본 논문에서 제안하는 적응형 경로 인덱스는 질의 성능을 향상하기 위하여 해쉬 트리와 그래프 구조를 이용하여 자주 사용되는 경로 정보와 XML 데이타의 구조 요약을 관리한다. 실험 결과로서, 적응형 경로 인덱스가 기존의 경로 인덱스들에 비하야 평균적으로 2배에서 69배 좋은 성능을 보였다.

가변 K진 완전트리와 RDF메타정보에 기반한 XML문서 저장 및 검색 프레임워크의 설계 및 구현 (A Design and Implementation of XML Document storing and retrieval Framework based on a variant k-ary complete tree and RDF Metadata)

  • 김규태;정회경;이수연
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.612-622
    • /
    • 2003
  • XML문서가 표준 인터넷 문서로 정착되어 감에 따라 XML문서의 효율적인 저장과 검색의 필요성이 증대하고 있다. 이에 본 논문에서는 XML문서의 효과적인 저장 모듈과 검색 모듈, 그리고 이를 웹 상에서 연동해서 사용할 수 있는 연동 API로 구성된 XML문서의 저장 및 검색 프레임워크에 대한 연구를 하였다. 저장모듈에서는 가변 K진 완전트리를 기반으로 한 DTD 독립적인 분할-통합형 저장모델을 구현하였고, 검색 모듈에서는 RDF 메타정보를 통해 구축된 색인에 대해 XPath 질의를 수행하는 XPath처리기를 구현함으로써 좀더 의미 있는 구조 검색 기능을 구현하였으며, XML-RPC, HTTP의 GET, POST, PUT 방식 API와 SOAP 방식의 API로 구성된 웹 연동 모듈을 구현하였다.

스트리밍 XML 데이타를 위한 효율적인 다중 질의 처리 기법 (An Efficient Multi-Query Evaluation Technique for Streaming XML Data)

  • 민준기;박명제;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.270-281
    • /
    • 2007
  • 현재 스트리밍 XML 데이타에 대한 관심이 점차 증가한다. 스트리밍 XML 데이타에 대한 대부분의 연구는 XML 데이타를 효율적으로 여과하는 기법에 초점을 맞추었다. 이러한 XML 여과 시스템들은 사용자들이 관심 있는 XML 문서 전체를 사용자들에게 제공한다. 이 경우, 제공된 XML 문서들로부터 관심 있는 부분만을 추출하는 부담이 사용자에게 남겨지게 된다. 따라서, 스트리밍 XML 데이타에 대하여 직접적으로 질의 처리를 수행하여 관심 있는 XML 부분만을 추출하는 스트리밍 XML 질의 처리 기법들이 제안되었다. 그러나, 기존의 스트리밍 XML 질의 처리 기법들은 제안된 XPath 질의 만을 지원하며 복수 개의 질의 문을 처리하지는 못하고 있다. 본 논문에서는 스트리밍 데이타의 한 번 읽는 특성에 따라 XML 데이타를 한 번 읽으면서 복수 개의 질의들을 동시에 처리하는 XTREAM을 제안하고자 한다. 또한, XTREAM은 기존의 기법들에 비하여 순서 기반 프리디케이트 등 다양한 종류의 XPath 질의 기능들을 지원한다. 실제 XML 데이타와 합성 XML 데이타를 통한 실험 결과들은 XTREAM의 효율성과 확장성을 보인다.

VTD-XML을 적용한 NETCONF 프로토콜 Content 계층의 데이터 모델링 기법 (Data Modeling Method of NETCONF Protocol's Content Layer Applying VTD-XML)

  • 이양민;이재기
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권11호
    • /
    • pp.383-390
    • /
    • 2015
  • 이질적인 링크와 다양한 장비로 구성된 오늘날의 복잡한 네트워크를 모니터링하고 관리하기 위해서 NETCONF를 사용하는 것이 적합하다. NETCONF의 첫 표준이 배포된 이래로 여러 번의 개정이 있었으나 계층별로 기능의 단점은 여전히 존재하고 있는데, 가장 대표적인 것이 Content 계층에서의 XML 문서 처리 효율성이다. 본 논문에서는 Content 계층에 데이터 간 종속성에 기반한 서브트리를 구성하여 데이터 모델링을 수행하고, XPath 질의에 대해 확장된 VTD-XML 기술을 적용하여 XML로부터 데이터를 효율적으로 추출하는 방법을 제안한다. 제안 기법이 적용된 NETCONF와 선행 연구의 NETCONF 및 표준 NETCONF를 비교하는 실험을 수행하고 논문에서 개선한 NETCONF의 우수성을 검증한다. 실험 결과로 본 논문에서 개선한 NETCONF가 다른 두 가지 NETCONF에 비해 질의 처리율에서는 각각 4%와 10% 우수하며, 질의 처리 속도에 있어서는 각각 3.9초와 10.4초 빠름을 확인하였다.

NFA 표현을 사용한 문서-중심적 XML의 키워드 기반 필터링 기법 (A Keyword-based Filtering Technique of Document-centric XML using NFA Representation)

  • 이경한;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.437-452
    • /
    • 2006
  • XPath 명세는 XML 원소 내용을 필터링하기 위한 질의어 작성이 어렵다. 본 논문은 이러한 문제점을 해결하기 위해 SQL의 LIKE 연산자에서 사용되던 특별한 매칭 문자 '%'를 허용한 확장된 XPath 명세와 그것을 표준 질의어로 사용하는 문서-중심적 XML 필터링 기법인 Pfilter를 제안한다. Pfilter는 값-기반 술어(value-based predicate)에서 피연산자의 공통 앞부분 문자를 공유하여 값-기반 술어의 처리 성능을 향상시킨다. 또한 본 논문은 Pfilter와 대표적인 데이타-중심적 XML 필터링 기법인 Yfilter를 값-기반 술어 처리의 확장성과 효율성에 대해 비교하고 Pfilter의 값-기반 술어 삽입, 삭제, 처리 결과를 제공한다. 본 논문에서 제안한 Pfilter는 XML 필터링 시스템에서 XPath의 contains() 함수를 평가(evaluation)하기 위한 핵심 알고리즘으로 사용할 수 있으며, XML 기반의 분산 정보 시스템을 구축하기 위한 기초 연구로 활용될 수 있다.

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

JXTA 기반의 XPath 질의 처리 시스템 (An XPath Query Processing System based on JXTA)

  • 이지훈;손기락
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1607-1610
    • /
    • 2003
  • 최근 MP3 저작권에 대한 찬반 논란이 계속 되면서, 기존의 클라이언트-서버가 아닌 Peer-To-Peer(P2P) 기반의 데이터 검색 시스템에 관한 여러 연구가 활발히 진행되고 있다. 하지만. 검색 방법에 있어서는 단순히 파일이름을 이용한 데이터 검색 방법이 주류를 이루고 있는데 본 논문에서는 검색을 위한 문서 정보를 XML 형태로 저장하고, 구조적인 검색을 용이하게 하기 위해 DOM(Document Object Model)을 이용하여 XML 문서를 트리 형태로 구성한 후 P2P 네트워킹 플랫폼인 JXTA를 기반으로 XPath 질의를 수행함으로써 P2P 네트워크 기반에서 구조적 검색이 가능한 시스템을 구현하였다.

  • PDF

확장된 질의 처리를 위해 경로간 의미적 유사도를 고려한 XML 문서 순위화 기법 (A Ranking Technique of XML Documents using Path Similarity for Expanded Query Processing)

  • 김현주;박소미;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.113-120
    • /
    • 2010
  • 정보기술의 표준으로 사용되고 있는 XML환경에서 방대한 양의 데이터에 대한 사용자의 질의를 효율적이고 정확하게 처리하기 위한 연구가 이슈화되고, 특히 웹 환경에서의 XML문서들은 용어적, 구조적인 측면에서 다양한 형태로 존재하고 있다. 이러한 특성을 갖는 XML 문서들을 대상으로 사용자가 특정한 정보를 얻고자 한다면, 사용자의 질의가 가진 용어 및 구조적 특성과 정확히 일치하지 않는 문서의 정보에 대해서 추가적인 기법이 필요하다. 본 논문은 이와 같은 경우에도 동일한 용어 및 구조를 사용하던 환경에서와 마찬가지로 최상위 순위로 정보를 검색할 수 있는 기법을 제시한다. 또한 정확히 일치하지 않는 문서의 경우에 대해서도 사용자 질의 측과의 경로간 의미적 유사성을 측정하여 사용자 질의와 의미적으로 유사한 경로를 가진 순으로 문서들을 순위화하여 제공한다. 제안된 기법은 실험을 통하여 기존의 기법보다 세밀하고 정확한 검색 결과를 도출함을 보인다.

관계형 DBMS를 이용한 XML 질의 처리 시스템 XPERT의 개발 (XPERT : An XML Query Processing System using Relational Databases)

  • 정민경;홍동권
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.1-10
    • /
    • 2006
  • 본 논문은 관계형 DBMS를 사용한 XML 질의 처리 시스템 XPERT(XML Query Processing Engine using Relational Technologies)의 개발 내용을 소개한다. 본 논문의 XPERT에서 제안하는 XML 저장 방식은 XML 문서를 여러 구성 성분별로 나누어 관계형 테이블에 저장하는 분할(decomposition 또는 shredded) 방식을 사용하고, 분할된 관계형 테이블을 바탕으로 XML 질의를 SQL로 변환하고, 관계형 DBMS에서 변환된 SQL을 실행하여 결과를 반환하는 방식을 사용한다. 제안한 XQuery 변환 방식은 먼저 XQuery의 구문 분석을 통하여 AST(Abstract Syntax Tree)를 생성하고, AST를 순회하면서 SQL 문장을 생성한다. 생성된 SQL 문장은 XML 문서의 경로를 사용함으로써 XQuery 연산의 조인 횟수를 감소시키며, 계층적 정보 검사나 문서에 내재된 결과의 순서를 지키기 위하여 사용하는 순서 정보는 Dewey 번호를 효과적으로 사용한다. 특히 XQuery의 XPath와 FLWOR 연산을 SQL로 변환하고 실행하는 효과적인 방법을 제시하고 제안된 XPERT시스템의 프로토타입을 개발하여 그 기능을 평가한다.

XML 질의처리를 위한 다차원 타입상속 색인구조의 할당기법 (An Assignment Method of Multidimensional Type Inheritance Indexes for XML Query Processing)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2009
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 할당기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 처리를 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 본 논문에서는 타겟 타입 또는 도메인 타입의 대치가 있는 Xpath로 표현된 여러 중첩술어들의 접속으로 구성된 복합질의의 관점에서 MD-TIX 색인들의 할당에 따른 질의처리 기법들을 분석하고, 그 결과로서 가장 효과적인 객인 할당기법을 제시한다. 먼저, XML문서의 변경에 따른 MD-TIX 색인구조의 운용과 하나의 중첩술어를 가지는 질의처리에 대한 MD-TIX 색인의 할당에 대하여 분석한다. 그리고 경로들 사이에 공통의 부경로가 있는 겹침 경로 상에 주어지는 여러 개의 중첩술어들로 구성된 보다 일반적인 질의의 관점에서 MD-TIX 색인의 운용과 그 할당기법을 제시한다.

  • PDF