• 제목/요약/키워드: XML Query

검색결과 357건 처리시간 0.026초

문서 단위 순위화를 통한 XML 문서에 대한 키워드 검색 성능 향상 (Accelerating Keyword Search Processing over XML Documents using Document-level Ranking)

  • 이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.538-550
    • /
    • 2006
  • XML 문서에 대한 키워드 검색은 사용자로 하여금 XML 문서의 복잡한 구조에 관한 지식 없이 쉽게 정보를 검색할 수 있게 해준다. 또한 사용자의 정보 요구에 대해 해당 정보를 포함하는 문서 전체를 반환하는 기존의 정보 검색 시스템과 달리 문서 내의 해당 정보를 포함하는 문서 조각을 결과로 반환함으로써 보다 빠르게 원하는 정보를 얻을 수 있도록 도와준다. 이러한 특징은 XML 문서 검색 시스템이 XML 문서를 문서 단위가 아닌 세부적인 엘리먼트 단위로 처리함으로써 가능하다. 하지만 이로 인해 대용량 문서들에 대한 질의 처리 부담 역시 가중되었다. 본 논문에서는 엘리먼트 단위 질의 처리의 비용을 줄이기 위해 XML 문서에 대한 문서 단위 순위화 기법을 제안하는데, 이는 결과물의 점수에 영향을 미치는 질의 키워드들의 문서 내에서의 근접도를 경로 노드 집합 정보와 이에 대한 유사도를 통해 구함으로써 엘리먼트 단위 질의 처리 결과를 예측하고 문서 단위 점수를 계산한다. 이러한 문서 중심의 뷰는 대용량 문서에 대한 순위화 혹은 필터링을 가능하게 해주며, 우리는 문서 단위 인덱스를 통해 순위가 높은 문서를 우선적으로 처리함으로써 Top-k 질의에 대해 검색 성능을 높였으며, 실험을 통해 해당 기법의 유효성과 성능 향상을 검증하였다.

DTD를 이용한 XML 데이타에 대한 질의 최적화 기법 (The Query Optimization Techniques for XML Data using DTDs)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.723-731
    • /
    • 2001
  • XML이 웹상에서 정보 교환의 표준으로 채택되면서 XML을 데이타베이스의 데이타로 보고 정보를 추출하는 분야가 주목받고 있다. XML은 그래프 기반의 비정형 데이타(semistructured data) 모델 과 매우 비슷하기 때문에 XML 데이타를 그래프 기반의 비정형 데이타 모델로 매핑한 후, 이에 대하여 질의를 처리할 수 있다. 본 논문에서는 XML 데이타에 대하여 스키마 정보를 가지는 DTB(Document Type Definition)를 이용한 질의 최적화 기법을 제안한다. 제안하는 기법은 인덱싱 효과를 내면서도 기존 방법에 비하여 부가의 메모리를 적게 필요로하고, 입력 데이타의 구조를 그대로 유지하기 때문에 다양한 형태의 질의를 효율적으로 처리할 수 있다. 간단한 예제 데이타베이스에 대하여 제안하는 기법의 실험 결 과를 보였다.

  • PDF

링크를 지원하기 위한 XML 질의어의 확장 (Extension of a XML Query Language to Support Links)

  • 문찬호;강현철;서상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.6-8
    • /
    • 2000
  • XML 문서의 폭발적인 확산에 따라 Web상의 각 사이트는 XML 문서를 분산 저장하여 관리하고 있다. 그리고 XML 문서들 간에는 다양한 링크를 통해 관련된 정보를 참조할 수 있다. 그러나 현재까지 XML과 관련하여, 링크를 지원하는 질의어 개발이나 링크를 활용한 XML 검색 시스템 개발에 대한 연구는 미비하다. 본 논문에서는, 실제 Web상에 분산되어 저장된 전자 문서들 중 하이퍼링크로 연결된 XML 문서들을 대상으로, 링크를 지원하기 위해 기존 XML 질의어를 확장에 대해 연구하였다. 이를 위해 XML 링크를 지원하는 질의의 유형을 분류하고, 링크를 지원하기 위한 XML 질의어의 확장에 대해 기술한다. 그리고 링크를 활용한 XML 질의 처리 방안에 대해 기술한다.

  • PDF

XML 문서 변경 탐지 기능을 갖는 통합 리파지토리 시스템 (An Integrated Repository System with the Change Detection Functionality for XML Documents)

  • 박성진
    • 한국산학기술학회논문지
    • /
    • 제10권10호
    • /
    • pp.2696-2707
    • /
    • 2009
  • 비록 많은 DBMS 업체들이 XML을 지원하기 위해 기존 제품들을 확장하고 있지만 이와는 별도로 DBMS 종류와 플랫폼에 독립적인 경량의 XML 리파지토리 시스템 개발이 요구되고 있다. 본 논문에서 다음과 같은 기능들을 지원하는 XML 통합 리파지토리 시스템의 설계 및 구현에 관해 기술하였다. 구현된 XML 리파지토리 시스템은 XML DTD로부터 XML 문서 저장에 필요한 스키마 구조를 생성하고 데이터베이스 테이블에 저장한 뒤 XMLQL(XML Query Language)를 통해 자유롭게 XML 문서를 생성할 수 있으며 중복된 XML 문서들을 동기화시킨다. XML 리파지토리에는 동일한 데이터가 다양한 XML 문서에 중복될 수 있기 때문에 중복된 XML 문서들의 일관성 유지를 위한 효율적인 변경 탐지 기법이 요구된다. 논문에서는 메시지 다이제스트 기반의 변경 탐지 기법을 제안함으로써 클라이언트 XML 문서와 리파지토리 안의 XML 데이터간의 일관성을 유지하도록 하였다.

스트리밍 XML 데이타를 위한 효율적인 다중 질의 처리 기법 (An Efficient Multi-Query Evaluation Technique for Streaming XML Data)

  • 민준기;박명제;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.270-281
    • /
    • 2007
  • 현재 스트리밍 XML 데이타에 대한 관심이 점차 증가한다. 스트리밍 XML 데이타에 대한 대부분의 연구는 XML 데이타를 효율적으로 여과하는 기법에 초점을 맞추었다. 이러한 XML 여과 시스템들은 사용자들이 관심 있는 XML 문서 전체를 사용자들에게 제공한다. 이 경우, 제공된 XML 문서들로부터 관심 있는 부분만을 추출하는 부담이 사용자에게 남겨지게 된다. 따라서, 스트리밍 XML 데이타에 대하여 직접적으로 질의 처리를 수행하여 관심 있는 XML 부분만을 추출하는 스트리밍 XML 질의 처리 기법들이 제안되었다. 그러나, 기존의 스트리밍 XML 질의 처리 기법들은 제안된 XPath 질의 만을 지원하며 복수 개의 질의 문을 처리하지는 못하고 있다. 본 논문에서는 스트리밍 데이타의 한 번 읽는 특성에 따라 XML 데이타를 한 번 읽으면서 복수 개의 질의들을 동시에 처리하는 XTREAM을 제안하고자 한다. 또한, XTREAM은 기존의 기법들에 비하여 순서 기반 프리디케이트 등 다양한 종류의 XPath 질의 기능들을 지원한다. 실제 XML 데이타와 합성 XML 데이타를 통한 실험 결과들은 XTREAM의 효율성과 확장성을 보인다.

XML 문서의 분할저장을 위한 XML2RDB 미들웨어의 설계 및 구현 (Design and Implementation of a XML2RDB Middleware for Partition Storing of XML Documents)

  • 박성진
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.1-16
    • /
    • 2003
  • XML은 전자 상거래 및 인터넷 기반의 정보시스템에서 데이터 표현과 교환을 위한 표준으로 간주되고 있다. XML이 웹에서 운용되는 모든 데이터가 통합, 저장, 처리될 수 있는 기반을 제공하기 위해서는 데이터베이스 안에 XML문서를 저장한 뒤 다시 구조화된 형태로 데이터를 추출하고 XML문서 형태로 생성할 수 있어 야 한다. 비록 많은 DBMS 업체들이 XML을 지원하기 위해 기존 제품들을 확장하고 있지만 이와는 별도로 XML기반의 B2B전자상거래 시스템을 구축하기 위해서 DBMS종류와 플랫폼에 독립적인 XML미들웨어 개발이 필요하다. 본 논문에서는 개발한 XML2RDB 미들웨어 시스템의 구조와 처리과정에 대한 설계 및 구현 내역을 기술하였다. 구현된 XML2RDB 미들웨어는 DBMS종류에 무관하게 XML DTD로부터 XML문서 저장에 필요한 스키마 구조를 생성하고 데이터베이스 테이블에 저장한 뒤 XMLQL(XML Query Language)를 통해 자유롭게 XML 문서를 재 생성할 수 있다.

  • PDF

분산환경에서 XMDR 기반의 멀티데이터 베이스 상호운영 모델 설계 (A Design of Model For Interoperability in Multi-Database based XMDR on Distributed Environments)

  • 정계동;황치곤;최영근
    • 한국정보통신학회논문지
    • /
    • 제11권9호
    • /
    • pp.1771-1780
    • /
    • 2007
  • 인터넷의 발달과 기업환경의 변화로 인해 정보통합의 필요성이 강조되고 있고, 기업에서는M&A를 통해 기존의 구축된 멀티-데이터 베이스를 통합해야 하는 경우가 많다. 이러한 정보의 통합을 위해서는 이질성의 문제를 해결하여 상호운용성을 보장해야 하며, 안정된 통합을 보장해야 한다. 본 논문에서는 이질성 환경에서 상호운용성 문제를 해결하기 위해 표준과 로컬간의 연관성을 명시한 XMDR(eXtended Meta-Data Registry)을 기반으로 상호운영을 위한 글로벌 XML 쿼리를 로컬 XML 쿼리로 변화할 수 있는 방법을 제안한다. 따라서 XMDR에 의한 글로벌 XML 쿼리를 생성하여 멀티-데이터 베이스를 하나의 질의로 검색과 수정이 가능하게 하고, 래퍼는 레거시에 적합하도록 변환할 수 있도록 레퍼를 구체적으로 설계된 모델을 제안하고, 이러한 처리를 위하여 기존의 분산 트랜잭션 처리기법인 2PC방식을 적용하였다.

RDBMS를 이용한 XML 데이터의 혼합형 저장 기법 (A Hybrid Method of Storing XML Data Using RDBMS)

  • 전찬훈;강현철
    • 한국전자거래학회지
    • /
    • 제14권1호
    • /
    • pp.57-79
    • /
    • 2009
  • 웹 기반의 e-비지니스가 활성화되면서 웹 상의 데이터 교환 표준인 XML 데이터의 양이 폭발적으로 증가하고 있다. 현재 XML의 저장소로 가장 널리 사용되고 있는 RDB에 XML 데이터를 분해하여 저장하고 SQL을 통해 XML 질의를 처리하는 기법이 많이 연구되었지만, 대용량의 XML 데이터 저장에 따른 공간 부담을 어떻게 완화할 것인지에 대한 연구는 없었다. 본 논문에서는 XML 데이터를 분해하여 기존의 노드 단위로 저장하는 것과 더불어 자주 질의되지 않거나 시간의 경과 등으로 유효성이 떨어진 데이터를 서브트리 단위의 저장으로 전환할 수 있는 혼합형 저장 기법을 제시한다. 이를 바탕으로 XML 혼합형 저장 및 질의 처리 시스템을 설계 및 구현하고 기존의 노드 단위 저장 및 질의 처리 시스템과 공간 효율 및 질의 처리 성능을 실험을 통해 비교 평가함으로써 제시하는 기법의 효율성을 검증하였다.

  • PDF

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.

XML 데이타 색인을 위한 경로 분할 기법 (A Path Partitioning Technique for Indexing XML Data)

  • 김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.320-330
    • /
    • 2004
  • XML에 대한 질의 언어는 데이타 그래프 내의 경로를 이용하여 질의를 표현한다. 특히, 경로에 패턴 (예를 들어, 정규식)을 사용함으로써, 데이타의 구조를 정확히 알지 못하더라도 질의가 가능하도록 한다. 이때, 패턴을 이용하는 질의는 데이타 그래프의 탐색범위를 크게 넓히게 된다. 기존의 XML색인 기법은 질의의 탐색범위를 줄이기 위해 데이타 그래프 내의 서로 동일한 경로들을 하나로 묶어 작은 크기의 색인 그래프를 생성하는 방법을 이용한다. 하지만 이러한 색인들은 많은 경우 색인의 크기가 데이터 그래프의 크기만큼 증가하게 되어 질의의 탐색범위를 줄이지 못하고, 따라서 효율적인 질의 처리를 보장하지 못한다. 본 논문에서는 데이타 내에 존재하는 모든 경로를 분할(partitioning)하고 질의 처리 시 질의에 맞는 분할 영역을 빠르게 찾아낼 수 있는 색인 그래프를 제안한다. 본 논문에서 제안하는 색인 그래프는 데이터 그래프의 크기와 상관없이 색인 그래프의 크기를 조절할 수 있다. 따라서 색인 그래프의 크기를 작게 구성함으로써 색인 그래프 탐색 비용을 크게 줄일 수 있다. 본 논문에서는, 실험을 통해 기존의 그래프 기반색인 기법들보다 본 논문의 색인 기법이 보다 효율적임을 보이고 색인의 크기 변화에 따른 성능 변화에 대해 알아본다.