• 제목/요약/키워드: 대용량 XML 문서

검색결과 49건 처리시간 0.026초

역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색 (Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes)

  • 문경원;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

객체 관계 데이터베이스 시스템과 하이브리드 오더 인코딩을 이용한 XML 저장 시스템 설계 및 구현 (Design and Implementation of XML Storage System using Object Relational Database System and Hybrid Order Encoding Method)

  • 김영우;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.154-156
    • /
    • 2005
  • 인터넷의 발전은 다양한 데이터의 폭발적인 증가를 가져왔다. 유연하고 효과적인 데이터 표현 능력을 지닌 XML이 인터넷 환경에서 데이터 표현 및 교환 수단으로 여러 분야에서 표준으로 활용되고 있다. 그래서 대용량 XML 문서의 저장 및 관리에 대한 연구의 필요성이 증가하였다. 현재 다양한 XML 저장 기법과 XQuery를 이용한 XML 질의 처리에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 객체 관계 데이터베이스 시스템을 이용하여 대용량 XML 문서 처리에 적합하도록 XML 저장 시스템을 설계 및 구현하였다. 또한 하이브리드 오더 인코딩 기법을 이용하여 저장된 XML 문서의 갱신 성능과 XML 질의 처리 성능을 개선하였다. 그리고 XBench를 이용하여 생성한 대용량 XML 문서로 XML 저장 시스템의 성능을 평가하고 분석하였다.

  • PDF

대용량 XML 문서의 키워드 검색을 위한 레이블링 기법 (A Labeling Methods for Keyword Search over Large XML Documents)

  • 선동한;황수찬
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.699-706
    • /
    • 2014
  • XML 문서가 점차 복잡해지면서 XML문서의 구조를 알 필요 없이 키워드로만 검색을 하는 키워드 검색 방식이 많이 사용되고 있다. XML문서 내에서 키워드 검색 방식을 사용하기 위해서는 문서 내의 모든 키워드에 레이블을 부여해야 하며, 구조적인 정보 또한 레이블 내에 충분히 표현해야한다. 하지만 기존 레이블링 방법들은 색인을 위한 단순정보만 레이블링 하거나, 증가하는 XML문서의 크기에 대응하기 어려운 형태로 구조적인 정보를 표현한다. 이는 XML문서가 커질수록 키워드검색성능이 떨어지거나, 공간 사용량이 기하급수적으로 증가하는 문제를 야기한다. 따라서 본 논문에서는 대용량 XML문서에 대한 키워드 검색 시 기존 레이블링 방식이 가지고 있던 문제점을 보완하는 새로운 레이블링 방식인 RPLS(Repetitive Prime Labeling Scheme)을 소개한다. 이 방법은 기존 소수 레이블방식을 개선하여 상위 레벨의 소수를 하위 레벨에서 반복 사용할 수 있도록 하여 레이블링을 위해 생성해야하는 소수의 수를 감소시키도록 한 것이다. 본 논문에서는 대용량 XML 문서의 키워드검색에 대한 RPLS 스킴의 효율성 검증을 위해 기존 레이블링 기법들과의 성능 비교 실험 결과도 제시한다.

대용량 XML 문서 처리를 위한 기본도구

  • 채진석
    • 디지털콘텐츠
    • /
    • 9호통권76호
    • /
    • pp.19-21
    • /
    • 1999
  • XML을 여러 응용에서 활용하기 위해서는 문서 작성을 도와주는 도구 및 관련 S/W들이 필요하다. 여기서는 XML문서 처리의 가장 기본이 되는 XML파서와 DTD편집기, XML편집기, XSL 편집기 등의 저작 도구를 설명하고, 일반적인 XML문서를 위한 브라우저와 수학, 화학, 음악 등 특수 분야의 브라우저에 대해 소개한다.

  • PDF

멀티미디어 데이터에 대한 XML문서 저장관리 시스템 설계 및 구현 (A Design and Implement of XML Document Storage Management System for Multimedia Data)

  • 안영희;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1875-1878
    • /
    • 2002
  • 인터넷이 정보의 바다가 된 오늘날에 많은 정보를 효과적으로 표현하기 위해 텍스트뿐만 아니라 이미지 동영상등 멀티미디어 데이터의 표현이 많이 사용되고 있다. 이러한 대용량의 멀티미디어 데이터가 증가함에 따라 대용량의 데이터를 효과적으로 처리하고 저장하기 위한 많은 연구개발이 이루어지고 있다. 본 논문에서는 웹의 표준인 XML을 이용하여 비디오 데이터를 XML 문서로 표현하고 관계형 데이터베이스에 XML 문서를 저장할 수 있는 스키마를 생성한다. 그리고 생성된 스키마를 이용하여 관계형 데이터베이스를 기반으로 하는 XML문서 저장관리 시스템을 구현한다.

  • PDF

XML 구성요소의 릴레이션으로의 변환 (Transferring XML Documents to Relational Scheme)

  • 신병주;진민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.35-38
    • /
    • 2001
  • XML 문서의 사용이 급속도로 증가함에 따라 대용량의 XML 문서를 저장, 관리하는 기술이 요구되고 있다. XML 문서를 저장, 관리방법으로 RDBMS가 현실적으로 가장 효과적인 방법이다. 그러나, XML의 구성요소와 RDBMS의 구성요소간의 차이로 인해 XML 문서를 RDBMS에 저장하기 위해서는 특별한 저장방법이 제공되어야 한다. 따라서, 본 논문은 이와 같은 XML과 RDBMS 구성요소간의 불일치에서 오는 문제점들을 해결하고 효율적인 질의처리가 가능하도록 XML의 각 구성요소들에 대한 저장방법을 제시한다.

  • PDF

문서 단위 순위화를 통한 XML 문서에 대한 키워드 검색 성능 향상 (Accelerating Keyword Search Processing over XML Documents using Document-level Ranking)

  • 이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.538-550
    • /
    • 2006
  • XML 문서에 대한 키워드 검색은 사용자로 하여금 XML 문서의 복잡한 구조에 관한 지식 없이 쉽게 정보를 검색할 수 있게 해준다. 또한 사용자의 정보 요구에 대해 해당 정보를 포함하는 문서 전체를 반환하는 기존의 정보 검색 시스템과 달리 문서 내의 해당 정보를 포함하는 문서 조각을 결과로 반환함으로써 보다 빠르게 원하는 정보를 얻을 수 있도록 도와준다. 이러한 특징은 XML 문서 검색 시스템이 XML 문서를 문서 단위가 아닌 세부적인 엘리먼트 단위로 처리함으로써 가능하다. 하지만 이로 인해 대용량 문서들에 대한 질의 처리 부담 역시 가중되었다. 본 논문에서는 엘리먼트 단위 질의 처리의 비용을 줄이기 위해 XML 문서에 대한 문서 단위 순위화 기법을 제안하는데, 이는 결과물의 점수에 영향을 미치는 질의 키워드들의 문서 내에서의 근접도를 경로 노드 집합 정보와 이에 대한 유사도를 통해 구함으로써 엘리먼트 단위 질의 처리 결과를 예측하고 문서 단위 점수를 계산한다. 이러한 문서 중심의 뷰는 대용량 문서에 대한 순위화 혹은 필터링을 가능하게 해주며, 우리는 문서 단위 인덱스를 통해 순위가 높은 문서를 우선적으로 처리함으로써 Top-k 질의에 대해 검색 성능을 높였으며, 실험을 통해 해당 기법의 유효성과 성능 향상을 검증하였다.

관계 데이터베이스 시스템 기반의 XQuery 질의 처리기 설계 (Design of XQuery Query Processor based on Relational Database System)

  • 장형화;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.106-108
    • /
    • 2003
  • XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고있다. XML 문서의 사용이 많아지면서 대용량의 XML 문서를 효과적으로 저장, 관리 및 검색하기 위한 시스템이 필요하다. 본 연구는 관계 데이터베이스 시스템(RDBMS)을 기반으로 XML 문서를 저장하고 검색할 수 있게 하기 위해서 Numbering 기법에 의한 XML문서 저장 기법을 사용하였다. XQuery 질의를 SQL문장으로 변환시켜서 수행함으로써 XML 데이터에 대한 검색을 가능하게 하였다.

  • PDF

버저닝을 지원하는 XHL 저장관리시스템 설계 및 구현 (Design and Implementation of an XML Repository System Supporting)

  • 손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.220-222
    • /
    • 2001
  • 최근 웹을 이용한 전자문서의 중요성이 부각되면서 대용량의 XML 문서에 대해 효율적으로 저장하고, 검색하며, 관리할 수 있는 XML, 저장관리 시스템의 연구가 활발히 진행되고 있다. XML 응용 중에서 특허문서 관리, 소프트웨어 설계, 시스템 매뉴얼 등의 응용과 같이 수정된 기존의 문서들이 관리되어야 하는 분야에서 버전 관리 기능이 필요하다. 본 논문에서는 문서의 수정을 효율적으로 지원하는 분할모델을 이용하여 문서 수정에 따른 버저닝을 지원하는 데이터 모델을 제안하고, 버저닝을 지원하는 XML 저장관리 시스템을 설계하고 구현한다.

  • PDF

XML 기반의 컨텐츠 관리 시스템의 설계 및 구현 (Design and Implementation of a Contents Management System based on XML)

  • 이상준;최한석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.575-577
    • /
    • 2003
  • XML은 1996년 W3C(World Wide Web Consortium)에서 제안한 것으로서, 웹 상에서 구조화된 문서를 전송 가능하도록 설계된 표준이며, 기존 HTML의 한계를 극복하고 SGML의 복잡함을 해결하는 방안으로 등장하게 되었다. 최근 다양한 형태의 문서들을 XML로 전자 문서화하여 관리하려는 시도가 전자상거래, 전자도서관, 전자 정부, 기술 문서 관리 등의 다양한 응용분야에서 급격히 증대되고 있다. 본 논문에서는 이러한 인터넷/인트라넷 환경에서 급격히 늘어나고 있는 대용량의 XML 문서를 구조정보와 함께 저장 관리하고. 고성능 구조검색을 지원하는 시스템을 설계하고 구현한다.

  • PDF