• 제목/요약/키워드: XML 문서 검색

검색결과 468건 처리시간 0.026초

XML 문서의 효율적인 저장구조와 색인 모델의 설계 (Design of Efficient Storage Structure and Indexing Model of XML Document)

  • 김은정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.301-303
    • /
    • 2002
  • XML 문서는 문서의 내용뿐 아니라, 의미를 가지는 구조 정보, 그리고 다양한 의미를 부과할 수 있는 링크 정보를 가지고 있다. 본 논문에서는 XML 문서를 보다 효율적으로 관리하기 위하여 DTD와 XML 문서에 대한 새로운 저장 방법과 이를 이용한 색인 모델을 제안한다. 이를 위해 하나의 XML 문서를 저장함에 있어, 엘리먼트 구조 정보, 애트리뷰트 정보, 링크 정보의 구성 방법을 제시하고, 이를 바탕으로 링크 정보론 이용한 내용 검색 색인 모델과 구조 검색, 애트리뷰트 검색을 위한 색인 모델을 설계한다. 또한 제안된 모델에서의 사용자들의 다양한 질의 유형의 처리 과정을 설명한다.

  • PDF

효율적 XML 문서 변경 및 검색을 위한 페이징 기법 (Paging Mechanism for Efficient XML Document Updates and Retrieval)

  • 연제원;이강찬;이규철;나중철;이미영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.99-101
    • /
    • 1999
  • 최근 들어 XML에 대한 연구가 늘어나면서, XML(eXtensible Markup Language)문서에 대한 저장/검색에 대한 다양한 방법들이 제시되고 있다. 특히 XML 문서의 구조적인 특성을 살리면서 문서의 저장 및 변경을 원활하게 지원할 수 있는 방안에 대한 요구가 늘고 있다. 기존의 저장관리 시스템을 위한 저장 모델로는 크게, XML 문서의 빠른 검색을 지원할 수 있는 가상분할모델(Virtual Fragmentation Model)과 문서에 대한 변경을 빠르게 지원해 줄 수 있는 분할모델(Decomposition Model)로 나누어 볼 수 있는데, 본 연구에서는 이 두가지 모델의 장점을 취합하여 문서의 검색 속도는 가상분할모델정도로, 문서의 변경속도는 분할모델정도로 빠르게 지원해 줄 수 있는 페이징(Paging)기법에 대해 설계하였다. 본 페이징 기법은 XML문서뿐만 아니라, HTML(HiperText Markup Language) 문서의 저장관리 시스템에서도 똑같이 적용될 수 있다. 본 연구의 후반부에서는 페이징 기법과 다른 기법에 대한 비교를 통하여 페이징 기법의 성능을 분석하였다.

  • PDF

XML 링크의 의미 속성을 이용한 개선된 검색 시스템을 위한 색인 기법에 대한 연구 (A Study on Indexing Method for Advanced Retrieval System using Semantics Attributes in XML Links)

  • 김은정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1855-1858
    • /
    • 2002
  • XML 문서에 대한 검색은 문서내 색인어 발생 빈도에 의한 내용 검색과 문서내 특정 엘리먼트에 의한 구조 검색 그리고 내용과 구조를 모두 검색하는 혼합 검색 등이 있다. 본 논문에서는 사용자의 질의에 대하여 문서에 의존하는 것이 아니라, 링크를 검색하여 특정 색인어에 대하여 가장 많은 링크를 설정 받은 문서 또는 특정 엘리먼트를 검색하는 새로운 검색 시스템을 설계한다. 이를 위해 XML 문서를 저장할 때 구조 정보와 함께 링크 정보를 저장하고 XML 링크에서 의미 속성인 ROLE, TITLE을 색인한다. 제안된 색인 모델에서는 정보를 찾는 사용자들의 질의를 보다 다양한 시각에서 검색할 수 있으며, 따라서 이러한 사용자들의 질의 유형과 그 처리 과정을 설명하고 의미를 분서한다.

  • PDF

XML 문서 관리 시스템의 순환적 DTD 구조 저장 기법 및 질의 변환 전략 (Method of storing nested DTD structure and Query translation strategy in XML Repository system)

  • 김정은;신판섭;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.299-301
    • /
    • 2000
  • XML은 문서의 구조를 독립적으로 작성할 수 있어 문서의 체계적인 구조화가 가능하다. 이러한 이유로 최근, XML 문서를 구조화하여 데이터베이스에 저장, 관리하는 XML 문서 관리 시스템 연구가 활발하다. XML 문서 관리 시스템은 XML의 구조 정보를 효과적으로 표현하기 위해 여러 가지 기법을 사용하고 있다. 그러나, 기존의 방법들은 XML 문서 구성에 따라 저장 스키마가 유동적이거나 문서 정보 검색의 제약을 가지고 있을 뿐만 아니라, DTD의 문서 구조가 순환 관계와 같이 복잡한 형태를 지닐 때, 그 구조를 적절히 반영하지 못하거나, 구조를 반영하더라도 검색 시, 모든 요소를 순차적으로 탐색해야 하는 등의 문제점을 지니고 있다. 따라서 본 연구에서는 XML의 내용이나 구성에 영향받지 않는 저장 스키마를 설계하고 정보검색의 제약을 해결가능한 경로 정보를 제안한다. 또한 순환 관계를 갖는 DTD의 구조 정보를 비 순환 구조 부분과 순환 구조 부분으로 분리, 정의하고 질의처리 시, 입력되는 XML-QL을 SQL로 변환하기 위하여 XML-QL의 패턴을 분류하고 이에 따른 중간 단계의 SQL을 정의하여 질의어 변환기법을 제안한다.

  • PDF

XML 문서의 효율적인 검색과 재사용성을 지원하는 데이터 모델 (New Data Model for Efficient Search and Reusability of XML Documents)

  • 김은영;천세학
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.27-37
    • /
    • 2004
  • 인터넷상에서 데이터를 표현하고 데이터를 서로 교환하기 위한 문서 표준으로 XML이 제시되고 있다. XML은 또한 웹상에 산재되어 있는 문서에 대한 쉬운 검색 및 재사용을 지원하는 문서 표준으로도 부각되고 있다. XML 콘텐츠 관리 시스템을 구현할 때 Semi-structured 데이터를 얼마나 효율적이고 효과적으로 검색 및 관리할 수 있는 가하는 점과 XML의 특징인 재사용성을 얼마나 지원해 줄 수 있는가를 고려해서 XML 데이터를 모델링 해야한다. 또한 모델링한 데이터를 어떻게 실질적으로 저장해야 할 것인 가도 고려해야 한다. 본 논문에서는 XML 문서의 데이터를 데이터 시스템에 저장하고 검색하기 위한 새로운 데이터 모델을 제안한다. 제안하는 데이터 모델은 XML 문서의 데이터 뷰와 구조 뷰를 모두 표현하며 XML 문서를 위한 새로운 데이터 시스템이나 기존의 관계형 시스템 모두를 고려한다.

  • PDF

XML 저장 및 검색 시스템에서의 XML 문서 추출 서브시스템의 설계 및 구현 (Design and Implementation of XML Publishing Subsystem in the XML Storage and Retrieval System)

  • 곽민성;홍석진;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.109-111
    • /
    • 2003
  • 관계형 데이타베이스에 저장되어 있는 데이타를 XML 문서로 추출하기 위해서는 데이블에 저장된 데이타를 XML 문서 형식에 맞는 계층적인 관계를 가지도록 구조화하는 과정이 필요하다. 본 논문에서는 관계형 데이타베이스를 사용하는 XML 저장 및 검색 시스템인 eXDM(embedded XML Database Management System)의 내부에서 구현한 XML 문서 추출 서브시스템에 대하여 기술한다. 이 시스템은 XML 문서에 대한 질의(XQuery)의 RETURN 절과 SORTBY 절을 분석하여, 관계형 데이타베이스에 저장되어 있는 데이타를 구조화하여 계층적인 구조를 가지는 XML 문서 형태로 추출한다.

  • PDF

인터넷 멀티미디어 전자 문서 질의 언어의 세계 (Design of A Query Language Internet Electronic Documents)

  • 김용훈;연제원;장동준;조정수;이강찬;이규철;김완석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.407-412
    • /
    • 1998
  • 21세기는 고도의 정보화 사회가 될 것이다. 이러한 정보화의 사회의 가장 중요한 요소는 수많은 문서 정보를 전자 문서로 만들고 관리하는 것인데, 최근 들어 OIS(Office Information System), 디지털 도서관, CALS/EC 등의 다양한 응용 분야에서 일한 전자 문서의 저장, 처리, 검색이 요구되고 있다. 이러한 상황에서 다양한 전자 문서의 표준들이 나오고 있고, 그 중 차세대 전자 문서의 표준의 선두로서 XML이 대두되고 있다. 따라서 최근에는 XML 문서를 저장하고 검색하는 다양한 응용들이 개발중이고, 이러한 응용들은 XML 문서의 다양한 문서 정보를 모두 만족할 수 있는 검색 기능들을 요구하고 있다. 본 논문에서는 이러한 다양한 XML 응용들의 요구에 따라서 XML 문서가 지닌 다양한 문서 정보에 대해서 검색할 수 있는 XML 질의 언어의 개발에 목적이 있다.

  • PDF

XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of XML Documents)

  • 정창후
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.595-598
    • /
    • 2007
  • XML 문서가 기하급수적으로 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

객체관계형 데이터베이스에 기반한 XML 문서 저장 및 검색 시스템의 설계 및 구현 (Design and Implementation of XML Documents Storage and Retrieval System based on Object-Relational Database)

  • 이성대;곽용원;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.183-193
    • /
    • 2003
  • XML은 e-비지니스와 많은 응용 프로그램 사이에서 정보를 교환하는 인터넷 표준으로 자리잡고 있다. 따라서 이러한 XML 문서를 효율적으로 관리하기 위해 데이터베이스를 사용하여 저장할 필요성이 있다. 본 논문에서는 객체관계형 데이터베이스를 기반으로 XML 문서를 저장하고 검색하는 시스템을 설계하고 구현하였다. XML 문서를 엘리먼트로 분해하고, 각 엘리먼트 타입에 따라 저장하는 방법을 사용하였다. 또한 저장된 XML 문서를 추출할 수 있는 다양한 형태의 검색을 가능하도록 하였다.

관계 데이터베이스 시스템 기반의 XQuery 질의 처리기 설계 (Design of XQuery Query Processor based on Relational Database System)

  • 장형화;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.106-108
    • /
    • 2003
  • XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고있다. XML 문서의 사용이 많아지면서 대용량의 XML 문서를 효과적으로 저장, 관리 및 검색하기 위한 시스템이 필요하다. 본 연구는 관계 데이터베이스 시스템(RDBMS)을 기반으로 XML 문서를 저장하고 검색할 수 있게 하기 위해서 Numbering 기법에 의한 XML문서 저장 기법을 사용하였다. XQuery 질의를 SQL문장으로 변환시켜서 수행함으로써 XML 데이터에 대한 검색을 가능하게 하였다.

  • PDF