• 제목/요약/키워드: XML 문서 검색

검색결과 468건 처리시간 0.03초

대용량 XML 문서의 효율적인 검색과 관리를 위한 SCOF 모델 (Service-centric Object Fragmentation Model for Efficient Retrieval and Management of Huge XML Documents)

  • 정창후;최윤수;진두석;김진숙;윤화묵
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.103-113
    • /
    • 2008
  • XML 문서가 증가하면서 XML 문서를 처리하는 방법론에 대한 많은 논의가 있어왔다. 본 논문에서는 두 가지 중요한 목적을 가지고 XML 정보 검색 및 관리 시스템을 개발하는데, 첫 번째는 질의에 적합한 내용을 쉽고 빠르게 검색해서 제공하는 것이고, 두 번째는 시스템의 부담을 최소화하면서 효율적이고 안정적인 관리 기능을 제공하는 것이다. 이렇게 실용적인 시스템을 개발하는 핵심 기술은 XML 문서를 어떻게 효과적으로 분할하여 구조적으로 서비스하는가에 달려 있다. 이러한 목적을 달성하기 위하여 본 논문에서는 SCOF(Service-centric Object Fragmentation) 모델을 제안한다. SCOF 모델은 XML 데이터 베이스 관리자에 의해서 정의되는 변환 규칙(conversion rule)을 이용하여 문서를 분할하는 준분할(semi-decomposition) 저장 방식이다. SCOF 모델을 사용한 키워드 기반 검색은 전형적인 XML 질의 언어처럼 문서의 특정 엘리먼트나 속성 값을 이용하여 검색을 수행할 수 있다. 비록 이러한 접근법이 XML 문서 컬렉션에 대한 관리자의 지식을 필요로 한다고 하더라도, 개별 문서의 크기나 전체 문서의 양에 상관없이 검색과 관리를 효율적으로 수행할 수 있기 때문에 실용적인 시스템을 구축할 수 있다는 장점이 있다.

  • PDF

유사 구조를 갖는 XML 문서 생성기의 설계 및 구현 (Design and Implementation of XML Document Generator with Similar Structure)

  • 이범석;이재민;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.163-165
    • /
    • 2004
  • 여러 장점을 가지고 점차 그 사용이 증가하고 있는 XML은 내용뿐만 아니라 그 구조적 정보까지 포함하고 있는 특징을 가지고 있는데, 이러한 XML 문서를 효율적으로 검색하기 위해 구조 유사성을 기반으로 하는 검색 기법이 개발되고 있다. 새롭게 개발되는 유사한 구조의 XML 문서를 검색하는 시스템의 성능 평가를 위해서는 구조적으로 유사한 다량의 XML 데이터가 필요하다. 본 논문에서는 지금까지 개발되었던 유사 구조 문서 생성기를 바탕으로 사용자가 원하는 데이터 구조를 생성하는데 보다 효과적인, 유사 구조를 갖는 XML 문서 생성기인 xTrans를 설계 및 구현한다. xTrans는 원본 XML 문서에 삽입, 삭제, 치환의 세 가지 연산을 이용하여 사용자가 원하는 일정한 비율만큼의 구조적 변화를 일으키는데, 그러한 연산은 불규칙한 위치에서 생성되므로, 같은 비율의 변화가 일어난 여러 개의 유사 구조 문서를 생성할 수 있다. 사용자는 각 연산의 변형 비율을 지정해주어 원하는 만큼 변형시킨 문서를 생성하고, 이 문서들을 이용하여 새롭게 개발되는 유사 구조 문서 검색 시스템의 성능평가에 활용할 수 있다.

  • PDF

XML 문서에서 엘리먼트 타입을 이용한 구조적 검색 기법의 설계 (Design of Structural Retrieval Scheme Using Element Type in XML Documents)

  • 김성완;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.584-586
    • /
    • 2003
  • XML 문서의 검색을 위한 많은 연구들이 수행되고 있지만 순수하게 구조적 관계성만을 대상으로 하는 검색 즉, 구조적 검색 처리 기법에 대해서는 많이 다루지 않고 있거나 XML 문서 트리에 대한 반복적인 순회를 기반으로 처리하는 방법들이 제안되었다. 또한, 사용자가 원하지 않는 엘리먼트들을 제외하기 위해서는 부가적인 필터링 과정을 필요로 한다. 한편, 대부분의 XML 문서의 검색 관련 연구들은 엘리먼트의 삽입 또는 삭제 등 XML 문서의 부분적인 갱신 및 변경이 발생하는 환경을 고려하지 않고 있다. 본 논문에서는 사용자로부터 주어지는 질의에 포함된 엘리먼트 타입 정보 이용하여 XML 문서 트리에 대한 순회를 없애거나 최소화시키고, 필터링 과정도 필요로 하지 않는 구조적 검색 기법을 설계한다. 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조를 설계하고 이를 기반으로 구조적 검색 질의의 주요 유형에 대한 처리 방안을 예를 들어 설명한다.

  • PDF

XML 문서선별과 질의확장을 위한 자동화 모듈 개발 (XML Document Selection and Query Expansion Modules)

  • 김명숙;권혁돈;공용해
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.455-458
    • /
    • 2004
  • 본 연구는 다양한 형식을 가지는 XML 문서의 효율적인 정보검색을 위한 다음과 같은 자동화 모듈들을 개발하였다 구현된 모듈은 XML 문서를 획득하는 문서추출 모듈, 온톨로지를 이용한 포괄적 DTD 생성 모듈 생성된 포괄적 DTD와 XML 파서를 이용하여 정보검색 대상 XML 문서를 사전에 선별하는 문서여과 모듈, XML 질의를 확장하는 질의확장 모듈, JDOM의 XPath를 이용한 질의엔진 모듈로 구성된다. 이와 같이 구현한 모듈들을 샘플 XML 문서에 적용하여 XML 문서추출, DTD 생성, 문서여과, 질의확장, 질의엔진의 효과를 실험하였다.

  • PDF

ORDBMS를 이용한 XML 저장 시스템 설계 (Design of XML Document Storage System Using ORDBMS)

  • 한상웅;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.3-5
    • /
    • 2000
  • XML은 최근 인터넷상에서 정보 교환의 표준으로 자리잡고 있다. 따라서, 그동안 semistructured date와 XML 데이터를 데이터베이스에 저장하고 검색하기 위한 많은 연구들이 진행되어 왔다. 본 논문에서는 기존에 개발된 RDBMS를 이용한 시스템과 OODBMS를 이용한 시스템의 장단점을 수용하여 ORDBMS상에서 XML 문서를 저장하고 검색할 수 있는 시스템을 설계하였다. 이 시스템은 DTD 독립적인 XML 문서를 저장하기 위해 스키마와 분할저장 방법을 이용하여 임의의 XML 문서를 저장하고 저장된 문서의 갱신을 용이하게 처리할 수 있도록 하였다. 전체적인 시스템은 웹상에서 문서를 저장, 검색할 수 있는 웹 기반 시스템과 XML을 이용하는 응용프로그램의 데이터베이스 연동을 지원하는 응용기반 시스템으로 구분하였다.

  • PDF

구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법 (The study of integration techniques for storing XML documents efficiently based on structures and semantics)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

DTD 여과 및 질의 확장에 의한 효율적인 XML 문서의 정보 검색 (Efficient XML Information Search through DTD Filtering and Query Expansion)

  • 김명숙;이경수;공용해
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.499-502
    • /
    • 2004
  • 본 논문은 정보검색의 대상이 되는 XML 문서를 효율적으로 선별하기 위해 온톨로지를 기반으로 XML 문서를 여과하였으며, 여과된 XML 문서를 대상으로 문서에 내재한 정보를 효과적으로 검색하도록 XML 질의를 확장하였다. 이를 위해, 온톨로지로부터 포괄적 DTD를 생성하는 알고리즘을 개발하였고, XML 문서의 효과적인 정보 검색을 위해 온톨로지의 개념 구조와 연관 관계를 분석하여 XML 질의를 확장하는 알고리즘을 개발하였다. 제안한 문서 여과와 질의 확장 알고리즘의 효과를 샘플 XML 문서에 적용하였다.

  • PDF

링크 질의를 통한 XML 문서의 검색 기법 (Retrieval Scheme of XML Documents Using Link Queries)

  • 문찬호;강현철
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.313-326
    • /
    • 2001
  • Web 문서를 기술하기 위해 차세대 표준으로 제안된 XML은 Web 기반의 여러 응용 분야에서 널리 사용되고 있으며, Web 상의 XML 문서들은 서로 하이퍼링크를 통해 연결되어 있다. 현재까지 대부분의 XML 관련 연구들은 XML 문서의 효율적인 저장, 관리 및 검색을 위한 XML 저장 시스템을 대상으로 하고 있으며, XML 링크를 지원하는 질의어의 개발이나 링크를 활용한 XML 검색 시스템의 개발에 대한 연구는 미흡하다. 본 논문에서는, XML 링크 질의 표현을 위한 XML 질의어의 확장과 링크 질의 처리 기법을 제시한다. 링크 질의는 하나의 XML 문서(질의 문서)와 질의 문서 내의 링크로 참조되는 XML 문서(참조 문서)들의 내용을 검색하는 것이다. 참조 문서의 검색을 위해서 현재는, 참조 문서에 대한 질의를 수작업으로 생성, 처리, 그리고 그 결과의 리턴을 반복적으로 수행하는 방법이 사용되고 있다. 본 논문의 링크 질의 처리 목적은 한번의 질의 입력을 통해 추가적인 수작업 없이 참조 문서(들)에 대한 검색 결과까지 얻을 수 있는 기능을 제공하는 것이다. 기존 수작업 기반과 본 논문의 링크 질의 처리의 성능을 비교, 분석한 결과, 참조 문서로의 링크가 많을수록 수작업 기반에 비하여 질의 처리 시간이 줄어들고, 질의 문서가 저장된 사이트에 참조 문서가 많이 있을수록, 질의 처리 시간이 줄어들었다.

  • PDF

분할 저장 시스템에 적합한 XPath 질의 처리기 설계 (Design of XPath Query Processor in Decomposition Storage System)

  • 고영기;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.52-54
    • /
    • 2002
  • 인터넷에서 XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고 있으며 XML문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 따라서, XML 문서를 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구는 관계형 데이터베이스(RDBMS)를 통하여 XML문서를 저장하고 검색할 수 있게 하기 위해 XPath 질의어에 적합하도록 하부 저장 스키마를 설계하였다. 그리고, XPath 질의를 SQL문으로 변화시켜 수행함으로써 XML 데이터에 대한 접근을 허용하였다. 더욱이 SQL문 수행 후의 결과를 효율적으로 DOM 형식의 XML 문서를 생성시킴으로써 문서의 재 조작을 가능하게 하였다.

  • PDF