• 제목/요약/키워드: XML Indexing

검색결과 111건 처리시간 0.028초

스키마 기반의 XML문서 관리 시스템 설계 (Design of XML Document Management System based on Schema)

  • 조윤기;김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.85-93
    • /
    • 2001
  • 정보화 사회로의 진행이 가속화됨에 따라 정보 양이 급격히 증가하면서 XML을 이용하여 정보를 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다. 그러나 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제에 대한 다양한 구조 검색을 효율적으로 지원하지 못한다. 따라서 이 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해OETID를 이용한 구조 정보 표현과 색인 기법을 제안한다. 또한 XML 문서의 구조 정보를 저장하기 위한 저장 기법과 검색 결과에 대한 문서통합 과정을 제안한다. 제안한 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현할 수 있을 뿐 아니라 간단한 연산으로 특정 엘리먼트에 직접적인 접근과, 다양한 질의 처리가 가능하다. 따라서 보다 효율적이고 빠른 검색을 지원할 수 있다.

  • PDF

XML 링크의 의미 속성을 이용한 개선된 검색 시스템을 위한 색인 기법에 대한 연구 (A Study on Indexing Method for Advanced Retrieval System using Semantics Attributes in XML Links)

  • 김은정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1855-1858
    • /
    • 2002
  • XML 문서에 대한 검색은 문서내 색인어 발생 빈도에 의한 내용 검색과 문서내 특정 엘리먼트에 의한 구조 검색 그리고 내용과 구조를 모두 검색하는 혼합 검색 등이 있다. 본 논문에서는 사용자의 질의에 대하여 문서에 의존하는 것이 아니라, 링크를 검색하여 특정 색인어에 대하여 가장 많은 링크를 설정 받은 문서 또는 특정 엘리먼트를 검색하는 새로운 검색 시스템을 설계한다. 이를 위해 XML 문서를 저장할 때 구조 정보와 함께 링크 정보를 저장하고 XML 링크에서 의미 속성인 ROLE, TITLE을 색인한다. 제안된 색인 모델에서는 정보를 찾는 사용자들의 질의를 보다 다양한 시각에서 검색할 수 있으며, 따라서 이러한 사용자들의 질의 유형과 그 처리 과정을 설명하고 의미를 분서한다.

  • PDF

XML 문서에 대한 효율적인 구조 기반 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure-based Retrieval on XML Documents)

  • 박종관;강형일;손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.18-20
    • /
    • 2000
  • XML 문서의 구조검색을 위한 기존 방법들은 특정 엘리먼트의 조상, 자손, 형제에 대한 다양한 구조검색을 효율적으로 지원하지 못한다. 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해 DTD(Document Type Definition)의 논리적 구조를 따르는 XML 문서에 대해 구조정보를 표현하기 위한 방법을 제시한다. 구조정보는 엘리먼트 이름을 식별할 수 있는 EID, 부모와 자식 엘리먼트간의 계층정보를 위한 ETID, 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 위한 SORD, 그리고 동일한 부모 엘리먼트를 갖는 자식들 중 동일한 타입의 엘리먼트들에 대한 순서정보를 위한 SSORD로 구성된다. 이런 구조정보를 이용해 빠른 검색을 위한 내용 색인, 구조 색인, 애트리뷰트 색인을 설계한다. 설계된 색인을 통하여 질의를 처리하는 과정을 설명함으로써 다양한 구조적 질의를 효과적으로 처리할 수 있음을 보인다.

  • PDF

깊이탐색과 노드간 최단거리를 이용한 XML 인덱싱 알고리즘 설계 및 구현 (Design and Implementation of XML-based Indexing Algorithm Using Depth-First and Shortest Distance Between Nodes)

  • 김광남;윤희병;김화수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.547-549
    • /
    • 2004
  • 웹기반 하에서 구조적인 정보를 표현하기 위해서 XML이 다양하게 사용되고 있으나 XML 기반 문서는 다양한 Schema와 노드의 표현으로 구성되어 있어서 이를 효율적으로 인덱싱 하여 저장하는 것은 매우 어려운 일이다 이를 해결하기 위하여 추상화, DTD, K-ary 완전트리 기법 등 다양한 연구가 이루어지고 있으나 응용에 많은 제한을 가지고 있다. 본 논문에서는 XML 기반의 웹문서를 효율적으로 인덱싱하고 사용자의 질의에 최적의 결과를 제공하기 위한 알고리즘을 설계 및 구현한다. 인덱싱 시스템 설계를 위해서 먼저 노드(부모 형제)의 ID를 추출하는 알고리즘을 제안하며, 문서 및 노드 테이블 설계 결과를 제시한다. 그리고 C#을 이용한 파싱과 인덱스 알고리즘을 구현하기 위하여 깊이탐색과 관계 노드간 최단거리를 이용하며, 알고리즘 실행 결과와 이 결과로 자동 생성된 문서 및 노드 테이블의 파싱 결과를 또한 제시한다.

  • PDF

XLink를 이용한 XML 문서의 인덱싱 기법 (Indexing Scheme for XLink in XML Documents)

  • 김선경;김성완;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2002
  • 인터넷의 급속한 발전과 더불어 대량의 정보를 효과적으로 표현 및 교환할 수 있는 표준으로 XML이 제정된 이후, XHL 문서의 저장과 검색을 위한 많은 연구들이 진행되고 있다. 한편, XML 문서간의 관계를 표현하기 위한 XLink가 제정되면서, XLlnk로 표현된 링크 정보를 이용하여 문서들을 효과적으로 검색할 수 있는 정보 검색 시스템에 대한 연구가 진행되고 있지만 그 성과가 미흡하다. 따라서 첫째, 본 논문에서는 링크 정보를 가지고 있는 XML 문서의 데이터 모델을 정의하고, 문서간 링크 정보가 가져야 할 링크 참조 무결성을 제안하였다. 둘째, 링크 정보를 이용한 질의 처리를 위해 제안한 모델과 최신 XLink 표준을 준수하여 테이블 형식의 링크 정보 인덱스 구조를 설계하였다.

  • PDF

XML 데이터의 2단계 인덱싱 기법 (Two-step Indexing Method for XML data)

  • 이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.333-335
    • /
    • 2009
  • XML은 웹2.0 환경에서 데이터의 저장과 전달을 위한 역할을 수행하는 필수적인 포맷으로 각광받고 있다. 특히 RSS나 ATOM과 같은 피드기술은 XML을 이용한 성공적인 사례로 인정받고 있다. 이러한 XML 포맷 데이터는 빠른 검색을 위해 경로기반 클러스터링 기법이나 내용기반 클러스터링 기법을 적용하는 것이 일반적이다. 하지만 클러스터링 기법을 적용할 때 주어지는 임계값에 따라 재현율이 변화하게 되고, 검색 결과에서 배제되는 데이터가 발생하게 된다. 이 논문에서는 기존 클러스터링 기법을 적용할 때 발생하는 데이터 배제현상을 보완하는 2단계 인덱싱 기법을 제안하고, 제안한 방법의 성능에 대해 분석한다.

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구 (A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML)

  • 양옥렬;이용주
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1025-1042
    • /
    • 2002
  • 본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

XMARS : XML 기반 멀티미디어 주석 및 검색 시스템 (XMARS : XML-based Multimedia Annotation and Retrieval System)

  • 남윤영;황인준
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.541-548
    • /
    • 2002
  • 본 논문에서는 XML을 이용하여 멀티미디어 데이터를 구조적으로 표현하고 효율적으로 추출하기 위한 XML 기반 멀티미디어 주석 및 검색 시스템을 제안한다. 이 시스템은 멀티미디어 데이터에 대한 주석이나 검색, 브라우징을 위한 그래픽 인터페이스를 제공하며 멀티미디어 정보를 표현하기 위해 계층적 메타데이터 모델을 기반으로 하여 구현되었다. 비디오에 대한 메타데이터는 MPEG-7 표준에 정의되어 있는 멀티미디어 서술 스키마를 기반으로 XML 스키마를 사용하여 작성하였다. 또한, 멀티미디어 데이터의 효율적인 인덱싱과 추출을 위하여 자막과 주석을 바탕으로 한 카테고라이징 기법을 사용한다.

분산 데이터 통합을 위한 색인기반의 매핑 시스템 (Mapping System based on Indexing for Integrating Distributed Data)

  • 설진안;김운용;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.436-438
    • /
    • 2003
  • 분산된 데이터는 이질적인 시스템 환경으로 인하여 공유하기 어렵고. 데이터의 형식 및 데이터 모델이 서로 다르게 정의되어 사용함으로서 통합하기 또한 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해 분산된 데이터를 XML문서로 변환한다. 또한 색인기법으로 문서의 구조 및 컨텐츠 정보를 추출하여 서로 다르게 정의된 의미정보를 데이터 사전과 비교하여 표준문서로 통할할 수 있는 색인 기반의 매핑 시스템에 대해 기술한다. 제안된 매핑 시스템은 DOM이나 SAX와 같은 표준 인터페이스를 사용하여 XML문서를 통합하는 것보다 효율적으로 통합할 수 있다.

  • PDF

XML 문서의 효과적인 색인방법을 위한 Order-Array의 사용 (An Efficient Indexing Method For XML Documents Using Order-Array)

  • 김영;안찬민;박상호;박선;이주홍;전석주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.77-80
    • /
    • 2004
  • 최근 XML은 전자상거래에서 의학, 국방, 법률 등의 전문분야에 이르기까지 많은 분야에서 활용되고 있으며, 데이터의 양 또한 방대해지고 있다. 따라서 대량의 XML 문서들을 효과적으로 저장하고 빠르게 검색할 수 있는 많은 인덱싱 기법들이 연구되고 있다. 최근의 인덱싱 기법들 중 Numbering Scheme 을 기반으로 한 인덱싱 기법들은 대부분의 검색에 우수한 성능을 보이나 하위노드의 수가 늘어나면 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서의 추가 삽입 및 구조가 다른 XML 문서의 삽입시에 인덱스와 데이터 값의 재조정에 따른 많은 비용이 발생하게 된다. 이에 우리는 Numbering Scheme 을 기반으로 하지만, 각 노드별로 노드범위(Node-Range)와 Order-Array를 추가하여 검색성능을 향상시키고 대량의 XML 문서의 삽입 및 구조가 다른 XML 문서의 삽입시에 발생되는 문제를 해결하고자 한다.

  • PDF