• 제목/요약/키워드: 엘리먼트 구조

검색결과 163건 처리시간 0.023초

XML 문서에 대한 효율적인 구조 기반 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure-based Retrieval on XML Documents)

  • 박종관;강형일;손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.18-20
    • /
    • 2000
  • XML 문서의 구조검색을 위한 기존 방법들은 특정 엘리먼트의 조상, 자손, 형제에 대한 다양한 구조검색을 효율적으로 지원하지 못한다. 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해 DTD(Document Type Definition)의 논리적 구조를 따르는 XML 문서에 대해 구조정보를 표현하기 위한 방법을 제시한다. 구조정보는 엘리먼트 이름을 식별할 수 있는 EID, 부모와 자식 엘리먼트간의 계층정보를 위한 ETID, 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 위한 SORD, 그리고 동일한 부모 엘리먼트를 갖는 자식들 중 동일한 타입의 엘리먼트들에 대한 순서정보를 위한 SSORD로 구성된다. 이런 구조정보를 이용해 빠른 검색을 위한 내용 색인, 구조 색인, 애트리뷰트 색인을 설계한다. 설계된 색인을 통하여 질의를 처리하는 과정을 설명함으로써 다양한 구조적 질의를 효과적으로 처리할 수 있음을 보인다.

  • PDF

엘리먼트 정보 기반의 플러그인 XSLT 편집기 (XSLT Plugin Editor Based on Element analysis)

  • 곽동규;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.751-753
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서가 다른 어플리케이션에서 재 사용될 경우, 사용자에게 동일한 정보를 제공하는데 있다. 문서를 변환하기 위해서는 변환 규칙을 정의해야 한다. 변환 규칙을 생성하기 위해서는 엘리먼트의 정보를 분석하여야 하는데 한 가지 방법으로는 엘리먼트의 정보를 분석하기 어렵다. 그러므로 본 논문은 변환 규칙을 생성하기 위한 엘리먼트 분석으로 다수의 방법을 사용할 수 있는 XSLT 편집기를 제안한다. 본 시스템은 XML의 구조적 특성인 엘리먼트의 포함 관계와 플러그인 방식으로 유사 엘리먼트를 분석하여 사용자에게 제공하는 방법을 보인다. XML의 엘리먼트 구조는 엘리먼트가 표현하고 있는 정보간의 구조와 동일한 구조로 포함되어 있다. 또한, 플러그인 방식 포함할 수 있는 모듈로는 문법적 특성을 이용한 방법을 포함하거나. semantic web의 정보를 이용하는 방법을 추가할 수 있다 또한 기존의 XSLT 처리기를 내장하고 있어 XSLT 문서를 변환 XML에 적용하여 피 변환 XML 문서를 생성할 수 있다. 제안하는 시스템은 기존의 사용자가 사용 패턴을 분석하여 엘리먼트를 분석하고 변환 규칙을 기술하는 방법과 달리 유사한 엘리먼트에 대한 정보를 사용자에게 제공하는 장점이 있다.

  • PDF

효율적인 구조 정보 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Information Retrieval)

  • 고혜경;조윤기;조정길;이병렬;구연설
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.649-651
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위한 구조적 색인 방법을 제안한다. 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제애 대한 다양한 구조검색을 효율적으로 지원하지 못하므로, XML 문서의 구조정보를 LETID(Labeled Element Type ID)로 표현하며 엘리먼트를 식별하고, 부모와 자식 엘리먼트간의 계층 정보와 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 나타낸다. LETID는 고정된 크기로 하며, 엘리먼트에 고유 ID를 부여하는 방식을 통해서 DTD의 논리적 구조를 분석할 때 부모 형제 노드를 직접적으로 찾을 수 있고 ID 값에 깊이정보가 포함되어 있기 때문에 고유번호만 보고 깊이를 알 수가 있다. 이 구조정보를 이용하여 빠른 검색을 위한 내용 색인 구조 색인 애트리뷰트 색인을 설계하고 설계된 색인을 통하여 질의를 처리하여 다양한 구조적 질의를 효율적으로 처리할 수 있다.

  • PDF

XML 문서에서 엘리먼트 타입을 이용한 구조적 검색 기법의 설계 (Design of Structural Retrieval Scheme Using Element Type in XML Documents)

  • 김성완;정헌석;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.584-586
    • /
    • 2003
  • XML 문서의 검색을 위한 많은 연구들이 수행되고 있지만 순수하게 구조적 관계성만을 대상으로 하는 검색 즉, 구조적 검색 처리 기법에 대해서는 많이 다루지 않고 있거나 XML 문서 트리에 대한 반복적인 순회를 기반으로 처리하는 방법들이 제안되었다. 또한, 사용자가 원하지 않는 엘리먼트들을 제외하기 위해서는 부가적인 필터링 과정을 필요로 한다. 한편, 대부분의 XML 문서의 검색 관련 연구들은 엘리먼트의 삽입 또는 삭제 등 XML 문서의 부분적인 갱신 및 변경이 발생하는 환경을 고려하지 않고 있다. 본 논문에서는 사용자로부터 주어지는 질의에 포함된 엘리먼트 타입 정보 이용하여 XML 문서 트리에 대한 순회를 없애거나 최소화시키고, 필터링 과정도 필요로 하지 않는 구조적 검색 기법을 설계한다. 또한, 엘리먼트의 삭제 및 삽입 등 동적인 변경에 빠르고 유연하게 대처할 수 있는 인덱스 구조를 설계하고 이를 기반으로 구조적 검색 질의의 주요 유형에 대한 처리 방안을 예를 들어 설명한다.

  • PDF

GDIT기반의 순수 구조 질의 처리를 위한 색인 구조에 대한 분석 (Analysis of Index Structures for Sturcture-based Retrieval on GDIT)

  • 정채영;김영자;김현주;배종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2000
  • 구조적 문서는 문서로의 다양한 접근 경로를 제공하므로, 구조적 문서들에 대한 정보 검색 시스템들은 문서의 구조를 사용한 구조 검색 질의를 지원하여 검색의 신뢰도를 높일 수 있다. 그러므로, 구조적 문서가 가지는 엘리먼트간의 구조적 포함관계나 순서등 문서 구조에 바탕을 둔 다양한 유형의 사용자 질의를 지원할 수 있는 색인 구조가 필요하다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계나 엘리먼트의 발생순서에 관련된 질의등 여러 유형의 순수 구조 질의를 처리할 수 있는 세가지 색인 구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 GDIT 개념[5]에 바탕을 두고, GDIT기반의 색인 기법을 사용한다.

  • PDF

구조 기반 검색을 위한 색인 구조에 대한 분석 (Analysis of Indexing Schemes for Structure-Based Retrieval)

  • 김영자;김현주;배종민
    • 한국멀티미디어학회논문지
    • /
    • 제7권5호
    • /
    • pp.601-616
    • /
    • 2004
  • 구조적 문서들에 대한 검색시스템은 구조 기반 검색 질의를 지원하여 다양한 수준의 검색 기능을 제공한다. 완전한 구조 기반 질의를 처리하기 위해서는 구조적 문서가 가지는 엘리먼트 간의 구조적 포함관계나 순서에 관한 정보를 유지되어야 한다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계와 엘리먼트의 발생순서에 관련된 질의 등 여러 유형의 순수 구조 질의를 처리할 수 있는 네 가지 색인구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 전체 문서 인스턴스 트리 개념에 바탕을 두고 있다.

  • PDF

색인된 XML 문서에서 레벨 정보를 이용한 효과적인 구조 조인 기법 (Efficient Structural Join Technique using the Level Information of Indexed XML Documents)

  • 이윤호;최일환;김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.641-649
    • /
    • 2005
  • 오늘날 인터넷의 발달과 함께 XML이 많이 사용됨에 따라, XML 저장소와 질의 처리에 관한 연구가 활발하게 이뤄지고 있다. XML에서는 경로 질의를 사용하는데, 이러한 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법이 각광을 받고 있다. 구조 조인 기법은 엘리먼트들의 포함 관계를 살펴 질의를 처리한다. 특히 문서 전체에 대한 탐색을 하지 않고 해당하는 엘리먼트들의 역색인 리스트만을 비교하여 질의 처리를 수행하는 장점을 갖는다. 하지만 구조 조인 기법은 실제 질의 결과에 포함되지 않는 불필요한 엘리먼트들도 탐색해야 하는 비효율성을 가진다. 따라서 본 논문에서는 구조 조인 기법의 성능을 개선하는 레벨 구조 조인 기법을 제안한다. 제안하는 기법은 경로 질의 내 엘리먼트 사이의 관계 정보와 XML 문서 내의 엘리먼트들의 레벨 분포 정보를 이용한다. 이를 통해 구조 조인을 수행할 때, 비교되는 역색인 리스트 내의 모든 엘리먼트들이 아닌, 특정 레벨에 해당하는 엘리먼트들만을 이용하여 비교를 수행함으로써 질의 처리의 속도를 향상시킬 수 있다.

엘리먼트 빈도수 정보를 이용한 XML 문서 매칭 (An XML Document Mathcing using Element Frequency Information)

  • 고승규;강명수;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.61-63
    • /
    • 2003
  • XML이 널리 사용됨에 따라 많은 정보가 XML 형태로 표현되고 있다. 또한 인터넷의 대중화로 다양한 정보를 통합하여 처리하거나 교환, 변환하는 경우가 빈번하게 발생한다. 따라서 XML로 표현된 정보도 교환되거나 통합되는 경우가 많이 발생하게 된다. 이와 같은 XML 문서 간의 통합이나 변환에서는 XML의 특징인 문서의 논리적인 구조가 적절하게 반영되어야 한다. 그리고 이를 위해서는 XML 문서의 기본적인 구성 요소인 엘리먼트 간의 매칭이 필수적이다. 기존의 XML 문서 매칭 기법에서는 엘리먼트 이름과 계층 정보 등 명시적으로 표현된 최소한의 정보만을 이용하여 매칭을 수행한다. 이러한 최소한의 제한된 정보를 최대로 이용하여 많은 매칭을 수행하기 위하여 기존의 방법에서는 동의어 사전이나 구조 정보를 과도하게 이용하는 경향이 많다. 따라서 많은 대응을 생성할 수 있지만 동시에 잘못된 대응의 수도 증가한다. 이에 본 논문에서는 명확한 대응을 생성 시키기 위하여 XML의 명시적인 정보 이외에 엘리먼트의 빈도수 정보로부터 엘리먼트 간의 연결성 정보를 정의하고, 이를 이용한 매칭 방법을 제안한다. 제안 방법은 엘리먼트 이름이나 계층 구조 등의 명시적인 정보뿐 아니라 엘리먼트의 연결성을 이용하기 때문에 매칭의 정확도가 향상될 수 있다. 최근에 발표되는 XML 기반의 표준들은 크기가 방대하고 점점 더 복잡해지고 있다. 이같은 환경에서는 잘못된 대응으로 인해 발생하는 비용이 무척 크다. 제안 기법은 매칭의 정확도가 높으므로 이러한 환경에서 좋은 성능을 발휘할 것으로 기대된다.

  • PDF

룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘 (XML Element Matching Algorithm based on Structural Properties and Rules)

  • 박형;정찬기
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.71-77
    • /
    • 2013
  • XML 스키마 매칭은 두 스키마의 엘리먼트들 간의 의미적인 유사성을 찾는 작업이다. XML 스키마 매칭은 스키마 통합, 데이터 통합, 데이터 웨어하우징, 데이터 변환, P2P 데이터 관리, 시멘틱 웹 등과 같은 응용체계에서 중요한 역할을 한다. 본 논문은 룰과 구조적 속성에 기반한 XML 엘리먼트 매칭 알고리즘을 제안한다. 제안한 알고리즘에서는 먼저 XML 문서의 구조적 속성을 이용하여 엘리먼트들이 unique와 non-unique로 분류되며, 이후 룰에 따라 엘리먼트의 매칭여부를 결정한다. 제안 알고리즘의 효과성을 보이기 위해 인터넷에 공개된 XML 스키마를 이용하여 성능을 평가하였다. 또한 제안 알고리즘은 문서의 구조적 속성을 이용함으로써 사용자 주관성을 배제하고 객관성을 보장하며 특정 유형이 아닌 다양한 형태의 XML에 적용이 가능하다.

XML 문서의 구조기반 검색성능 평가 (Performance Evaluation on Structure-based Retrievals of XML Documents)

  • 김수희
    • 한국산학기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.396-406
    • /
    • 2009
  • 이 논문에서는 XML 문서의 효율적인 구조검색을 위하여 기존의 연구에 이어 엘리먼트들의 순서를 명시하는 메타데이터들을 추가로 개발하였고, 이들을 바탕으로 구조기반 인덱싱 모델을 설계하였다. 설계한 구조검색 인덱스들은 문서의 계층구조에서 수직관계에 있는 엘리먼트들 뿐만 아니라 수평관계에 있는 엘리먼트들을 효율적으로 검색할 수 있게 한다. 제안한 구조기반 인덱스의 성능을 평가하기 위해 프로토타입 XML 문서 검색 시스템 개발하였고, XML 코퍼스를 대상으로 검색 실험을 수행하였다. 자손검색, 조상검색, 형제검색에서 ETID 모델보다 평균 검색 시간이 약 12% 정도 향상되었으며, 특정 엘리먼트 타입의 순서를 명시한 검색에서는 평균 검색 시간이 ETID 모델보다 25% 이상의 향상률을 보였다. 이것은 이 논문에서 제시한 Etype, Asso, LSSO를 이용한 검색이 엘리먼트의 순서를 명시한 검색 성능 향상에 큰 기여를 한 것으로 분석된다.