• 제목/요약/키워드: XML 색인

검색결과 110건 처리시간 0.024초

S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법 (An Efficient Spatial Data Transformation Method Using Caching on S-XML Middleware)

  • 이동욱;장용일;박순영;오영환;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.47-50
    • /
    • 2005
  • 본 논문에서는 S-XML 미들웨어에서 캐싱을 이용한 효율적인 공간 데이터 변환 기법을 제안한다. 공간 데이터베이스 관리 시스템(SDBMS)을 기반으로 하여 S-XML 을 지원하는 시스템은 SDBMS 에서 사용되는 이진 데이터와 S-XML 간의 상호 변환 과정이 필요하다. 특히 변환 과정에서 공간 데이터는 비공간 데이터에 비해 데이터 크기가 크고, 복잡한 동시에 다양한 데이터 형식을 가지고 있어 비공간 데이터에 비해 변환 비용이 크다. 따라서 공간 데이터의 특성을 고려한 변환 비용 감소 기법이 필요하다. 제안 기법은 SDBMS 의 질의 처리 결과인 이진 데이터를 S-XML 문서로 변환하고, S-XML 미들웨어의 캐싱 관리자에서 공간 데이터에 해당하는 부분만을 캐싱 한다. 캐싱 관리자는 질의를 점 질의와 영역 질의로 구분한다. 점 질의의 결과에 대해서는 공간 데이터의 OID 를 키 값으로 하는 해쉬 색인을 사용하며, 영역 질의 결과에 대해서는 질의에서 표현된 MBR 에 따라 R-Tree 색인을 사용한다. 변환 과정에서 요구되는 공간 데이터가 캐싱된 데이터로 존재하면 질의 종류에 따른 색인을 사용하여 데이터를 추출하고 이를 S-XML 데이터로 치환한다. 캐싱 데이터를 이용한 공간 데이터 변환 기법에 의해 공간 데이터의 변환 비용을 줄임으로써 S-XML 미들웨어 에서의 변환 시간을 단축할 수 있다.

  • PDF

구조 유사도를 이용한 경로 기반의 색인 기법 (An Indexing Method based on the Path using Structure Similarity)

  • 김연혜;이재민;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.58-60
    • /
    • 2003
  • 기존의 웹 문서나 컨텐츠의 한계를 극복하기 위해 메타데이터에 대한 연구가 활발히 이루어진 가운데 그 산물로 등장한 XML은 현재 다양한 분야에서 그 활용에 관한 연구가 활발히 진행되고 있다. 그리고 그 중에서 XML문서 자체를 저장 및 검색하는 부분에 대한 연구도 많은 성과가 있었다. XML의 대표적인 특징은 기존의 다른 컨텐츠와는 달리 문서의 구조를 기술할 수 있다는 것이며 이런 구조적 정보는 활용 방법에 따라 XML문서의 다양한 처리에 있어 성능을 향상시키는 핵심적인 요소가 될 수 있다. 이에 본 논문에서는 기존의 비트맵 인덱스(Bitmap Index)를 확장하여 역파일 색인 방법과 결합시켜 P_INDEX를 제안하고, P_INDEX를 활용한 다양한 경로 중심의 검색 방법을 제시한다.

  • PDF

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

ODMG 객체 모델 기반의 XML 문서 저장 관리 시스템에 관한 연구 (A Study on XML Document Repository Management System using ODMG Object Model)

  • 박준범;박경우;오수열
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.16-23
    • /
    • 2003
  • XML 문서의 저장 및 관리를 위해, 기존의 관계형 DBMS를 이용해왔다. 그러나 관계형 DBMS를 이용할 경우 XML 문서 구조를 관계형 데이터베이스로 매핑할 때, 정보 손실이 발생할 수 있으며, XML의 특성을 완벽히 반영하는 새로운 저장 관리 시스템을 새로이 구현하는 것은 많은 비용이 소요된다. 본 논문에서는 이러한 문제점을 극복하고, XML문서의 구조적 특성을 충분히 반영하기 위해, 기존의 객체지향형 DBMS인 O2 DBMS를 기본 저장 구조로 이용하면서, XML문서가 가지고 시는 다양한 특징을 수용할 수 있도록 하는 XML문서 저장 관리 시스템을 설계하고 구현하였다. 구현한 XML문서 관리 시스템 기능들로서는 전자 문서에 대한 라이브러리 서비스 기능(체크인/체크아웃, 버전제어, 사용자 액세스 관리 등), 동적 색인 및 구조 정보 검색 기능. 스타일시트를 이용한 출판 기능을 하는 XML문서 저장 관리 시스템이다.

  • PDF

분산 데이터 통합을 위한 색인기반의 매핑 시스템 (Mapping System based on Indexing for Integrating Distributed Data)

  • 설진안;김운용;정계동;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.436-438
    • /
    • 2003
  • 분산된 데이터는 이질적인 시스템 환경으로 인하여 공유하기 어렵고. 데이터의 형식 및 데이터 모델이 서로 다르게 정의되어 사용함으로서 통합하기 또한 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해 분산된 데이터를 XML문서로 변환한다. 또한 색인기법으로 문서의 구조 및 컨텐츠 정보를 추출하여 서로 다르게 정의된 의미정보를 데이터 사전과 비교하여 표준문서로 통할할 수 있는 색인 기반의 매핑 시스템에 대해 기술한다. 제안된 매핑 시스템은 DOM이나 SAX와 같은 표준 인터페이스를 사용하여 XML문서를 통합하는 것보다 효율적으로 통합할 수 있다.

  • PDF

효율적인 구조 정보 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Information Retrieval)

  • 고혜경;조윤기;조정길;이병렬;구연설
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.649-651
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위한 구조적 색인 방법을 제안한다. 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제애 대한 다양한 구조검색을 효율적으로 지원하지 못하므로, XML 문서의 구조정보를 LETID(Labeled Element Type ID)로 표현하며 엘리먼트를 식별하고, 부모와 자식 엘리먼트간의 계층 정보와 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 나타낸다. LETID는 고정된 크기로 하며, 엘리먼트에 고유 ID를 부여하는 방식을 통해서 DTD의 논리적 구조를 분석할 때 부모 형제 노드를 직접적으로 찾을 수 있고 ID 값에 깊이정보가 포함되어 있기 때문에 고유번호만 보고 깊이를 알 수가 있다. 이 구조정보를 이용하여 빠른 검색을 위한 내용 색인 구조 색인 애트리뷰트 색인을 설계하고 설계된 색인을 통하여 질의를 처리하여 다양한 구조적 질의를 효율적으로 처리할 수 있다.

  • PDF

단락을 분류에 따른 XML 키워드 가중치 결정 기법 (An XML Keyword Indexing Method Using on Lexical Similarity)

  • 정혜진;김형진
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2008년도 춘계학술발표논문집
    • /
    • pp.205-208
    • /
    • 2008
  • 보다 효과적인 키워드 추출 및 키워드 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 단락별 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 일반적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 자동색인을 위하여, 논문을 구성하는 주요 단락을 세분하고, 단락에서 추출된 용어의 가중치를 갱신해 가면서 최종 색인어 가중치를 계산하는 방법을 제안한다.

  • PDF

기업간통합 XML 메시지의 기록과 색인을 위한 저장 방식 (A Storage Scheme for Logging and Indexing B2Bi XML Messages)

  • 송하주;김창수;권오흠
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권5호
    • /
    • pp.416-426
    • /
    • 2005
  • 기업간통합(business-to-business integration; B2Bi) 시스템은 XML 메시지의 송수신 내역을 고속으로 기록하고 검색할 수 있는 메시지 저장시스템이 필요하다 XML 전용데이타베이스 시스템 또는 XML 데이타타입을 지원하는 관계형데이타베이스는 도입 비용과 기능의 과도함 때문에 메시지 저장시스템으로는 적합하지 않다. XML 데이타를 관계형데이타베이스의 레코드로 분산시켜 저장하는 저장 방식 또한 수행 성능이 떨어지거나 구현이 복잡하므로 사용하기 어렵다. 이에 본 논문은 관계형데이타베이스를 사용하여 메시지 저장시스템을 구현하기 위한 단순한 구조의 메시지 저장 방식을 제안한다. 제안하는 저장방식은 메시지 타입별로 색인필드를 등록하고 색인필드를 통해서만 메시지를 검색한다. 따라서 XQL과 같은 강력한 검색 기능은 지원하지 못하나 비교적 단순한 저장 구조만으로도 고속의 메시지 기록과 제한된 형태의 메시지 검색이 가능하다 제안하는 저장방식을 구현하기 위해서는 세 가지의 데이타베이스 스키마를 사용할 수 있으며 실험 평가를 통해 이들 세 가지의 스키마가 가지는 성능상의 장단점을 평가한다.

구조화 문서 검색을 위한 다단계 역색인 기법 (A Multi-level Inverted Index Technique for Structural Document Search)

  • 김종익
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.355-364
    • /
    • 2008
  • XML로 대표되는 구조화된 문서의 검색을 위해서는 구조 조인 기법이 많이 사용되며 구조 조인 기법을 사용하기 위해서는 구조 조인에 참여하는 엘리먼트들을 추출하는 과정이 선행되어야 한다. 이 과정을 위해서 일반적으로 동일한 태그 값을 가지는 엘리먼트들을 리스트 형태로 추출해 주는 역색인을 사용한다. 하지만 이러한 기존의 기법은 경로 질의 내의 부모-자식 관계나 조상-후손 관계를 비교적 비용이 비싼 구조 조인으로 모두 처리해야 하기 때문에 경로의 길이가 길어질수록 질의 처리 비용이 크게 증가하는 단점을 가지고 있다. 본 논문에서는 기존의 역색인과는 달리 엘리먼트 추출과정에서 부모-자식 관계에 있는 엘리먼트들을 처리할 수 있는 단계별 역색인을 제안한다. 본 논문에서 제안하는 단계별 역색인은 경로 질의 내의 부모-자식 관계를 가지는 엘리먼트 쌍(pair)들의 리스트를 추출해 준다. 또한 단계별 역색인으로부터 추출된 엘리먼트 쌍들의 리스트를 처리하기 위해 기존의 구조 조인과는 다른 변형된 구조 조인 기법을 제안하며 실험을 통해 제안된 기법이 기존의 기법보다 2배에서 4배 가량의 성능향상이 있는 것을 확인하였다.

XML 기반 멀티 미디어 데이터의 효과적인 검색을 위한 색인 모델 (An Indexing Model for Effective Retrieval of Multimedia Data Based on XML)

  • 고은경;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1895-1898
    • /
    • 2002
  • 웹 환경에서 처리하는 데이터의 종류가 텍스트에서 비디오, 오디오와 같은 멀티미디어 데이터까지 다양해지면서 데이터를 효율적으로 표현, 저장 및 검색하기 위한 다양한 방법이 연구되고 있다. 이 논문에서는 동영상 데이터의 구조적인 형태를 고려하여 XML 문서로 표현하고 XML 문서를 데이터베이스에 저장하기 위한 데이터베이스 스키마를 설계하였다. 그래서 XML 문서내의 각 노드에 엘리먼트의 고유성을 나타내기 위한 고유식별자와 부모노드와 자식노드들 간의 관계를 표현하여 주기 위한 엘리먼트 식별자와 ETID를 결합하여 멀티미디어 데이터에 대한 XML 문서의 부모와 자식의 관계를 표현하여 준다. 그리고 부모가 같은 형제간의 순서 정보와 형제들 간의 동일한 타입을 구별하고 정보를 표현하기 위한 관계 테이블을 설계하였다.

  • PDF