• 제목/요약/키워드: XML Query

검색결과 357건 처리시간 0.034초

XML 기술과 스트링 매칭 기법을 이용한 구조 기반 정보 검색 알고리즘 (Structure Based Information Retrieval Algorithm Using XML Technology and String Matching Algorithm)

  • 한기덕;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.171-176
    • /
    • 2007
  • Parsing 작업의 결과인 Parse Tree 정보는 문장에 관한 구조적 정보를 가지고 있는 Tree 정보로 이 정보를 이용하여 정보 검색에 활용하는 알고리즘을 제안한다. 제안하는 알고리즘은 XML 기술과 스트링 매칭 기법을 이용하였으며, 사용한 스트링 매칭 기법은 Approximate String Matching 기법이다. Query 정보와 문서 정보를 Parsing하여 얻은 Parse Tree를 XML 형태의 정보로 변환한 후, 두 정보를 가지고 Approximate String Matching 기법을 적용하여 Query 정보와 문서 정보 간의 유사도를 계산한다. 제안하는 알고리즘의 장점은 구조 기반의 정보 검색 기능이 가능하고 비슷한 정보에 대한 검색 기능이 가능하며 비슷한 구조에 대한 검색 기능이 가능하다는 것이다.

  • PDF

MPI: A Practical Index Scheme for XML Data in Object Databases

  • Song Ha-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.729-734
    • /
    • 2005
  • In order to access XML data stored in object databases, an efficient index scheme is inevitable. There have been several index schemes that can be used to efficiently retrieve XML data stored In object databases, but they are all the single path indexes that support indexing along a single schema path. Henee, if a query contains an extended path which is denoted by wild character ('*'), a query processor has to examine multiple index objects, resulting in poor performance and inconsistent index management. In this paper, we propose MPI (Multi-Path Index) scheme as a new index scheme that provides the functionality of multiple path indexes more efficiently, while it uses only one index structure. The proposed scheme is easy to manage since it considers the extended path as a logically single schema path. It is also practical since it can be implemented by little modification of the B -tree index structure.

  • PDF

경로 정보 축약 레이블링 기법을 이용한 효율적인 XML 분기 질의 처리 (Efficient XML Twig Query Processing based on Path-summarized Labeling Schemes)

  • 서세훈;배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.178-180
    • /
    • 2005
  • 지금까지 제안된 XML 문서상의 분기 질의(twig query) 처리 기법들의 중요한 흐름 중 하나는 지역 인코딩 기법을 이용하는 것이다. 하지만 이 기법에 기반한 분기 질의 처리는 분기 질의상의 단말 노드와 분기 노드의 엘리먼트를 반드시 읽어야 하는 단점이 있다. 그러나 지역 인코딩 기법과는 달리 경로 정보를 축약하는 방식의 레이블링 기법(예: 듀이 인코딩)은 지역 인코딩에 의한 레이블에 비해 더 많은 정보를 담고 있어서, 이 기법과 구조 인덱스를 이용하여 XML 문서를 인덱싱하면 질의상의 단말 태그의 엘리먼트만을 읽어도 분기 질의를 처리할 수 있다. 이를 이용하여, 본 논문에서는 경로 정보 축약 레이블링 기법과 구조 인덱스를 이용한 분기 질의 처리 기법을 제안한다. 제안된 알고리즘은 디스크 입출력을 줄일 수 있으며 불필요한 중간 결과도 생성하지 않는다.

  • PDF

가변 K진 완전트리와 RDF메타정보에 기반한 XML문서 저장 및 검색 프레임워크의 설계 및 구현 (A Design and Implementation of XML Document storing and retrieval Framework based on a variant k-ary complete tree and RDF Metadata)

  • 김규태;정회경;이수연
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.612-622
    • /
    • 2003
  • XML문서가 표준 인터넷 문서로 정착되어 감에 따라 XML문서의 효율적인 저장과 검색의 필요성이 증대하고 있다. 이에 본 논문에서는 XML문서의 효과적인 저장 모듈과 검색 모듈, 그리고 이를 웹 상에서 연동해서 사용할 수 있는 연동 API로 구성된 XML문서의 저장 및 검색 프레임워크에 대한 연구를 하였다. 저장모듈에서는 가변 K진 완전트리를 기반으로 한 DTD 독립적인 분할-통합형 저장모델을 구현하였고, 검색 모듈에서는 RDF 메타정보를 통해 구축된 색인에 대해 XPath 질의를 수행하는 XPath처리기를 구현함으로써 좀더 의미 있는 구조 검색 기능을 구현하였으며, XML-RPC, HTTP의 GET, POST, PUT 방식 API와 SOAP 방식의 API로 구성된 웹 연동 모듈을 구현하였다.

XSTAR: XML 질의의 SQL 변환 알고리즘 (XSTAR: XQuery to SQL Translation Algorithms on RDBMS)

  • 홍동권;정민경
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.430-433
    • /
    • 2007
  • XML이 다양한 분야에 널지 이용되면서 대용량의 XML을 효과적으로 관리하는 여러 가지 방법들이 연구되고 있다. 특히 지금가지 상업적, 기술적으로 성공적인 데이터 모델인 관계형 데이터베이스를 기반으로 한 여러 가지 방법들이 연구되고 있다. 본 논문은 관계형 DBMS를 사용하여 XML 질의어인 XQuery를 SQL로 변환하는 알고리즘인 XSTAR(XQuery to SQL Translation Algorithms on RDBMS)를 설계 및 구현한다. 본 연구의 XSTAR 알고리즘은 기본적인 XPath 뿐만 아니라 XQuery FLWOR 표현식, XQuery함수, 그리고 전문 검색(Fulltext 검색[8])과 관련된 몇몇 특수한 기능을 효율적으로 지원할 수 있으며, 질의의 결과 값을 XML 형태로 재생성하여 사용자에게 반환한다. 본 논문에서 제안하는 XSTAR 알고리즘은 현재 웹 상에서 공개적으로 시범 운용되고 있는 XML 문서의 관리 및 질의 처리 시스템인 XPERT(XML Query Processing Engine using Relational Technologies, http://dblab.kmu.ac.kr/project.jsp")의 질의 처리 엔진으로 사용되고 있다.

XML을 기반으로 한 관계형 데이터베이스 메타데이터 리파지토리 설계 및 구현 (Design and Implementation of XML Based Relational Database Metadata Repository)

  • 권은정;용환승
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.1-10
    • /
    • 2002
  • 메타데이터는 데이터에 관한 데이터로 데이터를 관리하기 위하여 사용된다. 데이터베이스를 기반으로 하는 응용프로그램이 증가하면서 메타데이터를 관리하기 위해 XML(eXtensible Markup Language)형식의 메타데이터 모델 및 메타데이터 교환모델이 제안되고 있지만 XML형식의 메타데이터를 관계형 데이터베이스에 저장하는 것이 일반적이다. 따라서 본 논문에서는 관계형 데이터베이스의 메타데이터를 객체지향 데이터베이스에 저장하기 위해 메타데이터 모델과 메타데이터 교환모델을 설계하여 메타데이터를 관리하는 새로운 리파지토리 시스템 구현을 목적으로 한다. 관계형 데이터베이스의 메타데이터를 XML문서로 변형 후 객체지향 데이터베이스의 XML 데이터 서버인 eXcelon에 저장하여 XQL (XML Query Language)에 의해 질의함으로써 관계형 데이터베이스 시스템들의 메타데이터의 검색, 편집을 가능하도록 하고 XSL(extensible StyleSheets Language)의 적용을 통하여 다양한 양식으로 웹 브라우져 상에 메타데이터를 출력함으로써 메타데이터의 속성을 면밀히 파악할 수 있다.

분산 환경에서 전역 XQuery 질의의 조인 선택치 추정 방법 (Estimating Join Selectivity of Global XQuery Queries in Distributed Environments)

  • 박종현;강지훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.564-571
    • /
    • 2007
  • 분산환경에 XML 데이타들을 통합하기 위한 한가지 방법은 XML 뷰를 사용하는 것이다. 사용자는 XML을 위한 표준 질의어인 XQuery를 사용하여 분산된 XML 뷰들을 대상으로 전역 XQuery질의를 생성할 수 있다. 이렇게 생성된 전역 XQuery 질의는 분산된 이종 데이타들을 통합하고 검색하기 위하여 자연스럽게 지역 시스템들 사이의 조인 연산들을 포함한다. 그러나 조인은 비용이 많이 드는 연산자이므로 조인 연산을 효율적으로 처리하는 것은 전역 질의의 처리 성능과 직결된다. 그러므로 조인 연산을 처리하기 위한 다양한 연구들이 존재하며, 그 가운데 하나는 조인의 선택치를 추정하여 최소의 비용을 갖는 조인 순서를 선택하는 것이다. SQL 질의의 경우, 이미 전역 질의의 조인 선택치를 추정하고 이를 기반으로 그 처리 순서를 결정하기 위한 연구가 존재한다. 그러나, 테이블 구조의 데이타를 검색하기 위한 SQL 질의의 조인 선택치 추정 방법을 구조적인 XML 데이타를 검색하기 위한 XQuery질의를 위해서 그대로 사용하기에는 데이타의 구조적인 차이로 인해 문제가 있다. 그러므로 본 논문에서는 질의의 대상이 되는 XML 뷰들의 정보를 이용하여 XQuery 질의의 특성을 고려한 조인 선택치 추정 방법을 제안한다. 본 논문의 기여는 다음과 같다. 첫째, SQL 질의의 조인 선택치 추정 방법과 XQuery 질의의 방법 사이에 차이점을 분석한다. 둘째, XML 뷰를 참조하여 XQuery 질의의 처리를 위한 조인 선택치 추정 방법을 제안한다. 마지막으로, 성능 평가를 수행하여 제안하는 조인 선택치 추정 방법의 효율성을 입증한다.

능동적 슬라이딩 윈도우 기반 빈발구조 탐색 기법 (A Method of Frequent Structure Detection Based on Active Sliding Window)

  • 황정희
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권1호
    • /
    • pp.21-29
    • /
    • 2012
  • 최근 인터넷의 급격한 발전과 유비쿼터스 컴퓨팅 환경 그리고 센서 네트워크와 같은 많은 정보들의 교환이 이루어지는 환경에서 연속적으로 전송되는 데이터에 대한 처리가 요구되고 있다. 이와 관련하여 XML 스트림 데이터에 대한 빈발구조 추출 및 효율적인 질의처리를 위한 마이닝 방법들이 연구되고 있다. 본 논문에서는 연속적으로 빠르게 발생하는 스트림 데이터로부터 유용한 정보를 발견하기 위한 기반 연구로써 트리거를 이용한 슬라이딩 윈도우 기반의 XML 빈발구조 탐색 방법을 제안한다. 제안된 방법은 스트림 데이터에 대한 마이닝과 연속질의 처리등을 위해 트리거를 이용하여 데이터의 흐름을 자동으로 제어할 수 있는 기반이 된다.

효율적인 XML검색을 위한 상대 위치 좌표 기반의 BitmapInvert Index 기법 (An Efficient BitmapInvert Index based on Relative Position Coordinate for Retrieval of XML documents)

  • 김택곤;김우생
    • 전자공학회논문지CI
    • /
    • 제43권1호
    • /
    • pp.35-44
    • /
    • 2006
  • 최근 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. XML 문서를 위한 현재까지 연구된 대부분의 색인기법의 경우 절대좌표를 이용하여 표현하는 방법을 사용하므로 갱신연산이 커다란 부담으로 받아들여지고 있다. 본 논문에서는 이를 개선하기 위하여 상대위치좌표에 기반한 BitmapInvert 색인 기법을 제안하였다. 상대위치좌표는 부모 노드와 좌, 우 형제 노드들 간의 관계만을 표현하므로 갱신연산지 자주 발생하더라도 좋은 성능을 보인다. BitmapInvert 색인 기법은 bitwise 연산을 지원하는 텍스트 검색을 지원하고, PostUpdate 알고리즘을 적용하여 갱신에 따른 성능 저하를 줄이도록 하였다. 따라서, 제안하는 기법은 검색이나 갱신에 대해서 접근하는 노드를 줄임으로써 전체적인 성능을 향상시킬 수 있다.

빈발 패턴 트리 기반 XML 스트림 마이닝 (Frequent Patten Tree based XML Stream Mining)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.673-682
    • /
    • 2009
  • 웹상에서 데이터 교환과 표현을 위한 표준으로 XML 데이터가 널리 사용되고 있으며 유비쿼터스 환경에서 XML 데이터의 형태는 연속적이다. 이와 관련하여 XML 스트림 데이터에 대한 빈발 구조 추출 및 효율적인 질의처리를 위한 마이닝 방법들이 연구되고 있다. 이 논문에서는 슬라이딩 윈도우 기반으로 하여 XML 스트림 데이터로부터 최근 윈도우 범위에 속하는 데이터에 대한 빈발 패턴 구조를 추출하기 위한 마이닝방법을 제안한다. 제안된 방법은 XML 스트림 데이터를 트리집합 모델, XFP_tree로 표현하고 이를 이용하여 최근의 데이터에 대한 빈발구조 패턴을 빠르게 추출한다.