• 제목/요약/키워드: Path Query Processing

검색결과 100건 처리시간 0.035초

확장된 질의 처리를 위해 경로간 의미적 유사도를 고려한 XML 문서 순위화 기법 (A Ranking Technique of XML Documents using Path Similarity for Expanded Query Processing)

  • 김현주;박소미;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.113-120
    • /
    • 2010
  • 정보기술의 표준으로 사용되고 있는 XML환경에서 방대한 양의 데이터에 대한 사용자의 질의를 효율적이고 정확하게 처리하기 위한 연구가 이슈화되고, 특히 웹 환경에서의 XML문서들은 용어적, 구조적인 측면에서 다양한 형태로 존재하고 있다. 이러한 특성을 갖는 XML 문서들을 대상으로 사용자가 특정한 정보를 얻고자 한다면, 사용자의 질의가 가진 용어 및 구조적 특성과 정확히 일치하지 않는 문서의 정보에 대해서 추가적인 기법이 필요하다. 본 논문은 이와 같은 경우에도 동일한 용어 및 구조를 사용하던 환경에서와 마찬가지로 최상위 순위로 정보를 검색할 수 있는 기법을 제시한다. 또한 정확히 일치하지 않는 문서의 경우에 대해서도 사용자 질의 측과의 경로간 의미적 유사성을 측정하여 사용자 질의와 의미적으로 유사한 경로를 가진 순으로 문서들을 순위화하여 제공한다. 제안된 기법은 실험을 통하여 기존의 기법보다 세밀하고 정확한 검색 결과를 도출함을 보인다.

시각 요소와 시각 변수를 통한 시각 객체 질의어(VOQL)의 개선 (Improving Visual Object Query language (VOQL) by Introducing Visual Elements and visual Variables)

  • 이석균
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1447-1457
    • /
    • 1999
  • 최근 제안된 시각 객체 질의어(VOQL)는 시각 질의어로 스키마 정보가 시각적으로 질의 표현에 포함되므로 복잡한 구조의 데이터에 대한 질의를 효과적으로 표현할 수 있는 객체 지향 데이터베이스 질의어이다. VOQL은 귀납적으로 정의된 시맨턱을 갖는 그래프 기반 언어로 다양한 텍스트 경로식들을 그래프로 간결하게 표현 할 뿐 아니라 복잡한 경로식의 시맨틱을 명확하게 전달한다. 그러나 기존의 VOQL은 모든 속성을 다중 값으로 가정하고 있고, 객체변수의 바인딩 개념을 시각화하고 있지 못하고 있다. 이로 인해 VOQL 질의문의 표현이 직관적이지 못할 뿐 아니라 이론적 확장이 쉽지 않다. 본 논문에서는 이러한 문제를 해결하도록 VOQL을 개선하고 한다. 단일 값과 다중 값을 갖는 속성의 결과를 각각 시각 요소와 서브 블랍을 통해 시각화하고, 시각변수를 도입하여 객체 변수의 바인딩을 명시화하여 질의문의 시맨틱을 직관적이고, 명확하게 하고 있다.

  • PDF

XML 데이타의 경로 유사성에 기반한 클러스터링 기법 (A Clustering Method Based on Path Similarities of XML Data)

  • 최일환;문봉기;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.342-352
    • /
    • 2006
  • 최근의 XML 저장소에 관한 연구들은 기존의 데이타 저장을 위해 주로 사용해 왔던 관계형 데이타베이스에 효율적으로 XML 데이타를 매핑하는 기법이나 XML 데이타를 위한 새로운 전용 저장소에 대한 연구들이 주를 이룬다. XML 전용 저장소에서 많이 사용되는 방식으로 XML 문서를 파싱하여 각 노드들을 개별적인 객체로 생성한 후 이를 저장하는 방식이 있다. 이러한 저장 방식에서는 개별적인 객체들의 물리적 배치, 즉 클러스터링이 성능에 영향을 미칠 수 있다. 본 논문에서는 하나의 XML 문서를 보다 효율적으로 저장하는 클러스터링 기법을 제안한다. 제안하는 기법은 데이타 노드들의 경로 유사도를 기반으로 클러스터링을 수행하여 질의 요청에 대한 결과를 반환할 때 발생하는 페이지 I/O를 줄인다. 또한 경로 질의 처리시 필요한 클러스터만을 이용하여 질의 처리를 수행하는 방법을 제안한다. 이는 질의 처리과정에서 불필요한 데이타를 제외함으로써 결과적으로 탐색 공간의 크기를 줄일 수 있어 보다 효율적인 경로 질의 처리를 가능하게 한다. 이밖에 본 논문에서는 기존의 다른 클러스터링 기법들과 제안한 기법들과의 성능 비교를 수행하고, 이를 통해 적절한 클러스터링 기법을 이용하면 XML 저장소의 성능을 향상시킬 수 있음을 보인다.

하이브리드 공간 DBMS에서 질의 분류를 이용한 최적화 기법 (Query Optimization Scheme using Query Classification in Hybrid Spatial DBMS)

  • 정원일;장석규
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.290-299
    • /
    • 2008
  • 본 논문에서는 하이브리드 공간 DBMS에서 질의 분류를 이용한 최적화 기법을 제안한다. 제안 기법은 질의에 이용되는 데이터의 위치에 따라 메모리 질의, 디스크 질의, 하이브리드 질의로 분류하여 처리한다. 특히, 하이브리드 질의의 경우에는 실체화 뷰의 사용률을 높이기 위해 실체화 뷰 생성 조건과 사용자 질의 조건을 비교하여 술어를 분할하는 메커니즘을 적용한다. 또한 질의를 최적화하기 위해 분류된 질의의 비용 계산 결과를 이용하여 최소 비용의 데이터 접근 경로를 선택할 수 있는 데이터 접근 경로 선택 알고리즘을 제안한다. 제안 기법은 대용량 데이터 관리와 빠른 응답 속도를 동시에 만족하는 하이브리드 공간 DBMS의 성능을 기존의 디스크 기반 공간 DBMS보다 최소 20%에서 최대 50%의 성능 향상을 보인다.

구조화 문서 검색을 위한 다단계 역색인 기법 (A Multi-level Inverted Index Technique for Structural Document Search)

  • 김종익
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.355-364
    • /
    • 2008
  • XML로 대표되는 구조화된 문서의 검색을 위해서는 구조 조인 기법이 많이 사용되며 구조 조인 기법을 사용하기 위해서는 구조 조인에 참여하는 엘리먼트들을 추출하는 과정이 선행되어야 한다. 이 과정을 위해서 일반적으로 동일한 태그 값을 가지는 엘리먼트들을 리스트 형태로 추출해 주는 역색인을 사용한다. 하지만 이러한 기존의 기법은 경로 질의 내의 부모-자식 관계나 조상-후손 관계를 비교적 비용이 비싼 구조 조인으로 모두 처리해야 하기 때문에 경로의 길이가 길어질수록 질의 처리 비용이 크게 증가하는 단점을 가지고 있다. 본 논문에서는 기존의 역색인과는 달리 엘리먼트 추출과정에서 부모-자식 관계에 있는 엘리먼트들을 처리할 수 있는 단계별 역색인을 제안한다. 본 논문에서 제안하는 단계별 역색인은 경로 질의 내의 부모-자식 관계를 가지는 엘리먼트 쌍(pair)들의 리스트를 추출해 준다. 또한 단계별 역색인으로부터 추출된 엘리먼트 쌍들의 리스트를 처리하기 위해 기존의 구조 조인과는 다른 변형된 구조 조인 기법을 제안하며 실험을 통해 제안된 기법이 기존의 기법보다 2배에서 4배 가량의 성능향상이 있는 것을 확인하였다.

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

XQL-SQL 질의 변환을 통한 XQL 질의 처리 시스템의 설계 및 구현 (Design and Implementation of XQL Query Processing System Using XQL-SQL Query Translation)

  • 김천식;김경원;이지훈;장복선;손기락
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.789-800
    • /
    • 2002
  • XML이 웹 문서의 표준이며, 문서교환용 언어로서 사용되고있다. 상업용 데이터는 대부분 관계형 데이터베이스에 저장되어 있고 이들 문서를 교환용 문서로 만들어서 문서교환에 이용하거나 관계형 데이터베이스에 저장된 XML데이터에 XQL로 질의하여 질의결과를 효율적으로 획득하는 것은 매우 중요하다. 따라서, 향후 많은 XML데이터의 보관 및 관리 그리고 XML데이터를 위한 질의어 처리는 필수적이다. 지금까지, XML데이터의 저장 및 검색과 관련한 연구 및 제품개발이 여러 업체에 의해 있어왔고, 지금도 연구 및 개발이 진행되고 있다. 하지만, 효율적인 XML데이터의 저장 및 검색을 위한 시스템은 아직까지 많지 않다. 따라서 본 논문에서는 효율적인 경로 질의를 위한 DFS-Numbering 방식을 사용하며, 효율적인 데이터 저장을 위해서 XML 데이터 저장을 위한 스키마를 설계하였다. 또한, 전통적인 관계형 데이터베이스 엔진을 이용한 효율적인 XQL 질의수행 방법을 설계 및 구현하였다. 즉, 사용자가 시스템에 XQL로 질의를 하면 XQL 처리기에 의해서 XQL이 SQL로 변환되고, SQL로 관계형 데이터베이스에 질의를 수행하면, 결과로 레코드를 반환한다. 이때 XML 생성기에 의해서 사용자에게 n문서를 반환한다.

빠른 XML질의 처리를 위한 세그먼트 조인 기법 (Segment Join Technique for Processing in Queries Fast)

  • 배진옥;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.334-343
    • /
    • 2005
  • XML 데이타를 대상으로 선형 질의나 가지모양 질의 같은 복잡한 질의가 많이 연구되고 있다. 이와 같은 질의를 처리하기 위해 XML 데이타를 구조정보에 의해 미리 인코딩한 후, 질의 처리시 구조정보를 이용하여 빠르게 질의를 수행하는 구조 조인 알고리즘들이 제안되었다. 그 중 최근에 제안된 TwigStack 알고리즘과 TSGeneric 알고리즘은 각각 인덱스가 없는 환경과 있는 환경에서 수행시간이 입력 데이타의 양과 비례하는 최적의 성능을 보여주었다. 하지만 이들 알고리즘은 질의의 길이(질의에 나타난 엘리먼트 개수)에 비례하여 입력데이타의 양이 증가하고, 따라서 수행시간이 길어진다는 제한점이 있다. 이 논문에서는 기존의 구조 조인 알고리즘들에 구조 인덱스를 결함한 세그먼트 조인 기법을 제안한다. 이 기법은 질의 노드와 노드 간의 구조 조인과는 달리, 구조 인덱스를 이용하여 일련의 질의 노드들을 하나의 세그먼트로 식별한 후 세그먼트와 세그먼트 사이의 조인을 수행한다. 그 결과 세그먼트마다 하나의 질의 노드만을 읽음에 의해 질의를 처리할 수 있게 되어 수행성능이 향상된다. 다양한 데이타셋에 대해 인덱스가 없는 환경에서 실험 결과, 세그먼트 조인 기법을 적용한 SegmentTwig 알고리즘은 TwigStack 알고리즘보다 우수한 성능을 보였다.

정보 검색 기술을 이용한 대규모 이질적인 XML 문서에 대한 효율적인 선형 경로 질의 처리 (Efficient Linear Path Query Processing using Information Retrieval Techniques for Large-Scale Heterogeneous XML Documents)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.540-552
    • /
    • 2004
  • 본 논문에서는 대규모 이질 XML 문서들에 대한 부분 매치 질의를 효과적으로 처리하는 새로운 방법 XIR-Linear를 제안한다. XPath 질의는 XML 문서를 표현하는 트리 구조에 대한 경로 표현식 (path expression)으로 쓰여진다. 주요한 형태의 XPath 질의는 부분 매치 질의(partial match query)이다. XIR-Linear의 목적은 이질적인 스키마들을 가진 대규모 문서들에 대한 부분 매치 질의를 효과적으로 지원하는 것이다. XIR-Linear는 관계형 테이블을 이용한 스키마-레벨 방법에 기반을 두고, 역 인덱스 (inverted index) 기술을 사용하여 XPath 질의 처리의 효율성을 획기적으로 향상시킨다. 본 방법은 레이블 경로(label path)를 덱스트로 간주하고 레이블 경로 내의 레이블(label)들을 텍스트 내에 있는 키워드(keyword)로 간주한 후, 레이블들을 정보 검색 기술을 이용하여 인덱스 함으로써 전통적인 방법들에서 사용된 스트링 매치(string match) 보다 효율적인 방법으로 질의와 매치되는 레이블 경로들을 찾을 수 있도록 하였다. 성능 평가에서는 인터넷에서 수집한 XML 문서들을 사용하여 기존의 관계형 테이블을 이용하는 XRel, XParent와 비교 실험함으로써, 제안한 방법의 효율성을 입증한다. 실험을 통해 XIR-Linear가 실험 범위 내에서 XRel 이나 XParent에 비해 수십 배 이상 좋은 성능을 보이며, XML 문서 수의 증가함에 따라 더욱 우수하다는 것을 보인다.