• 제목/요약/키워드: Query Processing Method

검색결과 532건 처리시간 0.023초

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF

거리공간에서의 리버스 스카이라인 질의 처리 (Reverse Skyline Query Processing in Metric Spaces)

  • 임종태;박용훈;서동민;이진주;장수민;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.809-813
    • /
    • 2010
  • 최근의 기업중심의 서비스를 위해서 리버스 스카이라인 질의 처리가 연구되었다. 하지만 지금까지의 리버스 스카이라인에 대한 연구는 모두 다이나믹 스카이라인을 기반으로 한 리버스 다이나믹 스카이라인이고, 위치 기반 서비스를 위한 거리공간에서의 리버스 스카이라인 질의 처리 기법은 전무하다. 따라서 본 논문에서는 일반적인 스카이라인에 적용 가능하고 거리공간을 고려한 리버스 스카이라인 처리 기법을 제안한다. 제안하는 기법은 기존의 공간 색인을 활용하여 거리공간에서 리버스 스카이라인을 처리하며, 객체의 단색적인 환경과 양색적인 환경을 모두 고려한다. 제안하는 기법의 우수성을 보이기 위해 제안하는 기법과 기본적인 리버스 스카이라인 질의 처리 기법과의 성능평가를 수행하고 그 결과를 비교 분석했다. 그 결과 기존의 기법보다 약 5000배 우수한 성능을 보였다.

데이터베이스에서 유사도 질의 처리 비용 감소 방법 (A Method of Reducing the Processing Cost of Similarity Queries in Databases)

  • 김선경;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.157-162
    • /
    • 2022
  • 오늘날 대부분의 데이터는 데이터베이스(database: DB)에 저장된다. 이러한 DB 환경에서 사용자는 자신이 원하는 데이터를 찾아줄 것을 DB에게 요청하게 된다. DB 질의 중 유사도 질의는 DB 사용자가 원하는 조건으로 유사도가 포함되어 있는 것을 말한다. 그러나 유사도 질의를 처리하기 위한 과정은 처리 레코드의 범위를 줄일 수 있는 색인을 이용하기 힘들어 테이블의 전체 레코드에 대해서 매번 유사도를 계산하는 비용이 높다. 본 논문은 이러한 문제점을 해결하기 위하여 경량 유사도 함수를 정의한다. 경량 유사도 함수는 유사도 함수에 비해 데이터를 여과하는 정확도는 떨어지지만 비용이 유사도 함수에 비하여 적게 소모되는 특징이 있다. 이러한 경량 유사도 함수의 특징을 이용하여 유사도 질의 처리 비용 감소 방법을 제시한다. 그리고 유클리드 거리 함수에 경량 유사도 함수로 체비쇼프 거리를 제시하고 기존의 유사도 함수를 이용하는 질의와 경량 유사도 함수를 이용하는 질의의 처리 비용을 비교한다. 그리고 실험을 통하여 유클리드 유사도에 대한 경량 유사도 함수로 체비쇼프 거리를 적용하였을 때 유사도 질의 처리 비용이 감소하는 것을 확인한다.

OLAP에서 MAX-of-SUM 질의의 효율적인 처리 기법 (Efficient Processing of MAX-of-SUM Queries in OLAP)

  • 정희정;김동욱;김종수;이윤준;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.165-174
    • /
    • 2000
  • OLAP 분야에서 지금까지 연구되어온 영역 질의는 주어진 영역에 대한 집단 연산의 결과를 구하는 단순한 형태이다. 그러나 실제 데이타 분석 과정에서는 이러한 단순한 형태의 영역 질의뿐만 아니라, 집단 연산이 포함된 특정 조건을 만족하는 데이타 큐브 내의 영역을 찾는 형태의 확장된 영역 질의에 대한 필요성이 존재한다. 본 논문에서는 이러한 확장된 영역 질의 유형의 일반적인 형태를 정의하고, 이에 대한 대표적인 예인 'MAX-of-SUM 질의'의 효율적인 처리 기법을 제안한다. MAX-of-SUM 질의는 데이타 큐브 상에서 영역합(SUM)이 최대(MAX)가 되는 영역을 찾는 질의를 의미한다. 본 논문에서는 MAX-of-SUM 질의 처리 시 검색의 대상이 되는 영역들에 대한 SUM 연산의 결과값이 취할 수 있는 범위를 미리 예측하는 기법을 제안한다. 즉, 영역에 대한 SUM 값의 범위를 예측함으로써, 이들 중에서 최대값을 찾기 위해 실제로 계산하여야 하는 영역의 개수를 줄여 빠른 질의 처리를 보장한다.

  • PDF

캐쉬메카니즘을 이용한 시맨틱 스키마 데이터 처리 (Semantic schema data processing using cache mechanism)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.89-97
    • /
    • 2011
  • 네크워크상의 분산되어 있는 정보를 접근하는 온톨로지와 같은 시맨틱 웹 정보 시스템에서는 효율적인 질의 처리를 위하여 질의 응답 시간을 줄여주는 향상된 캐쉬 메카니즘을 필요로 한다. 특히, P2P 네트워크 시스템은 웹 환경의 기본적인 하부 구조를 이루고 있으며, 질의가 발생하면, 소스 피어(Peer)로의 데이터 전송량을 줄이는 문제가 효율적인 질의 처리의 중요한 부분이다. 전통적인 데이터베이스 캐쉬 메카니즘으로부터 현재의 웹 환경에 적합한 질의 메카니즘들이 연구되어 왔으며, 질의 처리 결과를 캐쉬하는 것은 입력 질의 요구를 빠른 시간에 바로 사용자에게 전달할 수 있다. 웹 환경에서는 시맨틱 캐싱 방법이 연구되어 왔으며, 이는 캐쉬를 의미적인 영역들로 이루어진 공간으로 관리하는 개념이며, 논리적인 캐싱 단위가 질의와 질의 결과이므로 웹 환경에서 적합한 개념이다. 본 연구에서는 온톨로지와 같은 시맨틱 웹 정보가 클러스터 단위로 여러 피어에 분산되어 있는 경우에 캐쉬 메카니즘을 이용하여 효율적인 질의 처리가 이루어지도록 하는 방법을 제시한다. 특히, 캐쉬를 유지하고 처리하는 방법으로 스키마를 이용한 캐쉬 데이터 필터링 방법과 온톨로지와 질의 결과의 유사도를 측정하여 캐쉬 대체 영역 선택에 사용하는 방법을 제시한다.

최적탐색거리를 이용한 최소근접질의 처리 방법의 성능 평가 (The Performance Evaluation of Method to Process Nearest neighbor Queries Using an Optimal Search Distance)

  • 선휘준;김홍기
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.32-41
    • /
    • 1999
  • 공간 데이터베이스 시스템에서 최소 근접질의는 매우 빈번히 발생하며, 다른 유형의 공간질의에 비하여 처리비용이 많이 요구된다. 최소근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의수를 최소화할 수 있어야 한다. 이를 위해 최소근접질의 처리시 색인에서 방문될 노드들을 정확히 선정하기 위한 검색거리 측도인 최적탐색거리가 제안되었다[13]. 본 논문에서는 최적탐색거리의 특성을 N차원으로 확장하고 최대검색거리를 이용한 방법에 비해 최적탐색거리를 이용한 방법이 질의처리 성능이 더 우수함을 실험을 통하여 입증한다.

  • PDF

객체의 순환적 위치속성을 고려한 최대근접질의의 처리방법 (The Processing Method of Nearest Neighbor Queries Considering a Circular Location Property of Object)

  • 선휘준
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권4호
    • /
    • pp.85-88
    • /
    • 2009
  • 멀티미디어 시스템에서 최대근접질의는 매우 빈번히 발생하며, 다른 유형의 공간질의에 비하여 처리비용이 많이 요구된다. 최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있는 검색거리 측도가 필요하다. 또한 최대근접질의에 따른 검색 노드들을 정확히 선택하기 위해서는 객체들의 순환적 위치 속성을 고려해야 한다. 본 논문은 순환도메인을 갖는 검색공간에서 객체의 순환적 위치속성을 고려한 최대근접질의 처리방법을 제안하고 그 특성을 보인다. 제안한 방법은 최대근접질의의 처리비용을 최적화하기 위한 검색거리 측도인 순환최소거리와 순환최적거리를 사용한다.

  • PDF

연역 객체 지향 데이터베이스 언어 구현을 통한 XML 데이터 처리에 관한 연구 (On XML Data Processing through Implementing A Deductive and Object-oriented Database Language)

  • 김성규
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.991-998
    • /
    • 2002
  • 본 논문에서는 XML 데이터와 같은 비구조적인 데이터 처리와 추론을 필요로 하는 의미 웹(semantic web) 구축에 유리한 연역 객체 지향 데이터베이스(Deductive and Object-oriented Database) 언어구현을 통해 XML 데이터 처리에 대해 알아본다. 대량 문서 관리와 데이터 교환에 가장 유용한 마크업 언어로 알려진 XML을 이용하여 XML 데이터 모델을 연역객체지향 데이터베이스 모델로 바꾸는 방법에 대해 알아본 다음 이 연역객체 지향 데이터베이스를 다시 Connection Graph로 바꾸고 Connection Graph Resolution을 이용하여 어떻게 질의에 답할 수 있는지를 기술한다. 또한 데이터베이스 내의 계층 지식을 이용하여 효율적이면서도 같은 답을 주는 질의로 바꾸는 방법을 제시하고 이 방법이 효율적이며 논리적으로 타당하다는 점을 증명한다.

모바일 클라이언트-서버 모델에 관한 연구 (On the Mobile Client and Server Model)

  • 이지영
    • 정보학연구
    • /
    • 제12권1호
    • /
    • pp.15-20
    • /
    • 2009
  • In this paper, we aim that it solve to problem of the database hoarding because a week connectivity of wireless networks and cutting of link, Consistency of shared data, optimizing of the log include to Mobile Continuous Query Processing System under the mobile client and server environment. and we demonstrate of the superiority for the new Mobile Continuous Query Processing System compare C-I-S(Client-Intercept -Server)model with performance. and we perform to various experiment in order to establishment of superiority compare the index architecture and method for the realtime Continuous Query Processing. in this paper.

  • PDF