• 제목/요약/키워드: Join Query

검색결과 116건 처리시간 0.021초

확장 불리언 질의에 대한 비용 기반 최적화 (Cost-based Optimization of Extended Boolean Queries)

  • 박병권
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.29-40
    • /
    • 2001
  • 본 논문에서는 역색인 파일을 미용하여 학장 불리언 질의를 처리할 때 최소 비용의 질의 처리 방법을 구해 주는 질의 최적화 알고리즘을 제시한다. 확장 불리언 질의를 처리하는 방법은 질의를 구성하는 키위드의 처리 순서에 따라 여러 가지가 있을 수 있으므로 확장 불리언 질의 최적화 문제는 결국 최적 키워드 처리 순서를 구하는 문제로 귀결된다. 본 논문에서는 이 문제가 데이터베이스 질의 최적화에서 최적 조인 순서를 구하는 문제와 구조적으로 유사함을 보이고 이 분야의 연구 결과를 이용하여 문제를 해결한다. 즉, 확장 불리언 질의 처리에 대한 비용 모델을 수립하고 키워드 선택률과 역색인 파일 접근 비용을 이용하여 키워드 순위 개념을 도입한 후 이를 이용하여 최적 키워드 처리 순서를 구하는 알고리즘을 도출한다. 그리고 도출한 질의 최적화 알고리즘의 최적성을 증명하고. 실험을 통하여 실제로 최소비용의 질의 처리 방법을 구함을 보이고, 질의 최적화를 하지 않을 경우와 비교하였을 때 그 성능이 월등히 우수함을 보인다. 본 논문에서 제시한 질의 최적화 알고리즘은 정보검색시스템의 질의 처리 성능 향상에 큰 기여를 하리라 믿는다.

  • PDF

DOT 색인을 이용한 효율적인 공간 조인 기법 (An Efficient Spatial Join Method Using DOT Index)

  • 백현;윤지희;원정임;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.420-436
    • /
    • 2007
  • 지리정보시스템에서 빈번히 사용되는 공간 조인 연산자의 성능을 보장하기 위해서는 효율적인 색인 기법의 선택이 중요하며, 대표적인 색인 기법으로는 $R^*$-tree를 이용한 방법이 알려져 있다. 본 논문에서는 DOT(Double Transformation) 공간 색인을 이용한 효율적인 공간 조인 처리 기법을 제시하고 이를 $R^*$-tree를 이용한 공간 조인 처리 기법과 비교한다. DOT 공간 색인 기법은 공간 객체의 MBR 정보를 공간 순서화 곡선을 사용하여 하나의 1차원 값으로 변환한 후 그 값을 검색 키로 갖는 $B^+$-tree 색인 구조를 구성하는 방법으로서, 이를 이용하면 전통적인 데이타베이스의 주 색인을 적용할 수 있다는 중요한 특징을 가진다. 본 논문에서는 공간 객체의 MBR 정보를 하나의 1차원 값으로 변환하기 위해 사용되는 공간 순서화 곡선의 규칙성을 분석함으로써 공간 변환 연산의 횟수를 대폭 감소시킨 효율적인 DOT 색인기반의 공간 조인 알고리즘을 제안한다. 제안된 알고리즘에서는 반복적으로 수행되는 공간 변환 연산의 횟수를 줄이기 위하여 질의 영역을 공간 순서화 곡선이 연속 운행하는 가능한 최대 크기의 면적으로 분할하는 쿼터 분할 기법을 사용한다. 다양한 분포와 크기를 갖는 데이타 집합을 대상으로 $R^*$-tree를 이용한 공간 조인 처리 기법과의 비교 실험을 수행한 결과 최대 약 3배의 성능 이익을 얻을 수 있음을 확인할 수 있었다.

시공간 겹침 조인 연산을 위한 선택도 추정 기법 (Selectivity Estimation for Spatio-Temporal a Overlap Join)

  • 이명술;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권1호
    • /
    • pp.54-66
    • /
    • 2008
  • 시공간 데이타베이스에서 조인 연산은 매우 많은 비용이 소요되며, 시공간 조인 연산의 효율적인 질의 실행 계획을 세우기 위해 조인 연산에 대한 정확한 선택도 추정은 질의처리 성능에 결정적이다. 주어진 두 이산 데이타집합 $S_1,\;S_2$의 타임스탬프 $t_q$에서 시공간 조인 연산은 타임스탬프 $t_q$에서 서로 교차하는 모든 객체 쌍을 검색하는 것이다. 시공간 조인 연산의 선택도 추정치는 검색된 객체 쌍의 수를 $|S_1{\times}S_2|$로 나눈 값이다. 이 논문은 공간 조인 연산의 선택도 추정 기법인 기하 히스토그램 기법을 확장하여 시공간 조인 선택도 추정을 위한 시공간 히스토그램을 제안한다. 균일 데이타 집합과 편중 데이타 집합 모두를 사용하여 제안된 히스토그램 기법으로 시공간 조인 연산의 선택도를 정확하게 추정할 수 있다는 것을 증명하였다. 본 논문의 기여도는 먼저 이산 데이타 집합에 대한 시공간 조인 선택도 추정 연구의 첫 시도를 하였으며 다음으로 이산 객체의 유효시간 동안의 공간 통계정보를 압축하여 히스토그램을 재구축하는 효율적인 유지기법을 제안하였다.

대용량 IoT 데이터의 빠른 분석을 위한 OLAP 기반의 빅테이블 생성 방안 (OLAP-based Big Table Generation for Efficient Analysis of Large-sized IoT Data)

  • 이도훈;조찬영;온병원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.2-5
    • /
    • 2021
  • 최근 사물인터넷(IoT) 기술이 발전하면서 다양한 단말들이 인터넷에 연결되고 있다. 그로 인해 발생하는 IoT 데이터의 양 또한 증가하고 있는데, 이렇게 발생한 대용량 IoT 데이터를 빠르게 분석할 수 있는 인덱스 키를 제안한다. 기존 인덱스 키에는 시간과 공간의 정보만 존재하여 반복문이나, 조인 연산(Join operation)을 사용하여 인덱스 테이블과 인스턴스 테이블에 저장되어있는 데이터를 질의했다면, 제안방안의 인덱스 키에는 IoT 데이터를 임베딩(Embedding) 하여 시간이 지연되었던 반복문이나 조인횟수를 최소화하기 위하여 OLAP 기반의 빅테이블을 생성함으로써 시간을 단축하였다.

  • PDF

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF

Ad-hoc망에서 ODMRP을 사용한 효율적인 유니캐스트 라우팅 프로토콜 (An Efficient Unicast using ODMRP in Ad Hoc Networks)

  • 백경호;박재우;이균하
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1145-1148
    • /
    • 2003
  • 본 논문에서는 Ad-hoc 망의 멀티캐스트 라우팅 프로토콜인 ODMRP(On-Demand Multicast Routing Protocol)에서 효율적인 유니캐스트 라우팅 프로토콜을 제안한다. ODMRP는 네트워크 상에서 멀티캐스트그룹의 송신원으로부터 수신원에 이르는 경로상에 있는 노드들을 Fe(Forwarding Group) 노드로 선출하여 이들이 해당 멀티 캐스트그룹에 속하는 패킷을 플러딩 하도록 함으로써 데이터를 전송하는 방안이다. 이러한 ODMRP에서는 어느 한 노드가 유니캐스트 모드로(end-to end) 데이터를 전송해야 하는 경우 경로를 찾기 위해 주기적인 플러딩 과정을 거쳐야 하고 이로 인해 오버헤드가 발생하게 된다. 본 논문에서는 이 문제점을 해결하고자 유니캐스트 모드에서 송신원에서 찾은 경로를 DR 라우팅 테이블에 저장해두고 데이터를 보련 때 DR 라우팅 테이블의 정보를 참조함으로써 수신원에서의 불필요한 컨트롤 패킷(JOIN QUERY, JOIN REPLY)으로 인한 트래픽을 줄일 수 있는 방안을 제안한다. 또한 제안된 방식이 기존의 ODMRP 방식보다 데이터의 전송 시간과 경로를 찾는 시간에 있어 개선되었음을 시뮬레이션을 통해 입증한다.

  • PDF

Distributed database replicator without locking base relations

  • Lee, Wookey;Kang, Sukho;Park, Jooseok
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.93-95
    • /
    • 1996
  • A replication server is considered to be one of the most effective tools to cope with the problems that may be caused by the complex data replications in distributed database systems. In the distributed environment, locking a table is inevitable and it is the main reason to coerce the system practically. This paper presents an Asynchronous Replicator Scheme (ARS) that basically utilizes the system log as files named differential files to refresh the distributed data files with complicated queries, and that it prevents (normally, huge) base tables from being locked. We take join operations as the complicated queries, not only because the join operation covers almost all the operations, but also because it is one of the most time-consuming and data intensive operations in query processings.

  • PDF

Ad-hoc 망에서 유니캐스트 성능 향상을 위한 개선된 ODMRP (An enhanced unicast of ODMRP scheme for Ad-hoc Networks)

  • 백경호;박재우;이제원;이균하
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.157-160
    • /
    • 2003
  • ODMRP is protocol that support multicast and unicast in Ad-hoc network. When some one node must transmit data by unicast way in this ODMRP, must pass through periodic flooding process to find a path and overhead happens thereby. Our scheme stores the found path into the table in a unicast mode and, when the node sends data, it refers to the DR FG table so that reduces the traffic caused by control packets(JOIN QUERY, JOIN REPLY) of a receiver node, while source/destination nodes flood periodic control packets to look for a path in ODMRP. We present that our scheme is much more improved on the time of looking for a path than existing ODMRP methods by means of the simulation.

  • PDF

다중 해시 조인의 파이프라인 처리에서 분할 조율을 통한 부하 균형 유지 방법 (A Load Balancing Method using Partition Tuning for Pipelined Multi-way Hash Join)

  • 문진규;진성일;조성현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.180-192
    • /
    • 2002
  • Shared nothing 다중 프로세서 환경에서 조인 어트리뷰트의 자료 불균형(data skew)이 파이프라인 해시 조인 연산의 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 Round-robin 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 동적 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인은 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. Shared nothing 다중 프로세서 구조는 대용량 데이타베이스를 처리하는데 확장성은 좋으나 자료 불균형 분포에 매우 민감하다. 파이프라인 해시 조인 알고리즘이 동적 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.

문서관리시스템을 위한 질의처리기 설계 및 구현 (Design and Implementation of a Query Processor for Document Management Systems)

  • 우종원;윤승현;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1419-1432
    • /
    • 1999
  • 문서관리시스템은 문헌 정보들에 대한 정보 검색 및 관리를 효율적으로 지원하기 위한 시스템이다. 이러한 문서관리시스템은 하나의 테이블만으로 정보들을 관리하기 때문에 기존 데이터 관리 시스템에서 사용되는 조인 연산과 뷰 연산 등 많은 비용이 소요되는 연산을 제공할 필요가 없다. 더불어 문서관리시스템은 기존 데이터베이스관리시스템에서는 제공되지 않았던 새로운 연산이 요구된다. 본 논문은 문서관리시스템에서 자료의 구조 정의, 처리 등을 표현할 수 있는 효과적인 데이터 언어를 정의한다. 특히 문서 검색에 필요한 Ranking 연산, Proximity 연산을 제공하도록 정의하고, 정의된 데이터 언어로 작성된 질의를 효율적으로 처리하기 위한 질의 처리기를 설계하고 구현한다. 구현된 문서관리시스템을 위한 질의처리기는 기존 관계형 데이터베이스 관리 시스템의 질의 처리기를 문서관리시스템의 질의 처리기로 사용할 때 나타나는 성능저하 문제점을 해결할 뿐만 아니라 문서관리시스템에서 필요로 하는 새로운 연산을 제공한다.

  • PDF