• 제목/요약/키워드: multiple join operation

검색결과 10건 처리시간 0.028초

DISSECTION TECHNIQUE FOR EFFICIENT JOIN OPERATION ON SEMI-STRUCTURED DOCUMENT STREAM

  • Seo, Dong-Hyeok;Lee, Dong-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.11-13
    • /
    • 2007
  • There has been much interest in stream query processing. Various index techniques and advanced join techniques have been proposed to efficiently process data stream queries. Previous proposals support rapid and advanced response to the data stream queries. However, the amount of data stream is increasing and the data stream query processing needs more speedup than before. In this paper, we proposed novel query processing techniques for large number of incoming documents stream. We proposed Dissection Technique for efficient query processing in the data stream environment. We focused on the dissection technique in join query processing. Our technique shows efficient operation performance comparing with the other proposal in the data stream. Proposed technique is applied to the sensor network system and XML database.

  • PDF

스트림 데이터에서 슬라이딩 윈도우를 사용한 조인 연산의 효율에 관한 연구 (A Study on the Efficiency of Join Operation On Stream Data Using Sliding Windows)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.149-157
    • /
    • 2012
  • 이 논문은 슬라이딩 윈도우를 사용하는 스트림 데이터에서 모든 조인 연산의 상태를 저장하기에 메모리가 충분하지 않을 경우에, 연속적인 슬라이딩 윈도우 조인 연산의 근사치 답을 구하는 문제에 대한 연구이다. 근사치를 구하는 두 가지 방법으로는 최대 부분집합으로 근사치를 구하는 방법과 조인 결과에서 임의의 결과를 택하는 방법이 있다. 전자는 잃어버리는 튜플의 수를 최소화 하고, 후자는 조인의 결과가 집계로 나타날 때 사용된다. 이 논문에서는 임의의 입력 데이터에 슬라이딩 윈도우가 사용되는 경우 두 가지 방법으로 얻는 근사치 모두 효율적이지 못함을 보여준다. 기존의 최대 부분집합에 의해 근사치를 구하는 모델에서는 빈도-기반 모델을 사용하였는데. 샘플링이 문제가 되었다. 오히려 스트림 도착한 이후의 연령-기반 모델이 많은 응용분야에서 더 적절하게 사용 될 수 있음을 보여주고 있다. 이 논문에서는 최대 부분 집합과 임의의 결과라는 두 가지 근사치 측정법을 분석, 그 효율성을 비교하여 보여 준다. 또한, 메모리가 제한 되어있는 환경에서 다중 조인 연산이 수행 될 경우에, 어떤 경우에도 근사치 측정을 최적화할 수 있도록, 조인 연산 전체에 필요한 메모리를 적절하게 할당하는 알고리즘의 효율성을 분석한다.

센서 네트워크에서 효율적인 다중 이벤트 탐지 (An Efficient Multiple Event Detection in Sensor Networks)

  • 양동윤;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.292-305
    • /
    • 2009
  • 무선 센서 네트워크는 산업 공정 제어, 기계 및 자원 관리, 환경 및 서식지 모니터링 등 다양한 분야에서 활용되고 있다. 그리고 이러한 분야들에서 무선 센서 네트워크를 사용하는 주된 목적 중 하나는 이벤트 탐지이다. 사용자의 요청에 따른 다수의 이벤트를 탐지하기 위해서는 센서 데이터와 이벤트의 조건들과의 조인(Join) 연산이 필요하다. 만약 이벤트의 조건들이 너무 많고 그에 비해 센서 노드의 저장용량이 작을 경우, 센서 노드에 이벤트의 조건들을 저장하여 인-네트워크 조인(In-Network Join)을 할 수 가없다. 본 논문에서는 다수의 이벤트 조건들과 센서 노드의 제한적인 저장 용량을 고려하여, 에너지 효율적으로 다중 이벤트 탐지를 할 수 있는 조건 병합 기반의 인-네트워크 조인 방법을 제안하고자 한다. 이 방법은 원래의 이벤트 조건들 중에 일부를 병합된 조건으로 대체함으로써, 전체 이벤트의 조건의 개수를 줄인다. 메시지 전송에 대한 예측 모델을 만들어서 조건 병합의 대상을 선택하는 알고리즘에 적용하였다. 실험을 통하여 제안한 예측 모델에 대한 검증을 하고, 기존의 방법에 비해서 제안한 방법의 성능이 우수함을 입증하였다.

페이지 실행시간 동기화를 이용한 다중 파이프라인 해쉬 결합 (Multiple Pipelined Hash Joins using Synchronization of Page Execution Time)

  • 이규옥;원영선;홍만표
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권7호
    • /
    • pp.639-649
    • /
    • 2000
  • 관계형 데이타베이스 시스템에서 결합 연산자는 데이타베이스 질의를 구성하는 연산자들 중 가장 많은 처리시간을 요구한다. 따라서 이러한 결합 연산자를 효율적으로 처리하기 위해 많은 병렬 알고리즘들이 소개되었다. 그 중 다중 해쉬 결합 질의의 처리를 위해 할당 트리를 이용한 방법이 가장 우수한 것으로 알려져 왔다. 그러나 이 방법은 할당 트리의 각 노드에서 필연적인 지연이 발생되는 데 이는 튜플-시험 단계에서 외부 릴레이션을 디스크로부터 페이지 단위로 읽는 비용과 이미 읽는 페이지에 대한 해쉬 결합 비용간의 차이에 의해 발생하게 된다. 본 논문에서는 이 비용 차이로 인해 발생되는 전체 시스템의 성능 저하를 방지하기 위해 페이지 실행시간 동기화 기법을 제안하였고 이 기법을 통해 각 노드에서의 처리시간을 줄이고 나아가 전체 시스템의 성능을 향상시켰다. 또한 분석적 비용 모형을 세우고 기존 방식과의 다양한 성능 분석을 통해 비용 모형의 타당성을 입증하였다.

  • PDF

데이타 스트림에서의 다중 조인 질의 최적화 방법 (Optimizing Multi-way Join Query Over Data Streams)

  • 박홍규;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.459-468
    • /
    • 2008
  • 데이타 스트림이란 실시간에 연속적으로 빠르게 생성되는 데이타 집합을 의미한다. 이러한 데이타 스트림들은 최근 사회가 발달과 더불어 정보 환경도 급속도로 발전함에 따라 센서 데이타, 교통상황 수집 자료, 웹 클릭 모니터링 등과 같은 많은 응용 분야에서 적용되고 있다. 이러한 형태의 데이트 스트립을 처리하기 위해서는 미리 등록된 질의에 대하여 새롭게 들어오는 스트림 데이타의 결과를 계속적으로 생성하게 된다. 이와 같은 이유로 끊임없이 들어오는 스트링 데이타들을 빠르게 처리하는 것이 이 분야에서 주된 이슈가 되었으며, 이를 위한 방법으로 등록된 질의들을 효율적으로 처리하기 위한 질의 최적화분야에 많은 연구가 있었다. 그러므로 본 논문에서는 기존 연구에서 사용되었던 그리디 방법을 기반으로 비용 모델을 이용하여 최소의 비용을 갖는 질의 계획을 선택하는 확장된 그리디 방법(EGA)을 제시한다. 화장된 그리디 방법은 알고리즘의 정확성이 떨어지는 그리디 알고리즘의 단점을 극복하기 위하여 비용이 가장 작은 연산하나를 선택하는 대신 비용이 자은 연산들의 집합을 선택한다. 이 연산들의 집합의 크기는 알고리즘의 정확성과 수행 시간에 영향을 끼치며, 투 개의 변수에 의해서 적응적으로 조절 수 있다. 실험에서는 다양한 스트림 환경에서 대부분 그리디 알고리즘보다 향상된 성능을 보장하고, 두 변수에 의한 알고리즘의 성능 및 수행 시간 차이를 보여줌으로써 본 알고리즘의 효율성을 검증하였다.

위치 검색 지도 서비스를 위한 k관심지역 검색 기법 (k-Interest Places Search Algorithm for Location Search Map Service)

  • 조성환;이경주;유기윤
    • 한국측량학회지
    • /
    • 제31권4호
    • /
    • pp.259-267
    • /
    • 2013
  • 최근 인터넷의 발달과 더불어 지리정보시스템(GIS, Geographic Information System)에 대한 인식이 저변 확대되면서 일반인들도 위치 검색 기능을 제공하는 웹GIS를 쉽게 이용할 수 있게 되었다. 현재 서비스되고 있는 모든 위치 검색 기능은 사용자가 하나의 검색어를 입력하고 그에 대한 결과를 보여주는 서비스에 한정되어 있다. 하지만 사용자의 검색 목적이 다양해짐에 따라, 여러 가지 행위를 동시에 할 수 있는 장소를 검색하는 서비스는 없었다. 예를들어, 점심을 먹은 후, 은행에서 업무를 보고, 영화 한 편을 보고자 할 때 이러한 관심 지역(POI, Point of Interest)들이 모여 있는 장소를 필요로 할 수 있다. 따라서 본 논문에서는 사용자로부터 여러 장소를 입력받아 입력된 장소가 모여 있는 곳을 검색해주는 k-IPS 기법을 제안하고자 한다. 여기서 k는 다양한 행위를 할 수 있는 관심의 개수이다. 이 방법은 최소경계사각형(MBR, Minimum Bounding Rectangle)의 계층적 트리 구조인 $R^*$-tree 색인 기법을 이용하여 공간을 분할하고, 기존 공간 Join 연산의 성능 개선을 위하여 $R^*$-tree간의 겹치는 영역 추출하는 재귀적 공간 Join 연산을 구현하였다. k-IPS 기법의 성능 평가는 159개의 다양한 검색어 집합을 구성하여 k=2,3,4,6에 대한 검색 결과를 확인하였다. 실험 결과의 약 90%에 대해서 예상한대로 k개의 검색어 장소가 모여 있는 위치를 얻을 수 있었고, k=2,3,4의 처리 시간은 0.1초 이내의 응답을 얻을 수 있었다. k-IPS 서비스를 통하여 현대인의 순차적 생활 패턴에 맞춘 검색 서비스가 가능할 것으로 판단된다.

한정된 프로세서 환경에서 체이지 실행시간 동기화를 이용한 효율적인 다중 결합 (Efficient Multiple Joins using the Synchronization of Page Execution Time in Limited Processors Environments)

  • 이규옥;원영선;홍만표
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.732-741
    • /
    • 2001
  • 관계형 데이타베이스 시스템에서 결합 연산자는 데이타 베이스 절의를 구성하는 연산자들 중 가장 많은 처리시간을 요구한다. 따라서 이러한 결합 연산자를 효율적으로 처리하기 위해 많은 병렬 알고리즘들이 수개되었다. 그 중 다중 해쉬 결합 질의의 처리를 위해 할당트리를 이용한 방법이 가장 우수한 것으로 알려져 와싸. 그러나 이 방법은 할당 트리의 각 노트에서 필연적인 지연이 발생되는데 이는 루플 실험단계에서 외부 릴레이션을 디스트로부터 페이지 단위로 읽는 비용과 이미 읽는 페이지에 대한 해쉬 결합 비용간의 실행시간 차이에 의해 발생하게 된다. 이는 페이지 실행시간 동기화 기법을 이용하여 할당 트라 한 노드에서의 실행시간을 줄일 수 있었다. 본 논문에서는 한 노드에서의 성능 개선 효과를 할당 트리 전체로 확장하여 전체 다중 해쉬 결합의 성능 분석을 수행하였으며 한정된 프로세서 환경 하에서 입력 릴레이션 수와 할당된 프로세서 수와의 관게에 따른 효율적인 다중 해쉬 결합 알고리즘을 제안하였다. 그리고 분석적 비용 모형을 세워 기존 방식과의 다양한 성늘 분석을 통해 비용 모형의 타당성을 입증하였다.

  • PDF

IOT 기반의 디바이스 간 협업데이터 전송을 위한 알고리즘 설계 (A Study on the IOT-based devices for collaboration between algorithm design data)

  • 임혁;김희열;김호성;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.603-605
    • /
    • 2015
  • 최근 IoT(Internet Of Things) 기술의 발전이 급속도로 성장하고 있다. IoT 환경에서 여러 디바이스들이 작업을 수행할 때, 서로 다른 디바이스들 간 관계(Relation)를 맺어 협업함으로써 작업의 효율을 향상시킬 수 있다. 기존에 연구하고 사용되던 방식은 사용자가 각각의 디바이스에게 명령을 내리 P2M(Person to Machine) 방식이고, 현재는 디바이스 간에 관계를 맺음으로써 P2M방식 보다 효율적인 M2M(Machine to Machine) 방식으로 대체되고 있다. 본 논문에서는 디바이스 간 관계의 맺음을 정의하고 협업을 위한 데이터전송 알고리즘을 제안한다. 제안하는 알고리즘을 통해 다른 작업들 사이에서 중복된 작업을 차단 할 수 있고 수행하는 작업의 효율을 향상시킬 것으로 사료된다.

  • PDF

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.

전자무역의 활성화를 위한 국내 제3자물류 발전방안 (The Development Scheme of Domestic Third Party Logistics for Revitalization of Electronic Trade)

  • 차순권;장흥훈
    • 한국항만경제학회지
    • /
    • 제24권2호
    • /
    • pp.155-174
    • /
    • 2008
  • 최근 $20{\sim}30$년 동안 정보통신기술의 급속한 발전과 이를 활용한 전자상거래의 빠른 확산은 국제상거래인 무역 역시 전자적인 방식으로 거래가 가능하게 하였다. 이로 인해 추후 국제간 거래에 있어 전통적인 대규모 거래방식이 아닌 전자무역사이트를 이용한 소량 다빈도 거래가 빈번하게 이루어질 전망이다. 이에 본 연구는 위에서 언급한 무역거래 패러다임의 변화에 대응하고 이를 활성화하는데 반드시 필요한 국내 제3자물류 산업의 발전방안을 제시하고자 하였다. 기존의 연구에서는 국제 제3자물류산업의 그 자체에 대한 발전방향만을 제시하고 있으나, 본 논문에서는 전자무역과 연계한 국제 3자물류산업의 발전방향에 대해 연구하고자 하였다. 이를 위해 본 연구에서는 먼저 전자무역과 제3자물류에 대한 개념과 관련성을 제시하고, 이를 바탕으로 국내 제3자물류의 문제점을 제시하고 이에 대한 발전방안을 제시하였다. 전자무역과 관련하여 국내 제3자 물류의 문제점은 경영자의 인식부족, 물류비의 비중과다, 마케팅차원의 고려 부족, 전자상거래와 연계한 통합물류서비스 시스템의 미비, 전문인력 부족, 중소기업 상호간 물류공동망의 부족, 전문물류회사의 영세성, 물류관련 법규의 복잡, 물류기업간 담합 등으로 나타났다. 국내 제3자물류의 발전방안은 정부차원에서 법 제도의 정비, 통합물류정보시스템을 구축하기 위한 재정적 기술적 인프라 확대 지원, 보안 및 인증시스템 구축, 물류거래알선사이트의 활성화, 세제지원, 전문인력 양성 체계 확립 등이 있다. 기업차원의 물류발전방안으로는 혁신적 물류시스템과 연계한 통합물류정보시스템의 구축, 전자거래사이트에 연계한 원스톱 물류서비스 제공, 선진 3자물류 기술적 노하우 축적, 문전운송체계 실현, 전반적 거래진단 시스템 구비, 전략적 제휴를 통한 국제경쟁력 강화 등이 필요한 것으로 나타났다. 본 연구의 목적은 이상과 같이 국제 제3자물류의 발전방안을 제시함으로써, 미래 국제무역의 새로운 패러다임인 소량다빈도 형태의 전자무역 활성화에 기여하는데 있다.

  • PDF