• 제목/요약/키워드: 연속적인 질의

검색결과 511건 처리시간 0.033초

빅데이터 환경에서 연속 질의 처리를 위한 리버스 k-최근접 질의 처리 기법 (Reverse k-Nearest Neighbor Query Processing Method for Continuous Query Processing in Bigdata Environments)

  • 임종태;박선용;서기원;이민호;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.454-462
    • /
    • 2014
  • 최근 위치 측정 기술과 모바일 기기들의 발달과 함께 위치 기반 서비스가 중요하게 연구되고 있다. 위치기반서비스를 제공하기 위해 많은 연구자들이 맵리듀스를 활용한 다양한 질의 처리 기법을 제안하였다. 그 중에 하나가 맵리듀스를 활용한 리버스 k-최근접 질의 처리 기법이다. 하지만 기존 기법들은 연속 리버스 k-최근접 질의 처리를 수행하기 위해 많은 처리 비용이 요구된다. 본 논문에서는 맵리듀스를 활용한 효율적인 연속 리버스 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 60도 가지치기 기법을 이용한다. 제안하는 기법은 60도 가지치기 기법을 활용하여 모니터링 영역을 생성하고 모니터링을 수행하여 결과 업데이트을 수행하기 때문에 효율적으로 결과 업데이트를 수행한다. 또한, 본 논문에서는 제안하는 기법의 우수성을 보이기 위해 기존 기법과의 성능평가를 수행한다.

간선 유형 및 가중치를 고려한 연속 서브 그래프 매칭 기법 (Continuous Subgraph Matching Scheme Considering Edge Types and Weights)

  • 최도진;복경수;이병엽;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.451-452
    • /
    • 2019
  • 논문 검색 서비스 응용에서는 공저자, 출판 정보 등을 표현하기 위해서 다양한 정점 레이블 (논문,저자) 및 간선 정보(주저자, 공저자)를 이용하여 그래프로 표현한다. 이와 함께 다양한 간선 특징 정보를 질의로 입력하는 연속 서브 그래프 매칭에 대한 요구가 존재한다. 본 논문에서는 간선의 다양한 특성을 지원하고 색인의 부하를 감소시킨 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 거리 값과 질의 연관 정보만을 관리하여 간선의 다양한 특성을 지원하는 효율적인 서브 그래프 매칭을 수행한다.

  • PDF

기호공간에서 이동객체 스트림 데이터의 연속 시공간 셀프조인 질의 (Continuous Spatio-Temporal Self-Join Queries over Stream Data of Moving Objects for Symbolic Space)

  • 황병주;이기준
    • Spatial Information Research
    • /
    • 제18권1호
    • /
    • pp.77-87
    • /
    • 2010
  • 시공간 조인은 이동객체와 같이 시공간의 특성을 가지는 데이터를 처리할 때 요구되는 중요한 연산자로, 이동객체들의 움직임을 분석하거나 이동객체들의 시공간적 패턴을 찾는 것과 같이 다양하게 활용된다. 현재까지 실외공간에서의 시공간 조인 질의에 관한 연구는 많이 진행되어왔다. 최근에는 실내측위기술이 발전함에 따라 실외뿐만 아니라 실내에서도 다양한 위치기반 서비스가 점진적으로 제공되고 있으며, 특히 이동객체를 중심으로 다양한 응용 서비스들을 필요로 하게 된다. 하지만 실내공간에서의 시공간 조인에 관한 연구는 아직 전무하다. 본 논문에서는 실내공간에서 실시간으로 갱신되는 이동객체에 대한 연속 시공간 셀프조인 질의와 질의처리 방법론을 제안하였다. 연속 시공간 셀프조인 질의는 주어지는 특정 시간과 공간의 조건을 만족하는 모든 쌍들을 시간이 지남에 따라 지속적으로 갱신하는 질의이다. 본 논문에서는 방이나 복도와 같이 특정한 기호를 중심으로 이동객체의 위치를 표현하며 이러한 특징을 가지는 공간을 기호공간이라 한다. 그리고 방대한 스트림데이터를 효과적으로 필터링하고 관리하기 위한 후보쌍 버퍼 테이블이라는 자료구조와 이를 활용한 질의처리 방법론을 제안하였으며 실험을 통해 타당성을 검증하였다.

K-최근접 질의와 비공간 속성을 결합한 효율적인 안전 영역 할당 기법 (An Efficient Construction of Sage Regions for Combined K-NN Query and Non-Place Attributes)

  • 정재우;김응모
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.103-104
    • /
    • 2016
  • 본 논문에서는 GPS의 보급과 무선 통신의 발달로 급격하게 성장 중인 위치 기반 서비스에 대한 연구를 진행하였다. 위치 기반 서비스를 효율적으로 활용하기 위해서 연속 범위 질의(continuous range query)에 비공간적 특성과 K-최근접 질의를 결합한 안전 영역 할당 기법에 대해서 연구를 진행했다. 기존의 안전 영역은 객체간의 거리만으로 할당을 했지만, 본 논문에서는 객체간의 속성이 다르면 안전 영역을 할당하지 않는 기법을 제안했다. 실험결과 기존의 알고리즘 보다 통신 비용이 감소함을 확인할 수 있었지만 K 값에 따른 오차가 발생함을 확인했고 향후, 연구를 지속할 필요가 있다.

  • PDF

시계열 데이터베이스에서 순위를 지원하는 서브시퀀스 매칭 방법을 위한 시각화 툴 (A Visualization Tool for Ranked Subsequence Matching in Time-Series Databases)

  • 이성진;이진수;조훈;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.787-788
    • /
    • 2009
  • 시계열 데이터(time-series data)는 연속적인 데이터를 고정된 시간 간격으로 샘플링한 실수 값들의 연속을 의미한다. 시계열 데이터의 예로는, 음악 및 동영상 데이터, 심전도 데이터, 주식 그래프 등의 데이터가 있다. 시계열 데이터는 다시 데이터베이스에 저장 되어있는 데이터 시퀀스(data sequence)와, 사용자에 의해 주어지는 질의 시퀀스(query sequence)로 분류된다. 시계열 데이터베이스(time-series database)에서 순위를 지원하는 서브시퀀스 매칭 방법(ranked subsequence matching)은 데이터 시퀀스와 질의 시퀀스가 주어졌을 때, 질의 시퀀스의 길이와 같은 데이터 시퀀스의 서브시퀀스(subsequence)들 중에서 질의 시퀀스와 가장 유사한 상위 k개의 서브시퀀스들을 찾는 것이다. 본 논문의 목적은 사용자가 매칭 방법에 대한 인식과 이해가 부족하더라도 기존의 콘솔 기반의 매칭 프로그램을 보다 쉽게 사용할 수 있도록 이용성을 향상시키기 위하여 시각화 툴을 개발하는 것이다. 구체적으로, 5가지 시각화(visualization) 기능을 제공하는 사용자 인터페이스를 구현하였다. 구현된 사용자 인터페이스를 통해 사용자가 기존의 매칭 프로그램을 보다 쉽고 간편하게 사용할 수 있도록 기여한다.

EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법 (EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System)

  • 이춘근;김정원;김영주;정기동
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2294-2304
    • /
    • 1999
  • 본 논문은 병렬 입출력과 효율적인 디스크 접근을 이용하여 입출력 성능을 높임으로써 지리 정보 시스템의 질의 처리 성능을 향상시키는 것을 목적으로 한다. 동시에 접근할 가능성이 높은 인접한 공간 데이터를 디스크의 논리적 블록 단위로 패킹하여 하나 또는 연속적인 논리적 블록으로 클러스터링 하면 한번의 디스크 접근으로 많은 공간 데이터를 읽을 수 있어 질의 처리에 따른 디스크 접근 횟수와 디스크 접근 오버 헤드를 줄임으로써 입출력 시간을 줄일 수 있다. 본 논문에서는 기존 Parallel R-tree 기법의 병렬 입출력 기법과 패킹 기반 클러스터링 기법을 결합하여 효율적인 입출력을 지원하는 EPR(Enhanced Parallel R-tree) 색인 기법을 제안한다. EPR 기법의 주요 특징은 다음과 같다. 첫째, 공간 데이터를 Hilbert space filling curve를 이용하여 인접도에 따라 정렬하여 패킹함으로써 상향식으로 R-tree를 생성한다. 둘째, 정렬된 공간 데이터를 패킹하여 하나 또는 연속적인 논리적 블록에 저장하는 패킹 기반 클러스터링을 통해 공간 데이터 클러스터를 구성한다. 셋째, 색인 기법 및 공간 데이터 클러스터를 round-robin 스트라이핑 방식을 통해 다중 디스크에 분산 배치한다. EPR 기법과 기존 PR 기법의 성능을 비교한 결과, 공간 질의 처리 속도가 30% 이상 향상되었으며, 특히 논리적 블록의 크기가 클수록, 공간 데이터의 크기가 작을수록 질의 처리 성능이 향상되는 결과를 보였다.

  • PDF

RFID 데이터 스트림에 대한 분산 연속질의 처리 기법 (Distributed Continuous Query Processing Scheme for RFID Data Stream)

  • 안성우;홍봉희;정동규
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.1-12
    • /
    • 2009
  • RFID를 적용한 기업의 활동이 점차 글로벌화 됨에 따라 RFID 네트워크에 흩어져 있는 제품의 정보를 효율적으로 수집하는 것이 필요하다. 특히, 공급망의 제품 현황을 파악하기 위해서는 해당 제품의 통계정보를 추출할 수 있는 질의를 제공해야 한다. 그러나 기존의 RFID 네트워크에서는 이러한 질의를 제공하지 않기 때문에 RFID 응용이 RFID 미들웨어에 직접 질의를 등록하고 수집된 결과를 분석해야 한다. 이러한 과정은 RFID 응용에게 높은 질의 처리 비용을 요구하는 문제가 발생된다. 이러한 문제를 해결하기 위해서 본 논문에서는 RFID 네트워크에 분산되어 있는 제품의 정보를 찾아내어 통계정보를 추출할 수 있는 분산 연속질의를 정의하고, 이를 효과적으로 처리하기 위한 분산 연속질의 시스템을 제안한다. 제안된 분산 연속질의 시스템은 여러 RFID 시스템 간의 제품의 이동을 실시간으로 탐지하기 위해서 Pedigree를 사용한다. 또한 Pedigree를 이용하여 동일 제품에 대한 중복 데이터가 수집되었을 때 이를 손쉽게 걸러 냄으로써 질의 결과 생성에 대한 비용을 줄여주고 있다.

향상된 그리드 색인을 이용한 이동 객체의 연속 질의 처리 (Continuous Range Queries Processing of Moving Objects using Enhanced Grid Indexing)

  • 박용훈;복경수;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.341-344
    • /
    • 2006
  • 본 논문은 위치 기반 서비스에서 중요한 질의 형태중의 하나인 연속 범위 질의를 효율적으로 처리하기 위한 질의 처리 기법을 제안한다. 본 논문에서는 기존 그리드 기반 질의 색인 기법을 변형하여 분할된 셀들을 그룹 단위로 관리하고 객체의 이동 변화에 따른 질의 결과의 변화를 빠르게 처리하기 위해 각 그룹에 포함된 질의들에 비트 식별자를 부여한다. 이러한 기법은 다수의 셀에 포함된 질의를 표현하기 위해 저장되는 질의 식별자의 수를 감소시킬 수 있으며 각 질의에 부여된 비트 식별자를 이용하여 객체의 갱신으로 인해 영향을 받는 질의를 빠르게 판단할 수 있다. 성능평가를 통해 제안하는 기법이 기존 질의 처리 기법에 비해 우수한 성능을 보여줌을 입증한다.

  • PDF

RFID 미들웨어를 위한 질의 색인 기법에 관한 연구 (A Study of Query Indexing Scheme for RFID Middleware)

  • 박재관;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.155-160
    • /
    • 2005
  • 최근 이동체 또는 센서 데이터에 대한 연속 질의를 처리하기 위해 다양한 질의 색인 기법들이 연구되고 있다. 그러나 RFID 미들웨어는 이전 연구에서 고려되지 않은 특징이 존재한다. 첫째, 질의 색인에 삽입되는 질의는 Industry, Product, Serial의 세 부분으로 구성되며, 각 값은 범위 값으로 표현될 수 있기 때문에 색인 공간에서 비연속적인 간격의 조각들이 반복해서 나타난다. 둘째, TagID가 가지는 Industry, Product, Serial의 값은 포함관계를 가진다. 즉, 하나의 Industry에 여러 Product가 존재하며, 하나의 Product에 여러 Serial Item이 존재한다. 따라서 이러한 특징을 고려하지 못하는 기존의 질의 색인을 적용하면 다수의 질의 조각을 삽입하게 되어 색인의 성능이 급격히 저하되는 문제점이 있다. 이 논문에서는 RFID 미들웨어의 실시간 필터링 및 컬렉션을 위해서 Tag 스트림에 대한 질의 색인 기법을 제안한다. 이 논문은 ECSpec 필터링 범위의 3단계 계층구조 특징을 고려한 코드 분할(Code Segmented) 도메인을 제시하고 이를 위한 그리드 기반 색인 구조를 제안한다. 또한 ECSpec의 필터링 패턴 특징에 의해 나타나는 질의 조각의 반복 현상을 정의하고 이를 위한 질의 처리 기법을 제시한다.

  • PDF

The XP-table: 다중 연속 XPath 질의의 집단 처리를 위한 실행시간 효율적인 영역 기반 구조체 (The XP-table: Runtime-efficient Region-based Structure for Collective Evaluation of Multiple Continuous XPath Queries)

  • 이현호;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.307-318
    • /
    • 2008
  • XML 메시지 중계기에서의 주요 이슈들 중 하나는 XML 스트림에 대한 다중 연속 XPath질의를 효율적으로 처리하는 방안이다. 본 연구는 이 문제를 효과적으로 해결하기 위한 시스템을 제안한다. 제안되는 시스템에서는 XPath 질의집합을 XP-table이라는 새로운 영역 기반 데이터 구조로 변환한다. XP-table은 대상 질의들의 공통적인 선택조건들을 공유하며, 실행시간 질의 수행 전에 구축된다. XML 스트림은 XP-table과의 효율적 매칭을 위해 스트림 릴레이션(SR)으로 실행시간에 변환된다. 제안된 시스템에서는 XML의 구조적 특성을 반영한 XP-table과 SR 간의 효과적인 매칭 전략이 제시된다. 또한, YFilter나 LazyDFA와 같은 기존 방법론과의 비교를 포함한 일련의 실험들을 통해, 제안 시스템이 질의 처리의 실행시간 부하를 줄임으로써 시간 효율성이 중요한 스트림 환경에서의 안정적 데이타 처리 능력을 보여준다.