• Title/Summary/Keyword: 질의 분할

검색결과 1,659건 처리시간 0.034초

질의 결과 크기 추정을 위한 효과적인 공간 분할 기법 (Effective Spatial Partitioning Technique for Query Result Size Estimation)

  • 김현국;김학자;황환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.55-57
    • /
    • 2002
  • 공간 데이터베이스의 규모는 매우 방대하여 질의 처리에 많은 비용이 발생한다. 따라서 효율적인 질의 처리를 위해서는 질의 수행 결과의 예측이 필요하다. 이를 위해 실제 공간 데이터의 특성을 근접하게 나타내는 요약 데이터를 생성하여 그 결과를 통해 질의 결과의 크기를 추정하게 된다. 기존의 공간 데이터 요약 기법으로는 면적 균등 분할 기법, 개수 균등 분할 기법, 인덱스 분활 기법 등이 있다. 본 논문에서는 기존에 연구된 다양한 분말 기법에 대해 알아보고, 힐버트 공간 재움 곡선 방법에 개수 균등 분말 기법을 적용시킨 새로운 공간 분할 방법을 제안하여 기존의 방법과 새로운 방법의 성능을 비교한다.

  • PDF

효율적인 센서 네트워크 관리를 위한 다중 연속질의 분할 (The Multiple Continuous Query Fragmentation for the Efficient Sensor Network Management)

  • 박정업;조명현;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2006
  • 최근 센서네트워크에 관련된 많은 연구가 진행되고 있다. 특히, 센서의 전력 보전을 위한 많은 기술들이 개발되고 있는데, 본 논문에서는 센서 네트워크의 불필요한 전력 소비를 줄이는 다중 연속질의 최적화에 관련된 방법을 제시한다. 우리는 센서 네트워크에서 전송되는 데이터의 횟수나 전송량의 원천적 문제가 되는 다중 연속 질의의 중복성 문제를 해결하는 분할 알고리즘을 제안한다. 분할 알고리즘은 새롭게 생성된 사용자 질의와 기존의 질의 들 사이에 질의 중첩 질의 영역을 제거하기 위해, QR-트리 기반의 질의 인덱스를 통해 하나의 질의를 둘 이상의 질의로 분할하는 알고리즘이다. QR-트리는 효율적인 질의 분할을 위해, $R^*$-트리를 본 논문의 구조에 맞게 개량한 것이다.

  • PDF

RFID 미들웨어에서 이벤트 필터링을 위한 질의 색인 기법 (A Query Indexing Method for Filtering Event Data in RFID Middleware Systems)

  • 석수욱;박재관;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.19-21
    • /
    • 2005
  • EPCglobal은 RFID와 관련된 다양한 분야의 표준화를 주도하고 있으며 응용 표준으로써 Tag 정보의 운용을 위한 미들웨어 표준인 ALE Specification을 제시하였다. ALE의 ECSpec은 애플리케이션이 미들웨어에 등록하는 이벤트 필터링을 위한 스펙으로써 일정 시간동안 반복적으로 수행되는 연속 질의와 유사한 특성을 가진다. ECSpec을 연속질의로 변환할 때 해당질의의 WHERE절이 가지는 Predicate는 매우 긴 길이를 가지는 Long Interval이 된다. 이러한 특성은 기존의 질의 색인들의 삽입과 검색 성능을 저하시키는 문제점을 가진다. 이 논문에서는 ECSpec을 연속 질의의 형태로 변환하고 해당 질의가 기지는 Predicate인 2D Interval의 특성을 반영한 새로운 질의 색인 구조로써 TLC-Index를 제안한다. 색인 구조는 그리드 방식의 큰 크기를 가지는 셀 분할 구조와 선분 모양의 가상 분할 구조를 병행하는 하이브리드 구조이다. 색인에서 Long Interval의 정의는 셀 분할 구조의 길이보다. 크거나 같은 길이를 가지는 interval이다. 제안하는 색인은 Long Interval을 큰 크기를 가지는 셀 분할 구조로 분할 삽입함으로써 저장 공간의 소모를 줄이고 삽입 성능을 향상시킨다. 또한 Short Interval들을 짧은 길이를 가지는 가상 분할 구조들로 분할 삽입함으로써 그리드 방식이 가질 수 있는 부분적 겹침을 제거하여 검색 성능을 향상시킨다.

  • PDF

질의 확장을 이용한 병렬 정보 검색 (Parallel Information Retrieval with Query Expansion)

  • 정유진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.103-105
    • /
    • 2002
  • 이 논문에서는, PC 클러스터 환경에서 질의 확장을 사용하는 정보 검색 시스템 (IR)을 설계하고 구현한 내용을 기술한다. 이 정도 검색 시스템은 문서 집합을 저장하고, 문서 집합은 역색인 파인 (IIF)로 색인되고, 랭킹 방법으로 벡터 모델을 사실하며, 질의 확장 방법으로 코사인 유사도를 사용한다. 질의 확장이란 사용자가 준 원래의 질의에 연관된 단어를 추가하여 검색 효율을 향상시키는 것이다. 여기서 제안하는 병렬 정보 검색 시스템에서는 역색인 과일은 여러 개로 분활되는데 lexical 분할 방법과 greedy 분할 방법을 사용한다. 사용자의 질의가 들어오면 질의확장을 하여 여러 개의 단어로 이루어진 확장된 질의가 만들어 지는데 이 확장된 질의를 구성하는 단어들은 각 단어와 연관된 IIF를 가지고 있는 노드에 보내어져서 병렬로 처리된다. 실험을 통하여 병렬 IR 시스템의 성능이 질의 확장과 IIF의 두 가지 분한 방법에 의해 어떻게 영향을 받는지 보인다. 실험에는 표준 한국어 테스트 말뭉치인 EKSET과 KTSET을 사용하였다. 실험에 따르면 greedy 분활 방법이 lexical 분할 방법에 비해 20%정도의 성능 향상을 보였다.

  • PDF

영역 모니터링 질의 처리를 위한 공간 분할 기법 (A Spatial Split Method for Processing of Region Monitoring Queries)

  • 정재우;정하림;김응모
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.67-76
    • /
    • 2018
  • 본 논문은 영역 모니터링 질의를 효율적으로 처리하는 기법에 대해서 다룬다. 기존의 영역 모니터링 질의 처리를 위해서 사용된 중앙 집중식 기법은 이동 객체가 서버에 주기적으로 자신의 위치 업데이트를 전송하고, 서버가 질의 결과를 지속적으로 업데이트 한다고 가정한다. 그러나 이러한 가정은 많은 양의 위치 데이터 전송으로 인해 시스템 성능을 크게 저하시킨다. 최근, 영역 모니터링 질의 처리를 위한 몇 가지 분산 기법들이 제안되었다. 분산 기법에서 서버는 각 이동 객체에게 I) 작업 공간의 서브 공간인 상주 도메인과 ii) 몇 개의 인접 질의 영역을 할당한다. 각 이동 객체는 상주 도메인을 벗어나거나 질의 영역의 경계를 가로지를 경우에만 서버에게 자신의 위치를 전송한다. 상주 도메인 및 인접 질의 영역을 이동 객체에 할당하기 위해서 서버는 작업 공간을 반복적으로 동일하게 반으로 분할하여 생성되는 질의 색인 구조를 사용한다. 하지만 이와 같은 색인 구조는 불필요한 분할이 발생하게 되므로 시스템의 성능 저하를 발생시킨다. 본 논문에서는 불필요한 분할을 줄이기 위해서 적응 분할 기법을 제안한다. 적응 분할 기법은 I) 질의 영역과 결과 서브 공간의 공간적 관계와 ii) 질의 영역의 분포를 고려하여 동적으로 작업 공간을 분할한다. 본 논문에서는 기존의 색인 구조인 QR-tree에 본 논문에서 제안한 새로운 분할 기법을 적용하였으며, 시뮬레이션을 통해 제안 된 분할 기법의 효율성을 검증했다.

공간 질의 최적화를 위한 힐버트 공간 순서화에 따른 공간 분할 (Spatial Partitioning using filbert Space Filling Curve for Spatial Query Optimization)

  • 황환규;김현국
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.23-30
    • /
    • 2004
  • 공간 질의 크기에 대한 근사치를 구하기 위해서는 입력 데이터 공간을 분할한 후 분할된 영역에 대하여 질의 결과 크기를 추정한다. 본 논문에서는 데이터 편재가 심한 공간 데이터에 대한 질의 크기 추정의 문제를 논의한다. 공간을 분할하는 기법으로 관계 데이터베이스에서 많이 사용되는 너비 균등, 높이 균등 히스토그램에 해당되는 면적 균등, 개수 균등 분할에 대한 방법을 검토하고 공간 인덱싱에 기초한 공간 분할방법에 대해서 알아본다. 본 논문에서는 공간 순서화 기법인 힐버트 공간 채움 곡선을 이용한 공간 분할을 제안한다. 제안한 방법과 기존의 방법을 실제 데이터와 인위 데이터를 사용하여 편재된 공간 데이터에 대한 질의 결과 크기의 추정에 대한 정확도를 비교한다. 본 실험에서 힐버트 채움 곡선에 의한 공간 분할이 공간 질의 크기 버켓 수의 변화, 데이터 위치 편재도의 변화, 데이터 크기의 변화에 대해서 기존의 분할 방법보다 질의 결과 크기 추정에 대해서 우수한 성능을 보였다.

최대 면적 차이 분할 방법을 이용한 선택률 추정 (Selectivity Estimation using Maximum Area Difference)

  • 이미란;황환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.109-111
    • /
    • 2001
  • 공간데이터베이스에서 공간 질의를 최적화하기 위해서는 질의 결과 크기를 계산하는 것이 필수적이다. 그러나 공간 데이터베이스의 크기는 매우 방대하여 질의 결과 크기를 계산하는데 비용이 많이 든다. 이러한 문제를 해결하기 위해서는 실제 공간 데이터의 분포와 특성에 근접하도록 공간 데이터의 분포를 요약하여 이를 토대로 질의 결과 크기를 추정하는 것이 효과적이라 할 수 있다. 공간 분할 방법에는 균등분할 방법과 비균등 분할 방법이 있으면, 본 논문에서 제안한 방법은 1차원 데이터에 대한 선택률 추정기법 중에서 그 성능이 가장 우수하다고 평가된 바 있는 최대 면적 차이 분말을 공간 데이터베이스에 적용하여 공간 분할하는 것이다. 공간 데이터베이스에서 선택을 추정 방법은 공간 분할 방법에 따라 성능상의 차이가 있으며 본 논문은 기존의 방법과 제안한 방법을 실험을 통하여 선택률 추정의 정확성을 비교, 평가하여 제안한 방법이 우수함을 보였다.

  • PDF

공간 분할 방법을 사용하는 Skyline 질의 방법의 문제점 비교 분석 (A Problem Analysis of Skyline Queries using Space Partitioning Techniques)

  • 임선영;박은영;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1382-1384
    • /
    • 2012
  • 최근 대용량 혹은 복잡한 데이터에서의 빠른 검색을 돕는 Skyline 질의 처리에 대한 관심이 높아지고 있으며, 많은 응용프로그램에서 사용되고 있다. Skyline 질의는 데이터베이스의 튜플들을 공간상으로 표현하여 질의 처리를 할 수 있는 데, 이 때 빠른 처리를 위하여 공간 분할 기법이 사용된다. 본 논문에서는 공간 분할 기법을 사용한 Skyline 질의 방법들을 소개하고 문제점을 분석한다. 또한, 문제점 해결 방안을 함께 제시하며 기대 효과를 예측한다.

자원 효율적인 XML 조각 스트림 질의 처리를 위한 XML 분할 (XML Fragmentation for Resource-Efficient Query Processing over XML Fragment Stream)

  • 김진;강현철
    • 정보처리학회논문지D
    • /
    • 제16D권1호
    • /
    • pp.27-42
    • /
    • 2009
  • 유비쿼터스 컴퓨팅의 실현을 위해서는 이동 디바이스 등 클라이언트의 제약된 자원을 효율적으로 사용하는 기법이 요구된다. 메모리 용량이 크지 않은 이동 디바이스의 경우, 대용량 XML 데이터에 대한 질의 처리를 수행하기 위해서는 XML 스트림 질의 처리 기술의 활용이 필수적이다. 최근에 서버에서 XML 문서를 XML 조각(XML fragment)으로 분할하여 스트리밍하고 클라이언트에서 이 조각 스트림을 받아 질의를 처리하는 기법들이 제안되었다. XML 조각 스트림 질의 처리에 있어 XML 문서가 분할되는 방법에 따라 자원 사용(질의 처리 시간 및 메모리 사용량) 면에서 큰 차이가 날 수 있기 때문에 효율적인 XML 문서 분할 방법이 요구된다. 본 논문에서는 클라이언트의 질의 처리 시 자원 사용 효율을 높이기 위한 XML 문서 분할 기법을 제시한다. 이를 위하여 먼저 XML 조각 스트림 질의 처리의 비용 모델을 제시하고, 자원 효율적인 XML 문서 분할 알고리즘을 제시한다. 구현 및 성능 평가 결과 본 논문에서 제시한 기법이 기존 기법들에 비해 질의 처리 시간 및 메모리 사용량 양면 모두에서 우수한 것으로 나타났다. 본 논문의 기여는 XML 조각 스트림 질의 처리 기술의 실용화 가능성을 기존 기술에 비해 한 층더 높였다는 데 있다.

비공유 데이터베이스 클러스터에서 온-라인 확장을 위한 데이터 분할 기법의 분석 및 평가 (Analysis and Evaluation of Data Partitioning Methods or On-line Scaling in a Shared Nothing Database Cluster)

  • 장용일;이충호;이재동;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1859-1862
    • /
    • 2002
  • 비공유 데이터베이스 클러스터는 그 구조의 특성 상 동적인 질의 패턴의 변화, 특정 데이터에 대한 질의 집중에 의한 부하 불균형 및 집중, 사용자 증가에 의한 처리량 한계 등의 문제가 발생한다. 이러한 문제를 해결하기 위해 데이터베이스 클러스터는 최근에 제안된 온-라인 확장기법을 사용하며, 이 기법은 데이터 베이스의 확장성에 의해 큰 영향을 받는다. 일반적으로 클러스터 시스템에서 사용되는 데이터 분할 기법에는 키 값의 순서대로 분할하는 라운드-로빈 분할 기법, 해쉬 함수를 이용해 데이터를 분할하는 해쉬 분할 기법, 범위에 따라 각 노드에 데이터를 분할하는 범위 분할기법, 그리고 조건식에 따라 데이터를 분할하는 조건식 분할 기법이 있다. 본 논문에서는 이 네 가지 분할 기법의 특성을 정리하고, 비공유 데이터베이스 클러스터에서 확장성에 있어서 우수한 분할 기법을 각 분할 기법의 성능평가를 통해 얻는다. 성능평가에서는 각각의 분한 기법을 평가하기 위해 확장 시 발생되는 이동 데이터의 크기, 질의처리에 대한 영향, CPU 사용률, 그리고 온-라인 확장기법의 수행 시 발생되는 특성에 대한 영향을 분석하며, 얻어진 결과를 토대로 비공유 데이터베이스 클러스터에서 가장 적합하면서도 온-라인 확장 기법적용을 위해 확장성이 우수한 데이터 분할기법을 찾는다.

  • PDF