• 제목/요약/키워드: 질의 분할

검색결과 1,660건 처리시간 0.033초

윈도우 제약 조건을 가지는 시간 왜곡 변환 기반 유사 시퀸스 검색 (Similar Sequence Searching under Time Warping with Window constraint)

  • 김인태;송병호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2001
  • 유사 시퀸스 검색에서 시간 왜곡 변환을 지원하기 위한 연구가 최근 활발히 이루어지고 있다. 음성 인식과 같은 몇몇 응용에서는 시간 왜곡 변환을 적용할 때 과도한 타이밍의 차이는 허용하지 않을 필요가 있다. 그래서 대부분의 경우 윈도우라는 제약 조건을 추가하게 된다. 이 논문에서는 윈도우 제약 조건이 있을 때 시간 왜곡 변환을 지원하는 유사 검색 방법으로 세그먼트 분할 기법(Segment Partition Approach:SFA)을 제안한다. SFA는 각 시퀸스를 세그먼트로 분할한 뒤 특징을 추출하여 다차원 인덱스를 구성한다. 유사 검색 질의를 수행할 때 이 인덱스를 검색하여 질의 시퀸스와 유사할 가능성이 큰 후보들을 빠르게 찾아낼 수 있고 찾아낸 후보들에 대해서만 정확한 시간 왜곡 변환 거리를 계산하기 때문에 전체 질의 처리 시간을 단축할 수 있다. SPA는 순차 검색에 비하여 좋은 성능을 보이며, 특히 거리 허용치가 작을 때 더욱 우수한 성능을 보인다.

  • PDF

지역 질의 생성기반 전역 XQuery 질의 처리 기법 (A Global XQuery Query Processing based on Local XQuery Query Generation)

  • 박종현;박원익;김영국;강지훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.11-20
    • /
    • 2010
  • XML 뷰는 분산 환경에서 이종 데이터들을 XML 데이터처럼 바라보며 XML로 통합하기 위한 방법으로 제안되었으며, 전역 XML 뷰는 분산되어 있는 다양한 형태의 이종 데이터들을 단일의 XML 데이터처럼 바라보며 질의할 수 있도록한다. 이때사용자가 사용하는표준질의어는 XQuery이며, 전역XML 뷰를대상으로 작성된 질의가 바로 전역XQuery 질의이다. 그러므로이를효과적으로 처리하기위한방법은분산 환경에서이종데이터들사이의 통합 및 검색을 위한 연구의 주제이다. 기존 SQL 질의 처리에서 알 수 있는 것처럼, 분산 질의 처리를 위한 방법들 가운데 가장 범용적으로 사용되는 방법 중 하나는 전역 질의를 지역 질의로 분할하여 분할된 지역 질의들을 처리하고, 그 결과를 취하여 전역 질의의 결과로 재구성하는 것이다. 그러나 XQuery는 FOR 절과 같은 SQL 질의어에서는 찾아볼 수 없는 복잡한 구조적 특성을 갖는다. 그러므로 전역 XQuery 질의의 처리를 위해 지역 질의를 생성하기 위해서는 고려해야 할 사항들이 존재한다. 본 논문에서는 전역 SQL 질의 처리를 위한 지역 질의 생성 기법을 전역 XQuery 질의의 처리를 위해 적용할 때 발생하는 문제점을 정의하고 이를 해결하기 위한 방법을 제안한다. 또한, 제안한 방법을 기반으로 하는 전역 XQuery 질의 처리기를 구현하여 그 효율성을 보인다.

효율적인 시공간 영역 질의 처리를 위한 궤적 색인의 노드 재배치 전략 (A Node Relocation Strategy of Trajectory Indexes for Efficient Processing of Spatiotemporal Range Queries)

  • 임덕성;조대수;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.664-674
    • /
    • 2004
  • TB-tree와 같이 시공간에서 궤적 검색을 위한 색인 구조는 단말 노드에 하나의 궤적만을 저장하는 궤적 보존의 특성을 가지기 때문에 궤적의 일부분을 추출하는 항해 질의(Navigational Query)에서 우수한 성능을 보인다. 그러나, 궤적 보존을 위해 공간적 지역성을 완전히 배제하는 구조를 가짐으로써 비단말 노드의 MBR(Minimum Bounding Rectangle)은 큰 사장 영역을 가지는 단점이 있다. 사장 영역 증가는 노드간의 중첩을 높이는 원인을 제공하기 때문에 영역 질의의 성능을 저하시키는 문제가 있다. 이 논문에서는 궤적 검색을 위한 색인 구조에서 항해질의 성능을 유지하면서 영역 질의의 성능을 향상시키기 위한 비단말 노드 분할 정책과 엔트리 재배치 정책을 제시한다. 분할 정책은 비단말 노드의 분할시 비단말 노드의 MBR을 최대한 감소시키는 최대 영역 축소(Maximal Area Reduction) 정책을 사용하고, 엔트리 재배치 정책은 비단말 노드를 구성하는 다수의 엔트리에서 MBR을 최대로 감소시킬 수 있는 엔트리의 위치를 재배치시키는 방법으로 이 논문에서는 분할 방법에 따라 2가지 재배치 전략을 제시하고 TB-tree와 성능을 비교한다.

SQL:1999를 이용한 XPath질의 처리기의 설계 (Design of XPath Query Processor Using SQL: 1999)

  • 황정수;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.160-162
    • /
    • 2004
  • 인터넷에서 XML은 새로운 정보 환경의 요구사항인 확장성과 문서 관계성의 우수성을 만족하는 표준이다. 이러한 XML 문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 또한, XML 문서의 체계적인 운용을 위해 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구에서는 분할 저장 시스템에서 RDBMS 또는 ORDBMS에 XML 문서를 저장하고 검색할 수 있도록 하는 XPath 질의 처리기를 SQL:1999를 이용하여 설계함으로써 좀더 정확하고 빠르게 처리가 가능하도록 하였다.

  • PDF

색상의 공간적 분포를 이용한 이미지 검색에 관한 연구 (A Study on Image Retrieval Using the Spatial Distribution of Color)

  • 김용광
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.183-189
    • /
    • 2006
  • 이 연구에서는 색상 자질을 이용하여 이미지를 검색할 때 이미지를 분할하여 각 영역별로 색인하여 검색하는 것의 유용성을 알아보고 분할된 영역간의 유사도 산출 기법을 제안하였다. 실험결과, 질의 이미지의 특정 영역과 최대의 유사도를 갖는 검색 이미지의 영역을 이미지간 유사도 산출 방법으로 이용하고, 이미지 영역을 세분할수록 이미지 검색 성능이 향상되었다. 특히 검색 성능이 좋지 않은 질의 이미지의 경우, 이 연구에서 제안한 기법이 더욱 유용하였다.

  • PDF

이동체 데이타베이스에서 복합 질의를 위한 궤적 분할 트리의 설계 및 구현 (Design and Implementation of Trajectory Riving Tree for Combined Queries in Moving Object Databases)

  • 임덕성;전봉기;홍봉희;조대수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.150-162
    • /
    • 2004
  • 이동체는 시간에 따라 위치를 변경하는 특성과 이동체의 경로는 궤적으로 표현되는 특성을 가진다. 이동체 궤적 데이타에 대한 저장 및 검색을 처리하는 이동체 데이타베이스 시스템에서는 효율적인 데이타 접근 방법이 필요하다. 특히 궤적 검색을 위한 대표적인 질의 유형인 복합 질의는 영역내의 궤적 검색과 궤적의 일부분을 추출하는 과정을 포함한다. 그러나, 영역 질의에 우수한 색인 방법은 부분 궤적을 추출하기 위한 비용이 높은 단점을 가진다. 반면, 궤적 질의를 위한 색인 방법의 경우 노드간의 중첩이 매우 높아 영역내의 궤적 검색 비용이 높은 단점이 있다. 이 논문에서는 이동체 데이타베이스에서 복합 질의를 효율적으로 처리하기 위해 TR-tree를 제시한다. TR-tree는 궤적 질의를 위해 궤적 보존 및 단말 노드의 용량을 증가시키고, 영역 질의 처리를 위해 사장영역과 MBB(Minimum Bounding Box)의 중첩을 감소시키는 논리적 궤적 분할을 지원하는 특징을 가진다. 실험 평가에서 TR-tree는 STR-tree, TB-tree의 복합 질의 성능 비교에서 평균 25%의 노드 접근 회수를 감소시킨다.

데이타 중심 센서 네트워크에서 에너지 효율성을 고려한 비균등 네트워크 분할 기법 (A Non-Uniform Network Split Method for Energy Efficiency in Data-Centric Sensor Networks)

  • 강홍구;김정준;박춘걸;한기준
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2007년도 GIS 공동춘계학술대회 논문집
    • /
    • pp.59-64
    • /
    • 2007
  • 데이타 중심 센서 네트워크에서는 측정된 데이타의 값에 따라 데이타를 저장하는 센서 노드가 결정되기 때문에 같은 값을 갖는 데이타가 빈번하게 발생하면 이를 저장하는 센서 노드에 부하가 집중되어 에너지가 빠르게 고갈되는 문제가 있다. 또한 센서 네트워크가 확장되면 데이타 저장 및 질의 처리시 목적 센서 노드로의 라우팅 거리가 멀어져 통신 비용이 증가되는 문제가 있다. 그러나 기존 연구들은 데이타 저장의 효율적인 관리에만 치우쳐 이와 같은 문제를 효율적으로 해결하지 못하고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 비균등 네트워크 분할(Non-Uniform Network Spilt: NUNS) 기법을 제안한다. NUNS는 센서 네트워크를 센서 노드 개수와 분할된 영역 크기 차이가 최소가 되도록 비균등 크기의 Partition으로 분할하고 각 Partition에서 발생한 데이타를 그 Partition 내의 센서 노드가 저장 관리함으로써 센서 노드의 데이타 저장 부하를 분산시키고, 센서 네트워크의 확장에 따른 통신 비용을 줄인다. 그리고 NUNS는 각 Partition을 분할된 영역 크기 차이가 최소가 되도록 센서 노드 개수만큼 비균등하게 Zone으로 분할함으로써 센서 노드가 없는 Zone으로 인해 센서 노드에 부하가 집중되는 것을 막고 불필요한 라우팅 비용을 줄인다.

  • PDF

요약된 Partitioned-Layer Index: Partitioned-Layer Index의 임의 접근 횟수를 줄이는 Top-k 질의 처리 방법 (Abstracted Partitioned-Layer Index: A Top-k Query Processing Method Reducing the Number of Random Accesses of the Partitioned-Layer Index)

  • 허준석
    • 한국멀티미디어학회논문지
    • /
    • 제13권9호
    • /
    • pp.1299-1313
    • /
    • 2010
  • Top-k 질의는 데이터베이스에서 사용자가 가장 원하는 k개의 객체를 구하는 질의이다. Top-k 질의를 효율적으로 처리하는 대표적인 연구로 Partitioned-Layer Index (간단히, PL-index) 방법이 있다. PL-index는 데이터베이스를 여러 개의 더 작은 데이터베이스로 분할하고 각 분할된 데이터베이스에 대해 sublayer들의 list (간단히, sublayer list)를 구성한다. 이때, 분할된 데이터베이스에 대해서 top-i 결과가 될 수 있는 객체들을 그 분할된 데이터베이스에 대한 i번째 sublayer로 구성한다. 그리고 주어진 질의에 맞춰 그 sublayer list들을 병합함으로써 질의 결과를 구한다. PL-index는 질의 처리 시 데이터베이스로부터 읽어 들이는 객체의 개수가 매우 작다는 장점을 가지지만, sublayer list들을 병합할 때에 임의 접근(random access)이 많이 발생하기 때문에 디스크 기반의 데이터베이스 환경에서 질의 처리 성능이 저하된다. 이에 본 논문에서는 임의 접근 횟수를 줄임으로써 디스크 기반의 데이터베이스 환경에서 PL-index의 질의 처리 성능을 크게 향상시키는 요약된(Abstracted) Partitioned-Layer Index (간단히, APL一index)를 제안한다. 먼저, PL-index의 각 sublayer를 가상의 (점) 객체로 요약함으로써 sublayer list들을 이러한 점 객체들의 list들(즉, APL-index)로 변형한다. 그리고 APL-index에 대해 질의 처리를 가상으로 수행하여 실제 질의 처리 시 접근할 sublayer를 예측한다, 그리고 예측된 sublayer들을 sublayer list별로 한꺼번에 읽어 들임으로 PL-index에서 발생하는 임의 접근 횟수를 줄인다. 합성 데이터와 실제 데이터에 대한 실험을 통하여 제안한 APL-index가 PL-index의 임의 접근 횟수를 크게 줄일 수 있음을 보인다.