• 제목/요약/키워드: query clustering

검색결과 120건 처리시간 0.021초

R-tree에서 Seeded 클러스터링을 이용한 다량 삽입 (Bulk Insertion Method for R-tree using Seeded Clustering)

  • 이태원;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.30-38
    • /
    • 2004
  • 지구 관측 시스템(EOSDIS)나 많은 수의 클라이언트를 추적하는 이동전화 서비스 등 많은 응용에서는 지속적으로 생겨나는 대량의 복잡한 데이타들을 보관하고 인덱싱하는 것이 매우 어려운 일이다. 다차원 데이타를 효과적으로 관리하기 위해 R-tree에 기반 한 인덱스 구조가 널리 사용되어 왔다. 본 논문에서는 빠른 데이타 생성 속도를 따라잡으면서 대량 삽입을 통해 R-tree를 관리할 수 있는 seeded clustering이라는 확장성 있는 기법을 제안한다. 이 기법에서는 삽입할 대상 R-tree의 상위 k레벨의 구조를 활용하여 시드 트리를 만들어 삽입 데이타를 분류해 클러스터를 생성한다. 그리고 각 클러스터로부터 삽입 R-tree를 생성하고 이를 대상 R-tree에 한 번에 하나씩 삽입한다. 논문에서는 자세한 알고리즘과 함에 다양한 실험 결과를 보여준다. 실험 결과를 통해 seeded clustering을 이용한 대량 삽입이 기존의 대량 삽입 기법들과 비교해 삽입이나 질의 처리 모두에서 우수함을 알 수 있다.

공간 연속질의 처리에서 영역 기반의 저장 구조를 이용한 효율적인 디스크 접근 방법 (Efficient Disk Access Method Using Region Storage Structure in Spatial Continuous Query Processing)

  • 정원일
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2383-2389
    • /
    • 2011
  • 유비쿼터스 응용은 실시간으로 입력되는 데이터 스트림과 저장된 공간 데이터를 동시에 처리하는 이중적인 공간 연속 질의 처리 기술이 요구된다. 이러한 공간 연속 질의 처리에서는 대용량 공간 데이터에 대한 디스크 접근 비용을 최소화가 요구되나 기존 공간색인 기법은 논리적 인접성을 공간 데이터의 물리적인 인접성을 보장할 수 없으므로 공간 데이터 탐색에 있어 비용이 증가한다. 또한 데이터 인접성 보장을 위한 공간 순서화 기법의 경우에도 빈번하게 접근되는 질의 공간 영역에 대한 클러스터링을 고려하지 않고 있다. 본 논문에서는 이중적인 공간 연속질의 처리에서 공간 데이터의 효율적인 접근을 위한 영역 기반 저장 구조를 제안한다. 제안 기법에서는 영역을 기반으로 데이터를 인접하게 저장하고 사용자 질의를 영역 기반으로 그룹 처리함으로써 질의 처리 비용을 감소시킬 수 있다.

컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 (Object-Based Image Retrieval Using Color Adjacency and Clustering Method)

  • 이형진;박기태;문영식
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.31-38
    • /
    • 2005
  • 본 논문은 컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 기법을 제안한다. 컬러 인접성이란 영상내의 서로 이웃한 영역에서 나타나는 컬러의 특징값을 말하고, 영상 데이터베이스로부터 사용자가 찾고자하는 영역과 유사한 후보 영역들을 우선 추출하는데 사용된다. 또한 클러스터링 기법은 후보 영역들 가운데 객체가 존재하는 영역만을 추출하는데 사용되고, 질의 영상과 데이터베이스 영상 사이의 유사도 측정을 위하여 히스토그램 인터섹션(histogram intersection) 방법이 사용된다. 제안하는 방법에서 사용되는 영상의 컬러쌍 정보는 객체의 이동, 회전 그리고 크기 변화에 강건하며, 실험을 통하여 제안하는 방법이 기존의 방법보다 우수함을 확인하였다.

무선 센서 네트워크에서 질의 중계를 이용한 이동 객체의 위치 추적 방안 (Moving Object Tracking using Query Relaying in Wireless Sensor Networks)

  • 김상대;김천용;조현종;임용빈;김상하
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권11호
    • /
    • pp.598-603
    • /
    • 2014
  • 무선 센서 네트워크에서 객체의 위치 추적은 객체의 움직임 포착 및 동선 파악 등에 활용되는 중요한 어플리케이션이다. 따라서 객체의 정확한 동선을 파악하기 위해 추적의 정밀성이 중요하다. 하지만 기존의 연구들은 객체 추적을 위하여 사용자가 반복적으로 질의를 하기 때문에 에너지 효율성 및 정밀성이 떨어지게 된다. 따라서 본 논문에서는 객체 추적의 에너지 효율성 및 추적의 정밀성을 향상시키기 위하여, 각 노드들이 사용자의 질의를 객체의 예상 경로에 중계하는 방안을 제안한다. 이 방법은 객체 추적을 위하여 네트워크를 일정 크기로 클러스터링하고 각 클러스터 헤드를 트리로 구성한다. 객체를 감지한 클러스터 헤드는 트리를 통해 사용자에게 객체의 정보를 전달하고, 객체의 예상 경로에 위치한 클러스터 헤드에게 사용자의 질의를 중계해 줌으로써, 사용자의 반복적인 질의를 줄여준다. 시뮬레이션 결과, 제안방안이 기존의 객체 추적 연구에 비해 높은 에너지 효율과 추적 정밀성을 가지는 것을 보인다.

능동적 학습을 위한 군집화 기반의 다양한 복수 문의 예제 선정 방법 (Cluster-Based Selection of Diverse Query Examples for Active Learning)

  • 강재호;류광렬;권혁철
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.169-189
    • /
    • 2005
  • 능동적 학습은 훈련 예제의 수가 제한적일 때 효율적으로 분류기를 생성할 수 있는 학습 방법이다. 이 방법에서는 분류하기 모호한 예제에 카테고리를 부여하기 위한 문의 과정과 이렇게 얻어진 예제들을 추가해 가면서 분류기를 재생성 하는 과정을 반복적으로 수행한다. 특히 온라인 환경에서는 반복적으로 예제에 카테고리를 부여해야 하는 사용자의 부담을 줄이기 위해 문의 예제의 총 수뿐만이 아니라 문의 횟수 또한 최소화하여야 한다. 예제 수와 문의 횟수를 줄이면서도 좋은 분류기를 생성하기 위해서는 매 문의 시 사용자에게 다양하면서도 대표성이 높은 복수의 모호한 예제들을 선정하여 제시하는 것이 좋다. 본 논문에서는 다양하면서, 대표적이며, 또한 모호성이 높아 능동적 학습에 효과적인 복수의 문의 예제를 선별하기 위하여 군집화 기법을 활용하는 방안을 제안한다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과 모호성만을 기준으로 복수의 문의 예제를 선정하는 방법보다 우수한 분류기를 생성할 수 있음을 확인하였다.

  • PDF

무선 센서 네트워크에서 클러스터 기반의 Top-k 질의 처리 (A Cluster-Based Top-k Query Processing Algorithm in Wireless Sensor Networks)

  • 여명호;성동욱;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.306-313
    • /
    • 2009
  • 센서 네트워크 응용 분야에서 Top-k 질의는 가장 높은 혹은 가장 낮은 k개의 센서에 대한 유용한 정보를 제공한다. Top-k 질의 처리 시 에너지 소모를 줄이기 위한 많은 연구들이 진행되었다. FILA의 경우, 필터를 이용하여 불필요한 결과의 갱신을 제거하였으며, PRIM의 경우, 센싱된 데이타의 우선 순위를 부여하여 센서 데이타의 전송을 최소화하는 방법을 제안한다. 하지만, 같은 데이타 범위(프레임)에 속한 모든 데이타를 수집하기 때문에 데이타의 집중이 발생하면 많은 False Positive 데이타를 전송하는 문제가 발생한다. 본 논문에서는 Top-k 결과의 False Positive 데이타를 효과적으로 제거하기 위한 클러스터 기반의 새로운 Top-k 질의 처리 기법을 제안한다. 질의 처리 과정은 클러스터 레벨과 트리 레벨로 나누어지며, 각 레벨의 네트워크 토폴로지의 특성을 활용하여 False Positive 데이타를 효과적으로 필터링 한다. 성능 평가 결과, 기존 Top-k 질의 처리 기법에 비해 False Positive 데이타의 수가 70% 감소하고, 네트워크 수명이 약 105% 연장된다.

SPEC : 데이타 웨어하우스를 위한 저장 공간 효율적인 큐브 (SPEC: Space Efficient Cubes for Data Warehouses)

  • 전석주;이석룡;강흠근;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.1-11
    • /
    • 2005
  • 군집 질의는 사용자에 의해 명시된 질의 영역 내에서 큐브상의 군집 정보를 계산한다. 프리픽스-섬 기법에 기초한 기존의 방법론은 데이타의 누적된 합을 저장하기 위해 프리픽스-섬 큐브(PC)로 불리는 부가적인 큐브를 사용하므로 높은 저장공간 오버헤드를 초래한다. 이러한 저장공간 오버헤드는 기억장치의 추가적인 비용뿐만 아니라 업데이트의 부가적인 증식(propagation)과 더 많은 물리적 장치로의 접근시간을 유발시킨다. 본 논문에서는 대용량 데이타 웨어하우스에서 PC의 저장공간을 획기적으로 감소시킬 수 있는 'SPEC'으로 불리는 새로운 프리픽스-섬 큐브를 제안한다. SPEC은 PC내 셀들간의 종속에 의한 업데이트 증식을 감소시킨다. 이를 위해 대용량 데이타 큐브로부터 조밀한 서브큐브들을 발견하는 효과적인 알고리즘을 개발한다 다양한 차원의 데이타 큐브와 여러 가지 크기의 질의에 대해 폭 넓은 실험을 행하여 본 논문에서 제안한 방법의 효과와 성능을 조사한다. 실험적인 결과는 SPEC이 적절한 질의 성능을 유지하면서도 PC 저장공간을 상당히 감소시킴을 보여준다.

MLPPI Wizard: An Automated Multi-level Partitioning Tool on Analytical Workloads

  • Suh, Young-Kyoon;Crolotte, Alain;Kostamaa, Pekka
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1693-1713
    • /
    • 2018
  • An important technique used by database administrators (DBAs) is to improve performance in decision-support workloads associated with a Star schema is multi-level partitioning. Queries will then benefit from performance improvements via partition elimination, due to constraints on queries expressed on the dimension tables. As the task of multi-level partitioning can be overwhelming for a DBA we are proposing a wizard that facilitates the task by calculating a partitioning scheme for a particular workload. The system resides completely on a client and interacts with the costing estimation subsystem of the query optimizer via an API over the network, thereby eliminating any need to make changes to the optimizer. In addition, since only cost estimates are needed the wizard overhead is very low. By using a greedy algorithm for search space enumeration over the query predicates in the workload the wizard is efficient with worst-case polynomial complexity. The technology proposed can be applied to any clustering or partitioning scheme in any database management system that provides an interface to the query optimizer. Applied to the Teradata database the technology provides recommendations that outperform a human expert's solution as measured by the total execution time of the workload. We also demonstrate the scalability of our approach when the fact table (and workload) size increases.

Applying Hebbian Theory to Enhance Search Performance in Unstructured Social-Like Peer-to-Peer Networks

  • Huang, Chester S.J.;Yang, Stephen J.H.;Su, Addison Y.S.
    • ETRI Journal
    • /
    • 제34권4호
    • /
    • pp.591-601
    • /
    • 2012
  • Unstructured peer-to-peer (p2p) networks usually employ flooding search algorithms to locate resources. However, these algorithms often require a large storage overhead or generate massive network traffic. To address this issue, previous researchers explored the possibility of building efficient p2p networks by clustering peers into communities based on their social relationships, creating social-like p2p networks. This study proposes a social relationship p2p network that uses a measure based on Hebbian theory to create a social relation weight. The contribution of the study is twofold. First, using the social relation weight, the query peer stores and searches for the appropriate response peers in social-like p2p networks. Second, this study designs a novel knowledge index mechanism that dynamically adapts social relationship p2p networks. The results show that the proposed social relationship p2p network improves search performance significantly, compared with existing approaches.

질의 예약 기능을 갖는 Hybrid P2P 시스템 개발 (An Hybrid Peer to Peer System Development in Technique of Query Reservation)

  • 양승원;임종태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.371-375
    • /
    • 2005
  • 기존 Hybrid P2P 방식에서 사용자가 검색시 예약어 등록 기능을 추가해 사용자가 원하는 컨텐츠를 소유한 피어가 네트워크에 참여했을 시 목록을 비교하여 예약어를 등록한 사용자에게 알람 기능을 제공함으로써 재검색에 소요되는 수고를 덜어 주고자한다.

  • PDF