• Title/Summary/Keyword: 데이터 인덱스 정보

Search Result 383, Processing Time 0.03 seconds

Performance Comparisons on MongoDB with B-Tree Indexes and Fractal Tree Indexes (MongoDB에서 B-트리 인덱스와 Fractal 트리 인덱스를 이용한 성능 비교)

  • Jang, Seongho;Kim, Suhee
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.05a
    • /
    • pp.622-625
    • /
    • 2014
  • As Big data began to produce a variety of values, a database that allows for huge amount of data with varieties became to be needed. Therefore, for the purpose of overcoming the limitations of the complexity and capacity of the existing RDBMS, NoSQL databases were introduced. Among the different types of NoSQL databases, MongoDB is most commonly used and is offered as open sources. The B-Tree index, used in MongoDB, experiences a significant decrease in performance as the amount of data increases. The fractal tree index enables to enhance the performance of B-Tree substantially by improving B-Tree's insertion algorithm. In this paper, the performances of MongoDB when using B-Tree Index and when using Fractal Tree Index are compared.

  • PDF

OLAP-based Big Table Generation for Efficient Analysis of Large-sized IoT Data (대용량 IoT 데이터의 빠른 분석을 위한 OLAP 기반의 빅테이블 생성 방안)

  • Lee, Dohoon;Jo, Chanyoung;On, Byung-Won
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.2-5
    • /
    • 2021
  • With the recent development of the Internet of Things (IoT) technology, various terminals are being connected to the Internet. As a result, the amount of IoT data is also increasing, and an index key that can efficient analyze the large-scale IoT data is proposed. Existing index keys have only time and space information, so if data stored in index tables and instance tables were queried using repetition or join operation, IoT data was embedded in the index key of the proposal to create OLAP-based big tables to minimize the number of repetitions or join times.

  • PDF

Efficient k-Nearest Neighbor Join Query Processing Algorithm using MapReduce (맵리듀스를 이용한 효율적인 k-NN 조인 질의처리 알고리즘)

  • Yun, Deulnyeok;Jang, Miyoung;Chang, Jaewoo
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.767-770
    • /
    • 2014
  • 대용량 데이터를 분석하기 위한 맵리듀스 기반 k-NN 조인 질의처리 알고리즘은 최근 데이터 마이닝 및 분석을 기반으로 하는 응용 분야에서 매우 중요하게 활용되고 있다. 그러나, 대표적인 연구인 보로노이 기반 k-NN 조인 질의처리 알고리즘은 보로노이 인덱스 구축 비용이 매우 크기 때문에 대용량 데이터에 적합하지 못하다. 아울러 보로노이 셀 정보를 저장하기 위해 사용하는 R-트리는 맵리듀스 환경의 분산 병렬 처리에 적합하지 않다. 따라서 본 논문에서는 새로운 그리드 인덱스 기반의 k-NN 조인 질의 처리 알고리즘을 제안한다. 첫째, 높은 인덱스 구축 비용 문제를 해결하기 위해, 데이터 분포를 고려한 동적 그리드 인덱스 생성 기법을 제안한다. 둘째, 맵리듀스 환경에서 효율적으로 k-NN 조인 질의를 수행하기 위해, 인접셀 정보를 시그니처로 활용하는 후보영역 탐색 및 필터링 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 제안하는 기법이 질의 처리 시간 측면에서 기존 기법에 비해 최대 3배 높은 질의 처리 성능을 나타냄을 보인다.

A B-Tree Management Scheme Exploiting Shadow Version on Flash Memory (플래쉬 메모리에서 Shadow 버전을 이용한 B-트리 인덱스 관리)

  • Ohn, Kyung-Oh;Cho, Haeng-Rae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.124-127
    • /
    • 2006
  • 플래쉬 메모리는 비휘발성, 저전력, 경량, 내구성 등의 장점으로 인해, PDA가 스마트카드, 휴대폰, 휴대용 음악 재생기 등과 같은 이동 컴퓨팅 장치의 저장소로 많이 사용되고 있다. 최근 들어 대용량의 플래쉬 메모리가 출시되고 랩탑 컴퓨터등 이를 탑재한 컴퓨팅 장치들이 증가하면서 대용량의 데이터를 효율적으로 액세스하기 위한 B-트리와 같은 인덱스 기법이 요구되고 있다. 한편, 현재 사용되고 있는 NAND 플래쉬 메모리는 기존의 하드 디스크와는 액세스 특성들이 상이하다. 뿐만 아니라, B-트리 인덱스는 데이터에 비해 빈번히 액세스되고 갱신되기 때문에, 기존의 하드 디스크 기반 B-트리 인덱스 기법을 플래쉬 메모리에 적용할 경우 심각한 성능상의 문제점이 발생한다. 본 논문에서는 shadow 버전을 이용한 플래쉬 메모리 기반의 효율적인 B-트리 인덱스 기법을 제안한다.

  • PDF

The Secure Algorithm on the Sensitive data using Bloom filter and bucket method (버킷과 블룸필터를 혼합한 민감한 데이터 보안)

  • Yu, Choun-Young;Kim, Ji-Hong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.16 no.5
    • /
    • pp.939-946
    • /
    • 2012
  • Recently privacy breaches has been an social issues. If we should encrypt the sensitive information in order to protect the database, the leakage of the personal sensitive data will be reduced for sure. In this paper, we analyzed the existing protection algorithms to protect the personal sensitive data and proposed the combined method using the bucket index method and the bloom filters. Bucket index method applied on tuples data encryption method is the most widely used algorithm. But this method has the disadvantages of the data exposure because of the bucket index value presented. So we proposed the combined data encryption method using bucket index and the bloom filter. Features of the proposed scheme are the improved search performance of data as well as the protection of the data exposure.

Index Organization for On-Demand Data Broadcast (주문형 데이타 방송을 위한 인덱스 구성)

  • 강선희;이상돈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.217-219
    • /
    • 2004
  • 무선 이동 컴퓨팅 환경에서 자원의 비대칭성을 효과적으로 극복하는 것이 매우 중요하다. 이 중에서도 배터리 용량은 클라이언트의 유용성을 결정하는 중요한 자원이다. 그러므로 무선 컴퓨팅 환경에서 매우 효과적인 데이터 방송 기법은 데이터를 빠르게 전달하는 것은 물론 이동 클라이언트의 배터리 소모를 감소시킬 수 있는 효율적인 데이터 전달 기법을 필요로 한다. 본 논문에서는 주문형 데이터 방송 환경을 위한 인덱스 구성 방안을 제안한다 제안 기법은 방송 서버에서 대기중인 데이터 접근 요구 중 방송 우선순위가 높은 일부 데이터를 대상으로 인덱스를 구성하여 미리 방송함으로써 이를 참조하는 클라이언트의 적응시간을 감소시켜 전력소모를 줄이도록 한다. 제안 기법이 효과적으로 이동 클라이언트의 적응 시간을 감소시키는 것을 실험을 통해 검증한다.

  • PDF

XML Query Optimization based on Signature (시그니처를 이용한 XML 질의 최적화)

  • Park, Sang-Won;Kim, Hyeong-Ju
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.104-114
    • /
    • 2001
  • XML은 웹에서 데이터를 주고받는 표준으로 새로이 등장하고 있다. 이러한 데이터를 잘 처리하기 위하여 데이터베이스의 도움은 필연적이다. XML을 처리하는 데이터베이스에서 데이터는 트리 형태로 저장되며 질의어는 정규 경로식(regular path expression)의 특징을 가지고 있다. 이때 질의 처리는 트리의 각 노드 탐색을 통하여 수행된다. 본 논문에서는 시그니처를 이용한 저장 방법 및 질의 처리를 통하여 질의 수행 시 각 노드의 탐색 횟수를 줄여 질의 수행을 빠르게 할 수 있게 한다. 뿐만 아니라 반 구조적 데이터에 대한 인덱스도 데이터베이스 내에서 반구조적 데이터로 표현된다. 그러므로 본 논문에서 제안한 방법을 인덱스 노드에도 적용할 수 있다. 이와 같이 본 논문에서 제안한 방법은 데이터 객체와 인덱스 객체의 탐색을 줄임으로서 XML 질의를 빠르게 처리할 수 있게 한다.

  • PDF

The Scheme for Path-based Query Processing on the Semantic Data (시맨틱 웹 데이터의 경로 기반 질의 처리 기법)

  • Kim, Youn-Hee;Kim, Jee-Hyun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.10
    • /
    • pp.31-41
    • /
    • 2009
  • In the Semantic Web, it is possible to provide intelligent information retrieval and automated web services by defining a concept of information resource and representing a semantic relation between resources with meta data and ontology. It is very important to manage semantic data such as ontology and meta data efficiently for implementing essential functions of the Semantic Web. Thus we propose an index structure to support more accurate search results and efficient query processing by considering semantic and structural features of the semantic data. Especially we use a graph data model to express semantic and structural features of the semantic data and process various type of queries by using graph model based path expressions. In this paper the proposed index aims to distinguish our approach from earlier studies and involve the concept of the Semantic Web in its entirety by querying on primarily extracted structural path information and secondary extracted one through semantic inferences with ontology. In the experiments, we show that our approach is more accurate and efficient than the previous approaches and can be applicable to various applications in the Semantic Web.

A fuzzy cluster validity index for the evaluation of Fuzzy C-Means algorithm (최적 클러스터 분할을 위한 FCM 평가 인덱스)

  • 김대원;이광현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.374-376
    • /
    • 2003
  • 본 논문에서는 Fussy C-Means (FCM) 알고리즘에 의해 계산된 퍼지 클러스터들에 대한 평가 인덱스를 제안한다. 제안된 인덱스는 퍼지 클러스터들간의 인접성(inter-cluster proximity)을 이용한다. 클러스터 인접성을 도입함으로써 클러스터간의 중첩 정도를 계산할 수 있다. 따라서, 인접성 값이 낮을수록 클러스터들은 공간에 잘 분포하게 됨을 알 수 있다. 다양한 데이터 집합에 대한 실험을 통해서 제안된 인덱스의 효율성과 신뢰성을 검증하였다.

  • PDF

Positional Information Indexing on Large Volume of Moving Objects (대용량 이동 객체의 위치 정보 인덱싱)

  • 박원순;전세길;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.49-51
    • /
    • 2002
  • 대용량 이동 객체의 경우에 특정 객체의 이동경로를 추적유지 해야할 필요성이 있으며 효과적으로 검색하기 위한 인덱스가 필요하다. 본 논문에서는 이동 객체의 위치 정보를 위한 데이터 구조를 제시하고 저장된 데이타를 효과적으로 처리하기 위한 인덱스 구성방안을 제안한다. 인덱스 구조는 대량의 객체의 동시 이동으로 인한 갱신 오버헤드를 최소화할 수 있도륵 한다. 이 시스템은 이동 통신 분야에서 고객 위치 정보를 필요로 하는 다양한 서비스와 항공기 운항 제어 등의 분야에서 활용될 수 있다.

  • PDF