• 제목/요약/키워드: 데이터 인덱스 정보

검색결과 383건 처리시간 0.026초

캐시를 고려한 T-트리 인덱스 구조 (Cache Sensitive T-tree Index Structure)

  • 이익훈;김현철;허재녕;이상구;심준호;장준호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.12-23
    • /
    • 2005
  • 지난 10년간 CPU의 속도는 메모리의 속도에 비해 급속한 속도로 발전하였다 그 결과 데이터 베이스 시스템을 포함한 다른 컴퓨터 응용분야에서 메모리의 접근이 병목현상을 일으키게 되었다. 메모리의 접근 속도를 줄이기 위해 캐시 메모리가 도입되었다 하지만 캐시 메모리는 원하는 데이타가 캐시에 옮겨져 있어야 메모리 접근 속도를 줄일 수 있다. 때문에 응용프로그램에서 데이타를 어떤 순서로 액세스 하느냐에 따라 캐시의 활용도가 달라지고 응용프로그램의 성능이 달라지게 된다. 이 시점에서 현재 컴퓨터에서 B+-트리가 T-트리보다 더 빠르다는 사실이 알려졌다. B+-트리가 T-트리보다 캐시를 더 효율적으로 사용하기 때문이다. 또한 B+-트리를 개선하여 캐시를 더욱 효율적으로 사용하는 CSB+-트리(Cache Sensitive B+-tree)가 제안되기도 하였다 본 논문의 목표는 T-트리가 캐시를 효율적으로 사용하도록 새로운 T-트리 구조를 개발하는 것이다. CSB+-트리와 같이 시스템의 L2 캐시를 최대한 활용하며 기존 T-트리가 가지는 장점을 가지는 새로운 CST-트리(Cache Sensitive T-트리)를 설계 개발하고, 실험을 통해 기타 다른 인덱스 구조에 비교하여 CST-트리의 우수성을 보인다.

플래시 메모리 상에서 B+-트리 노드 크기 증가에 따른 성능 평가 (Effect of Node Size on the Performance of the B+-tree on Flash Memory)

  • 박동주;최해기
    • 정보처리학회논문지A
    • /
    • 제15A권6호
    • /
    • pp.325-334
    • /
    • 2008
  • 플래시 메모리는 크기가 작고 적은 전력을 사용하며 충격에 강하기 때문에 휴대폰, MP3 플레이어, PDA와 같은 이동 기기에 널리 사용되고 있다. 또한, 노트북과 개인용 컴퓨터에서 사용하던 하드디스크를 플래시 메모리로 교체하려는 시도도 진행되고 있다. 최근에는 플래시 메모리 저장 시스템에서 대용량의 데이터를 효율적으로 검색하기 위한 플래시 메모리용 $B^+$-트리 인덱스를 개발하려는 연구가 이루어지고 있다. 이러한 연구는 $B^+$-트리에 키의 삽입 또는 삭제 시 발생하는 "덮어쓰기"를 최소화하는데 초점을 두고 있다. 그러나 이것뿐만 아니라 하나의 $B^+$-트리 노드에 할당되는 물리적 페이지의 크기도 $B^+$-트리 성능에 영향을 줄 수 있다. 본 논문에서는 다양한 실험을 통해 노드 크기에 따른 $B^+$-트리의 구축 성능, 검색 성능, 그리고 저장 공간 사용량을 비교 및 분석한다. 노드에 키 삽입 시 정렬 및 비정렬 알고리즘을 제시하며, 또한 효율적인 노드 검색을 위한 적절한 인덱스 노드 헤드 구조를 제안한다.

택시 데이터에 대한 효율적인 Top-K 빈도 검색 (Finding Frequent Route of Taxi Trip Events Based on MapReduce and MongoDB)

  • ;안성아;;정한유;권준호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.347-356
    • /
    • 2015
  • IoT(사물인터넷) 기술의 빠른 개발로 인하여 기존의 택시들은 디스패처와 위치 시스템을 통해 서로 연결되고 있다. 일반적으로 현대의 택시들은 경로 정보를 획득하기 위한 목적으로 GPS(Global Positioning System)를 탑재하고 있다. 택시 운행 데이터들의 경로 빈도를 분석하여, 주어진 질의 시간에 해당하는 빈번한 경로를 찾을 수 있다. 그러나 위치 데이터의 용량이 매우 크고 복잡하기 때문에 택시의 운행 이벤트의 위치 데이터를 분석된 빈도 정보로 변환할 때에 확장성 문제가 발생한다. 이 문제를 해결하기 위하여, NoSQL 데이터베이스에 기반한 택시 운행 데이터에 대한 Top-K 질의 시스템을 제안한다. 첫째, 원시 택시 운행 이벤트를 분석하고 모든 경로들의 빈도 정보를 추출한다. 추출한 경로 정보는 NoSQL 문서-지향 데이터베이스인 MongoDB에 해시 기반의 인덱스 구조로 저장한다. 주로 발생하는 경로에 대한 효율적인 Top-K 질의 처리는 몽고DB의 상에서 이루어진다. 미국 뉴욕시의 실제 택시 운행 데이터를 이용한 실험을 통하여 알고리즘의 효율성을 검증하였다.

아웃소싱된 클라우드 데이터의 프라이버시를 보호하기 위한 멀티 키워드 검색 프로토콜의 개선 (An Improved Multi-Keyword Search Protocol to Protect the Privacy of Outsourced Cloud Data)

  • 김태연;조기환;이영록
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권10호
    • /
    • pp.429-436
    • /
    • 2017
  • 최근 클라우드 컴퓨팅 환경에서 민감하거나 중요한 데이터를 아웃소싱하는 경향이 늘어나고 있다. 하지만 아웃소싱된 데이터의 프라이버시 보호는 매우 중요하다. 지금까지 단일 데이터 소유자와 다수의 데이터 사용자로 구성된 클라우드 컴퓨팅 환경에서 안전하고 효율적인 멀티 키워드 검색 구조들이 다양하게 제안되었다. Zhang 등은 다수의 데이터 소유자들과 사용자들로 연결된 클라우드 컴퓨팅 환경에서 멀티 키워드를 기반으로 하는 검색 프로토콜을 제안하였다. 그들의 프로토콜은 두 가지 문제점을 동시에 안고 있다. 하나는 클라우드 서버가 키워드 인덱스와 사용자의 트랩도어를 통해 데이터 파일들 간의 연관성을 불법적으로 추론할 수 있다는 것이고, 다른 하나는 키워드 인덱스의 크기만큼 복잡한 연산을 수행해야 하기 때문에 사용자의 요청에 대한 응답이 지연된다는 것이다. 본 논문에서는 클라우드 서버를 전적으로 신뢰할 수 없는 노드라는 가정 하에서 우리는 아웃소싱된 데이터의 프라이버시가 보호되는 개선된 멀티 키워드 기반 검색 프로토콜을 제안한다. 그리고 제안된 프로토콜이 Zhang의 프로토콜보다 데이터 파일들 간의 연관성 추론 측면에서 더 안전하고, 처리 시간의 측면에서 더 효율성이 높음을 실험을 통해 보인다.

USN환경에서 효율적인 공간영역질의를 위한 적응형 영역 집계 인덱스 기법 (Adaptive Range Aggregation Index Method for Efficient Spatial Range Query in Ubiquitous Sensor Networks)

  • 이연;어상훈;조숙경;이순조;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.93-107
    • /
    • 2007
  • 본 논문에서는 유비쿼터스 센서 네트워크 환경에서의 공간 영역 질의를 효과적으로 처리하는 공간 영역 집계 인덱스 기법을 제안한다. 새로운 정보화 패러다임인 네트워킹과 컨버전스 기반의 유비쿼터스 환경의 중요성이 부각되면서 유비쿼터스 센서 네트워크 환경에서의 에너지 효율적인 실시간 공간질의에 대한 연구가 활발히 진행되고 있다. 센서 네트워크에서 공간영역질의는 사용자가 지정한 일정한 시간 동안의 특정 지리적 영역의 온도, 습도 등 스칼라 데이터를 감지한다. 공간 질의를 효과적으로 수행하기 위하여 Rectangle 기반의 SPIX기법 등 공간 인덱스 기법들이 많이 진행되었지만 기존 연구에서는 공간 영역질의의 질의 결과 값 전달 경로를 질의 전달 경로의 역방향으로 지정하였다. 센서 네크워크의 공간 영역 질의에서 질의 영역 내의 센서들은 대부분이 인접되어 있지만 질의 전달 경로가 틀리면 질의 영역 내에서 집계되지 못하고 전달되므로 불필요한 에너지를 낭비하게 된다. 본 논문에서는 유비쿼터스 센서 네트워크에서 공간 영역 질의를 수행 할 때 질의 영역 내에서 센서 노드들 간의 통신거리를 고려하여 질의 결과 값 전달 경로를 재선정하고, 적응적으로 집계 영역 내에서 집계연산을 하여 질의 결과 값을 전달하는 인덱스 기법을 제안한다. 성능평가를 통하여 제안 기법이 기존 기법보다 우월함을 보여주었다.

  • PDF

XML 문서를 위한 효율적인 색인구조의 설계 (A Design of an Efficient Index Organization for XML Documents)

  • 안선하;박경환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.292-295
    • /
    • 2000
  • XML은 메타언어로써 구조적인 문서를 생성할 수있게 하며 이러한 구조적인 문서는 내용 기반검색,질의등의 처리가 가능하다는 것이다. XML문서의 논리적 구조를 표현하는 방법은 사용자 정의 문서타입(DTD)과 XML Schema 의 두가지 방식이 있으며, XML Schema 는 사용자 정의문서타입(DTD)에 비해 다양한 데이터 타입, namespace, Open-ended 데이터 모델등을 지원하여 문서의 구조 정의를 훨씬 더 유연하고 명시적이게 하게 하는 장점이있다. 본 논문에서는 XML 문서 검색을 위해 XML Schemadp 기반하여 내용 검색과 구조 검색을 효율적으로 지원하는 인덱스 구조를 제안한다. 요소들의 정의에 따르면 계층관계를 표현하기위한 구조정보와 XML 문서 인스턴스에서 나타나는 각 요소들의 순서정보를 요소의 ID로 사용함으로써 임의의 요소를 효율적으로 접근할 수 있게 한다.

  • PDF

Web GIS 클러스터링 시스템에서 질의 영역의 인접성을 이용한 로드 밸런싱 기법 (Load Balancing Method Using Proximity of Query Region in Web GIS Clustering System)

  • 장용일;이찬구;이충호;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2001
  • 웹 GIS에서의 인터넷 서비스 이용자의 집중 현상으로 발생하는 서버의 과부하 현상을 막고 안정적인 서비스 제공을 위해서는 웹 클러스터링 기술의 도입이 필요하다. 공간 질의는 웹 데이터와는 달리 인접 영역에 대한 질의가 매우 잣으며, 질의 처리 결과가 대용량이라는 특성을 가지고 있다. 이러한 공간 질의의 특성을 고려하지 않을 경우, 서버에서 처리되는 질의들의 지역적 인접성이 낮아지고 낮은 버퍼 재 사용율은 디스크로의 접근 빈도를 높여 질의 처리 비용을 증가시키는 원인이 된다. 본 논문에서는 웹 GIS 클러스터링 시스템을 위한 질의 영역의 인접성을 이용한 로드 밸런싱 기법을 제안한다. 제안하는 기법은 공간 데이터를 타일을 기반으로 인접한 타일의 그룹을 생성하여 각 서버에 할당하여, 질의 영역 및 공간 연산을 고려하여 서버에서 질의가 처리되는 동안 버퍼 재사용율이 최대가 되도록 클라이언트의 질의 요청을 적절한 서버에 전달한다. 제안하는 기법은 서버의 버퍼를 공간 인덱스 탐색에 최적화함으로써 서버의 버퍼 재상용율을 높이고, 클러스터링 시스템에서 디스크의 접근 횟수를 낮추어, 전체적인 서버 시스템의 처리 능력을 형상시킨다.

  • PDF

성능 향상을 위한 데이터 모델링 방법 (Data Modeling Methods for Performance Enhancement)

  • 김수연;이상호;서의호
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.85-102
    • /
    • 1998
  • 현재의 시스템 개발 프로젝트에서 대부분의 기업은 관계형 데이터베이스를 목표 환경으로 채택하고 있지만 설계자들은 기존의 파일 시스템이나 계층형 데이터베이스의 설계 방식을 관계형 데이터베이스 설계 시에도 그대로 적용하려는 경향이 있다. 또한 모델링 시 시스템 특성과는 무관한 업무 중심의 엔티티 관계도를 작성함으로써 구현 시에 모델을 상당 부분 변경하거나 추가해야 하는 오버헤드가 발생하기도 한다. 관계형 데이터베이스의 경우 구조를 어떻게 설계하느냐에 따라 효율의 차이가 크게 나타나므로 성능 향상을 위한 데이터 모델링 기법이 중요한 이슈로 등장하게 되었다. 본 논문에서는 관계형 데이터베이스 성능과 관련하여 이미 연구되고 실험된 내용을 여러 문헌과 자료를 참고하여 조사하였다. 성능 항상을 위한 모델링 기법들을 테이블, 릴레이션쉽, 인덱스 등의 객체별로 분류하여 정리하였고, 조사된 내용 중에서 몇 가지를 선택하여 Oracle DBMS 환경에서 실제로 실험을 실시하였다. 대용량 테이블에 대한 질의를 수행하여 소요되는 시간을 측정하고 그 결과를 분석하였다. 실험을 통해 검증된 결과를 토대로 제안되는 모델링 방법을 제시한다.

  • PDF

공통서열 추출을 통한 전사인자 결합부위 예측 (Prediction of transcription factor binding sites by extracting common sequences)

  • 임명은;심정섭;정명근;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.820-822
    • /
    • 2003
  • 접미사 배열이나 접미사 트리는 대용량의 서열데이터를 효율적으로 검색, 저장할 수 있는 인덱스 자료구조로서 바이오인포매틱스와 같이 대용량 데이터의 처리. 분석이 필요한 분야에 이용될 수 있다. 최근 들어 접미사 배열에 대한 연구가 활발히 진행되어 접미사 배열의 효율적인 저장, 선형시간 생성 및 선형시간 탐색 알고리즘들이 개발되었다. 본 논문에서는 같은 전사인자가 결합할 것으로 예상되는 여러 개의 전사조절부위에 대한 DNA 서열들이 입력으로 주어졌을 때 전사인자가 결합하는 부위를 예측하는 방법을 제시한다. 이를 위해 최근에 제시된 선형시간 접미사 배열 생성 알고리즘을 이용하고 TRANSFAC과 EMBL 등의 DB를 이용하여 실험을 통해 본 논문에서 제시하는 방법의 정확도를 평가한다.

  • PDF

XML캐쉬의 점진적 갱신을 위한 XML변경 처리 모델 (Models of XML Update Processing for Refreshing XML Cache Incrementally)

  • 한승철;황대현;강현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.64-66
    • /
    • 2004
  • XML이 웹 상에서 데이터 교환의 표준으로 부각된 이래 XML데이터의 효율적 관리 기법에 관한 연구가 활발히 수행되고 있다. XML 질의의 표준화 작업도 활발히 이루어져 현재 XQuery가 유력한 표준으로 부각되었다. 그러나 XQuery 등이 완전한 XML 질의어가 되기 위해서는 변경 연산을 제공해야 하는데 XML변경어의 표준화 작업이나 XML 변경 처리 기법에 대한 연구는 아직 미미한 실정이다. 본 논문에서는 e-Commerce 등 XML 데이터베이스 기반 웹 응용의 효율적 지원을 위한 XML 캐쉬를 점진적으로 갱신하는 과정에서 발생하는 XML 변경 연산 처리의 세 가지 기본 모델. TD (텍스트/DOM 기반). PD(PDOM 기반), 그리고 IT (인덱스된 텍스트 기반)를 제안한다. 캐쉬된 XML 문서를 어떤 포맷으로 저장하는가는 이후 XML 변경 연산의 처리 및 요청된 XML문서 반환의 효율성에 영향을 미친다. 이들 모델들은 캐쉬된 XML 문서의 저장 포맷에 따라 구분한 것이다. 이들 모델 각각에 대하여 캐쉬된 XML문서의 갱신 및 반환 기능을 제공하는 XML캐쉬 관리 시스템을 구현하여 이들 기능의 성능 및 공간 부담을 평가한 결과를 기술한다.

  • PDF