• 제목/요약/키워드: 데이타베이스 인덱스 성능

검색결과 63건 처리시간 0.024초

시계열 서브시퀀스 매칭을 위한 최적의 다중 인덱스 구성 방안 (Optimal Construction of Multiple Indexes for Time-Series Subsequence Matching)

  • 임승환;김상욱;박희진
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.201-213
    • /
    • 2006
  • 일정 기간 동안 객체의 변화한 값들을 기록한 것을 그 객체에 대한 시계열 데이타 시퀀스라고 부르며, 이들의 집합을 시계열 데이타베이스라고 한다. 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이타베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭의 성능을 극대화하기 위한 방안을 제시한다. 먼저, 윈도우 크기 효과로 인한 서브시퀀스 매칭의 심각한 성능 저하 현상을 정량적으로 관찰하여, 하나의 윈도우 크기를 대상으로 만든 단 하나의 인덱스만을 이용하는 것은 실제 응용에서 만족할만한 성능을 제공할 수 없다는 것을 규명하였다 또한, 이러한 문제로 인해 다양한 윈도우 크기들을 기반으로 다수의 인덱스들을 구성하여 서브시퀀스 매칭을 수행하는 인덱스 보간법의 응용이 필요함을 보였다. 인덱스 보간법을 응용하여 서브시퀀스 매칭을 수행하기 위해서는 먼저 다수의 인덱스들을 위한 윈도우 크기들을 결정해야 한다. 본 연구에서는 물리적 데이타베이스 설계 방식을 이용하여 이러한 최적의 다수의 윈도우 크기들을 선정하는 문제를 해결하였다. 이를 위하여 시계열 데이터 베이스에서 수행될 예정인 질의 시퀀스들의 집합과 인덱스 구성의 기반이 되는 윈도우들의 크기의 집합이 주어질 때, 전체 서브시퀀스 매칭들을 수행하는 데에 소요되는 비용을 예측할 수 있는 공식을 산출하였다. 또한, 이 비용 공식을 이용하여 전체 서브시퀀스 매칭들의 성능을 극대화 할 수 있는 최적의 윈도우 크기들을 결정하는 알고리즘을 제안하였으며, 이 알고리즘의 최적성과 효율성을 이론적으로 규명하였다. 끝으로, 실제 주식 데이타와 대량의 합성 데이타를 이용한 실험 결과, 제안된 기법은 기존의 단순한 기법과 비교하여 1.5배에서 7.8배 성능이 향상됨을 보였다.

히포크라테스 XML 데이터베이스: 모델 및 액세스 통제 방법 (Hippocratic XML Databases: A Model and Access Control Mechanism)

  • 이재길;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.684-698
    • /
    • 2004
  • 최근에 Agrawal 등이 제안한 히포크라테스 데이타베이스(Hippocratic database)는 관계형 데이타베이스에 프라이버시 보호 기능을 추가한 데이타베이스 모델이다 히포크라테스 데이타베이스는 관계형 데이타베이스에 기반한 모델이므로 최근에 널리 사용되는 XML 데이타베이스에 적용하기 위해서는 확장이 필요하다. 본 논문에서는 히포크라테스 데이타베이스 모델을 XML 데이타베이스에 적용할 수 있도록 확장한 히포크라데스 XML 데이타베이스(Hippocratic XML database) 모델과 이 모델에서의 효과적인 액세스 통제 방법을 제안한다. XML 데이타는 관계형 모델과 달리 트리 형태의 계층 구조를 가진다. 따라서, 히포크라테스 데이타베이스의 모델에서 제시한 개념들인 프라이버시 선호 및 정책, 프라이버시 권한, 데이타 레코드의 사용목적을 트리 형태의 계층 구조에 맞게 확장하며, 확장된 개념들을 정형적으로 정의한다. 다음으로, 본 모델의 액세스 통제 방법에 사용되는 새로운 방법인 다차원 인덱스를 사용한 권한 인덱스(authorization index)를 제안한다. 이 권한 인덱스는 최근접 질의(nearest neighbor search) 기법을 활용하여 가장 가까운 조상 엘리먼트에 부여된 권한에 의해 내포되는 권한을 효율적으로 찾을 수 있게 해준다. 합성 데이타와 실제 데이타를 사용하여 기존의 액세스 통제 방법과 질의 처리 시간을 비교하는 다양한 실험을 수행한 결과, 본 논문에서 제안한 액세스 통제 방법은 하향식(top-down) 액세스 통제 방법에 비하여 최대 13.6배, 상향식(bottom-up) 액세스 통제 방법에 비하여 최대 20.3배 성능을 향상시킴을 보였다. 본 논문의 주요 공헌은 1) 히포크라테스 데이타베이스 모델을 히포크라테스 XML 데이타베이스 모델로 확장하고 2) 제안한 모델 상에서 권한 인덱스와 최근접 질의 기법을 사용하는 효과적인 액세스 통제방법을 제안한 것이다.

데이타베이스 공유 시스템에서 B-트리 인덱스를 위한 캐쉬 일관성 제어 (A Cache Consistency Control for B-Tree Indices in a Database Sharing System)

  • 온경오;조행래
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.593-604
    • /
    • 2001
  • 데이타베이스 공유 시스템(Database Sharing System:Dss)은 고성능의 트랜잭션 처리를 위해 제안된 구조이다. DSS에서 고속의 통신망으로 연결된 노드들은 별도의 메모리와 운영체제를 가지며, 데이타베이스를 저장하고 있는 디스크 모든 노드에 의해 공유된다. 빈번한 디스크 액세스를 피하기 위해 각 노드는 최근에 액세스한 데이타 페이지와 인덱스 페이지들을 자신의 메로리 버퍼에 캐싱한다. 일반적으로 B-트리 인덱스페이지들은 데이타 페이지에 비해 빈번하게 캐싱되고, Fetch, Fetch Next, 삽입, 그리고 삭제와 같은 복잡한 연산을 수행하므로, 높은 동시성을 지원하는 효율적인 캐쉬 일관성 기법이 필요하다. 본 논문에서는 DSS에서 B-트리 인덱스 페이지의 식별자와 리프 페이지의 PageLSN을 사용한 캐쉬 일관성 기법을 제안한다.

  • PDF

이동 객체의 효율적인 저장과 검색을 위한 화일 기반 이동 객체 저장 컴포넌트의 개발 (Development of a File-based Moving Objects Storage Component for Efficient Storage and Retrieval of Moving Objects)

  • 장유정;김동오;홍동숙;한기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.118-120
    • /
    • 2004
  • 최근 무선 인터넷 인구의 증가로 인해 이동 객체의 위치 데이타를 활용하여 다양한 서비스를 제공하는 위치 기반 서비스와 텔레매틱스에 대찬 관심이 급증하고 있다 위치 기반 서비스와 텔레매틱스 분야에서 다양한 응용 서비스를 제공하기 위해서는 대용량의 위치 데이타를 빠르고 정확하게 저장하고 검색할 수 있는 이동 객체 데이타베이스 시스템이 필수적으로 요구된다. 그러나, 기존의 데이타베이스 시스템을 사용하여 대용량의 위치 데이타를 처리할 경우 트랜잭션 연산의 증가로 인하여 저장 밀 검색 성능이 저하된다 이러한 문제점을 해결하기 위해 본 논문에서는 이동 객체의 위치 데이타를 효율적으로 저장하고 검색하기 위한 화일 기반 이동 객체 저장 컴포넌트를 개발하고 성능 평가를 수행하였다. 화일 기반 이동 객체 저장 컴포넌트는 다중 연결 관리자, 단순 질의 처리기, 인덱스 관리자. 데이타 화일 관리자, 인덱스 파일 관리자, 메타데이타 관리자, 로그 관리자, OLE DB 데이타 제공자, 그리고 관리툴로 구성된다.

  • PDF

낸드 플래시 메모리 상에서 효율적인 MR-트리 동작을 위한 지연 연산 기법 (Delay Operation Techniques for Efficient MR-Tree on Nand Flash Memory)

  • 이현승;송하윤;김경창
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권8호
    • /
    • pp.758-762
    • /
    • 2008
  • 플래시 메모리 중 저장장치로 사용되는 낸드 플래시 메모리는 유비쿼터스 및 모바일 환경에 적합한 특성으로 다양한 분야의 저장장치로 이용되고 있으며 효율적인 활용을 위한 많은 연구가 진행되고 있다. 모바일 환경에서 이용할 수 있는 멀티미디어 데이타베이스 시스템을 위한 인덱스로써 공간 데이타 액세스가 가능한 R-트리의 검색 성능을 향상시킨 MR-트리는 메인 메모리 데이터베이스 시스템에서 캐쉬 미스를 줄이고 중간 노드의 이용률을 높임으로써 연산 성능을 높일 수 있는 특성을 가진다. 본 논문에서는 검색 성능이 좋은 MR-트리를 활용하여 낸드 플래시 메모리 기반에서 효율적인 동작을 위한 지연 연산 기법을 제안하였다. MR-트리의 노드 크기를 낸드 플래시 메모리의 쓰기 연산 단위에 맞추고 인덱스 수정 연산 시 노드 크기만큼 지연 연산하여 쓰기 연산으로 인한 플래시 메모리에서의 추가적인 비용을 줄이고 연산 횟수를 줄여 인덱스 성능을 향상 시켰다.

대용량 DNA 시퀀스 데이타베이스를 위한 효율적인 인덱싱 (Efficient Indexing for Large DNA Sequence Databases)

  • 원정임;윤지희;박상현;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.650-663
    • /
    • 2004
  • DNA 시퀀스 검색은 분자 생물학 분야에서 사용되는 매우 중요한 연산이다. DNA 시퀀스 데이타베이스는 매우 큰 용량을 가지므로 DNA 시퀀스 검색의 효율적인 처리를 위해서는 고속 인덱스의 사용이 필수적이다. 본 논문에서는 DNA 시퀀스 검색을 위하여 기존에 제안된 접미어 트리가 가지는 저장공간, 검색 성능, DBMS와의 통합 등의 문제점들을 지적하고, 이러한 문제점을 해결할 수 있는 새로운 인덱스를 제안한다. 제안된 인덱스는 포인터 없이 트라이를 비트 스트링으로 표현하는 기본 구조와 후처리 시 액세스되어야 하는 트라이의 단말 노드를 신속하게 찾기 위한 보조 자료 구조로 구성된다. 또한, 제안된 인덱스를 이용하여 DNA 시퀀스 검색을 효과적으로 처리하는 알고리즘을 제시한다. 제안된 기법의 우수성을 검증하기 위하여, 실험을 통한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 인덱스는 기존의 접미어 트리와 비교하여 더 작은 저장 공간을 가지고도 13배에서 29배까지의 검색 성능의 개선 효과를 가지는 것으로 나타났다.

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

다양한 분포의 데이터를 이용한 시계열 패턴 인덱스의 성능 비교

  • 김영인
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 공동추계학술대회 경제위기 극복을 위한 정보기술의 효율적 활용
    • /
    • pp.791-805
    • /
    • 1998
  • 음성데이타베이스 이미지 데이터베이스 등과 같은 응용에서 다차원 구조의 시계열 패턴을 효율적으로 처리하기 위한 인덱스 구조가 필요하다. 이러한 인덱스구조로 시계열 패턴 인덱스(9)가 제안되었다. 본 논문에서는 시계열 패턴 인덱스가 실제 응용에 적용가능한가를 판단하기 위하여 , 다양한 분포의 대량 데이터를 이용한 실험을 통한 성능을 비교한다. 성능 실험결과 저장시의 성능은 균일 분포에서 좋은 성능을 나타냈다. 질의 처리시의 성능은 모든 분포에서 좋은 후보 선택의 결과를 나타냈다.

시간 데이타베이스에서 시간 간격 분할 알고리즘의 구현 및 평가 (Implementation and Evaluation of Time Interval Partitioning Algorithm in Temporal Databases)

  • 이광규;신예호;류근호;김홍기
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.9-16
    • /
    • 2002
  • 조인 연산은 관계형 데이타베이스에서와 같이 시간 데이타베이스에서도 시스템 성능에 큰 영향을 미친다. 특히, 시간 조인은 조인 연산 단계 이전에 간격 분할의 최적화가 질의 처리 성능을 결정한다. 이 논문에서는 시간 데이타베이스의 병렬 조인 질의 처리 성능을 개선하기 위해 시간 조인 연산을 위한 시간 간격을 분할하는 최소 분할 기법을 제안하였고, 제안된 간격 분할의 최소 분할점을 결정하는 최소 간격 분할 알고리즘의 유효성은 예제 시나리오를 통해 검증하였으며, 기존 분할 알고리즘에 비해 성능 개선 효과가 있음을 확인하였다.

시퀀스 데이타베이스에서 타임 워핑을 지원하는 효과적인 유살 검색 기법 (An Effective Similarity Search Technique supporting Time Warping in Sequence Databases)

  • 김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.643-654
    • /
    • 2001
  • 본 논문에서는 대형 시퀀스 데이타베이스에서 타임 워핑을 지원하는 유사 검색을 효과적으로 처리하는 방안에 관하여 논의한다 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 타임 워핑 거리는 삼각형 부등식 성질을 만족하지 못하므로 기존의 기법들은 착오 기각(false dismissal) 없이 다차원인덱스를 사용할 수 없었다. 이러한 기법들은 전체 데이타베이스를 스캔해야 하므로 대형 데이타베이스에서는 심각한 성능 저하의 문제를 가진다. 서픽스 트리를 사용하는 또 다른 기법은 큰 트리로 인한 성능상의 문제를 갖는다 본 논문에서는 타임 워핑을 지원하는 효과적인 유사 검색 기법을 제안한다. 제안된 기법의 주요 목표는 착오 기각 없이 대형 데이타베이스에서도 좋은 검색 성능을 보장하는 것이다. 이러한 목표를 위하여 본 연구에서는 삼각형 부등식을 만족하는 타임 워핑 거리의 새로운 하한 거리 함수 $D_{tw-Ib}를 고안한다. D_{tw-Ib}$는 각 시퀀스로부터 타임 워핑과 무관한 4-터플 특성 벡터를 추출한 다. 제안된 기법에서는 이러한 4-터플 특성 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 기반으로 유사 검색을 효율적으로 처리한다. 본 논문에서는 제안된 기법에서 착오 기각이 발생하지 않음을 증명한다. 또한, 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 의하면 제안된 기법은 기존의 기법들과 비교하여 실제 S&P 500 주식 데이타에 대하여 43배, 대형 생성 데이타에 대하여 720배가지 의 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF