• 제목/요약/키워드: 인덱스 스캔

검색결과 13건 처리시간 0.023초

플래시 SSD를 활용한 비동기 복수 I/O 인덱스 스캔 (Asynchronous plural I/O index scan using flash SSD)

  • 박지영;강운학;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1389-1391
    • /
    • 2012
  • 인덱스는 데이터 검색을 빠르게 하기 위하여 사용되며, 많은 데이터를 저장하는 대용량 데이터베이스 시스템은 B+-tree 인덱스를 주로 사용한다. B-tree 인덱스를 사용하여 범위 검색을 수행하는 경우 레코드 각각에 대하여 I/O를 요청함으로써 프로세스가 자주 대기(waiting) 상태가 되어 많은 오버헤드가 발생하였다. 이러한 문제를 해결하고자 본 논문에서 비동기 복수 I/O 인덱스 스캔방법을 제안한다. 비동기 복수 I/O 인덱스 스캔이 최고 6.5배 빠른 성능을 보였다.

정렬 인덱스 스캔을 이용한 조인기법 (A Join Processing Technique using Sorted Index Scan)

  • 이종백;강운학;이상원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.16-18
    • /
    • 2012
  • 플래시메모리는 빠른 성능 및 저전력 등 여러 가지 장점 덕분에 저장장치 시장에서 최근 빠른 속도로 하드디스크를 대체해 가고 있다. 특히, 엔터프라이즈 데이터베이스 분야에서 가격 대비 성능 면에서 효과가 높기 때문에 더 주목을 받고 있다. 데이터베이스 분야에서 조인은 가장 자주 사용되는 연산으로 그 성능 개선이 중요한데, 본 논문에서는 플래시메모리를 위한 새로운 조인 처리의 한 방법으로 정렬 인덱스 스캔 방식을 활용하는 방안은 제시한다. 정렬 인덱스 스캔은 최근 플래시메모리 상에서 테이블에 대한 접근 방식의 하나로, 조인결과의 정렬을 고려할 경우, 기존의 전체 테이블 스캔에 기반을 둔 해시조인이나 정렬합병조인과 비교했을 때 상당한 성능 개선을 보장한다.

데이터베이스 백업 성능 향상을 위한 병렬 인덱스 스캔 기법 (Improving Performance of Database Backup via Parallel Index Scan)

  • 이민욱;한재현;손용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.54-56
    • /
    • 2021
  • 데이터베이스 백업은 데이터베이스 데이터를 보존 및 복구하기 위해 사용되는 필수 기법이다. 이를 위해 데이터베이스 관리 시스템(Database Management System)에서는 백업 기능을 수행하는 응용을 제공한다. 하지만 이러한 백업 응용은 기존 HDD 의 특성을 고려하여 설계 및 구현되어있기 때문에 최근 주로 사용되고 있는 저장장치인 SSD 에서는 SSD 의 성능을 최대한 이끌어내지 못하고 있다. 예를 들어, 기존 백업 응용에서는 단일 스레드가 백업을 위한 데이터를 순차적으로 접근하고 풀 스캔 방식으로 백업을 수행한다. 따라서 본 연구에서는 SSD 의 병렬적 특성을 활용하여 백업 응용의 성능을 극대화시키는 것을 목표로 한다. 이를 위해 본 논문은 병렬 인덱스 스캔 기법을 제시한다. 제안한 기법은 기존 백업 기법과 달리 멀티 스레드를 활용하여 인덱스 스캔을 수행하고 병렬적으로 데이터에 접근하여 백업을 수행한다. 해당 기법은 기존 기법에 비해 최대 2.5 배 성능을 향상시켰다.

MySQL InnoDB엔진의 Secondary Index Scan을 위한 Prefetch 기능 구현 (Implementation of a Prefetch method for Secondary Index Scan in MySQL InnoDB Engine)

  • 황다솜;이상원
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.208-212
    • /
    • 2017
  • 플래시 SSD는 기존 하드디스크에 비해 높은 에너지 효율성, 외부 충격에 강한 내구성, 높은 입출력 처리량 등 여러 장점을 지니고 있다. 따라서 3D-NAND 및 V-NAND 등 단위 용량 당 비용을 획기적으로 개선하는 최신 기술의 등장과 맞물려서, 플래시 SSD가 많은 영역에서 하드디스크를 급격하게 대체하고 있다. 하지만, 주로 하드디스크를 가정하고 개발된 기존 데이터베이스 엔진은 플래시 SSD의 특성 (예를 들어, 내부 병렬성)을 제대로 활용하지 못하고 있다. 본 논문에서는, 더 빠른 질의 처리를 위해 플래시 SSD에 내재한 내부 병렬성을 활용하는 방법으로, MySQL InnoDB엔진에서 보조 인덱스(Secondary Index)를 이용한 스캔을 위해 비 동기적 입출력을 활용한 Prefetch 기능을 구현하였다. Prefetching을 사용한 스캔 기법은, 기존 InnoDB엔진의 보조 인덱스 스캔과 비교해서, 데이터 페이지 크기가 16KB일 경우, 약 3배 이상, 데이터 페이지 크기가 4KB일 경우, 약 4.2배 이상 성능 향상을 보인다.

종이컵 성형기용 배럴 캠 설계 프로그램 개발 (Development of Program for Designing Barrel Cam of Machine Making Paper Cups)

  • 김욱현;박태원
    • 대한기계학회논문집A
    • /
    • 제35권4호
    • /
    • pp.433-438
    • /
    • 2011
  • 종이컵 성형기는 배럴캠, 인덱스, 터렛, 모터 등의 많은 부품으로 이루어진다. 그 중에서 배럴캠은 기계의 주 구동부이다. 배럴캠이 회전하면서 인덱스에 고정되어 있는 롤러를 밀어준다. 그리고 인덱스와 연결된 터렛이 회전하면서 종이컵이 만들어진다. 따라서 종이컵 성형기의 성능은 배럴캠에 큰 영향을 받는다. 이번 연구에서는 배럴캠을 설계하는 프로그램이 MATLAB 을 이용하여 개발 되었다. 프로그램은 배럴캠의 프로파일을 만들어준다. 이 프로파일은 3 차원 CAD 프로그램을 이용 하여 3 차원 CAD 모델로 변환된다. 이 3 차원 CAD 모델과 배럴 캠의 3 차원 레이저 측정을 통해 생성된 모델을 포함하는 동역학 모델을 생성하였다. 그리고 동역학 모델을 검증하기 위해 기계의 인덱스의 회전각이 고속카메라를 이용하여 측정된다. 동역학 모델의 회전각을 비교하여 프로그램을 검증한다.

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

평면 점집합에서 정렬을 고려한 개선된 컨벡스 헐 알고리즘 (An Improved Convex Hull Algorithm Considering Sort in Plane Point Set)

  • 박병주;이재흥
    • 전기전자학회논문지
    • /
    • 제17권1호
    • /
    • pp.29-35
    • /
    • 2013
  • 본 연구에서는 임의의 정렬되지 않은 점집합에서 정렬을 고려한 개선된 Convex Hull 알고리즘을 제안한다. 이 알고리즘은 Convex Hull의 극점 특성을 이용하여 처리 데이터를 한정하기 때문에 계산복잡도가 낮다. 각 단계마다 볼록 정점을 판별하는 조건을 이용하여 한 번의 스캔으로 완전한 Convex Set을 구한다. 알고리즘 초기에 점집합의 정렬이 필요한데, 이때 걸리는 시간이 알고리즘 전체 동작시간의 대부분을 차지하기 때문에 값과 인덱스를 대치하여 빠르게 정렬하였다. 일반적인 상황을 가정하여 랜덤한 점집합으로 알고리즘의 동작시간을 측정하였으며 기존의 알고리즘에 비해 약 두 배의 속도 향상이 있음을 확인하였다.

시계열 이동평균 변환을 이용한 노이즈 제어 윤곽선 이미지 매칭 (Noise Control Boundary Image Matching Using Time-Series Moving Average Transform)

  • 김범수;문양세;김진호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.327-340
    • /
    • 2009
  • 본 논문에서는 윤곽선 이미지 매칭에서 노이즈 제거 정도를 제어하기 위해 시계열 매칭의 이동평균 변환을 이용한다. 이동평균 변환을 윤곽선 이미지 매칭에 적용하게 된 동기는 이동평균 변환이 시계열의 노이즈를 감소시키므로, 이를 사용하면 윤곽선 이미지 매칭에서도 노이즈 제어 효과를 얻을 수 있을 것이라는 직관에 기반한다. 본 논문에서는 우선 윤곽선 이미지 매칭에 이동평균 변환을 적용한 $\kappa$-계수 이미지 매칭($\kappa$-order image matching)을 제안한다. 제안한 $\kappa$-계수 이미지 매칭은 윤곽선 이미지가 변환된 시계열에 $\kappa$-이동평균 변환을 적용하여 시계열(이미지) 간의 유사성을 판단한다. 다음으로, 대용량 이미지 데이터베이스를 대상으로 $\kappa$-계수 이미지 매칭을 수행하기 위한 인덱스 기반 매칭 방법을 제안하고, 그 정확성을 정형적으로 증명한다. 또한, 계수 $\kappa$와 매칭 결과와의 관계를 정형적으로 분석하고, 이에 기반하여 계수 $\kappa$를 변화시키면서 노이즈 제거 정도를 제어하는 방안을 제시한다. 실험 결과, $\kappa$-계수 이미지 매칭이 노이즈 제거 효과를 가짐을 확인하였으며, 제안한 인덱스 기반 매칭 방법은 순차 스캔에 비해 수 배 에서 수십 배 빠른 성능을 보이는 것으로 나타났다.

시퀀스 데이타베이스에서 타임 워핑을 지원하는 효과적인 유살 검색 기법 (An Effective Similarity Search Technique supporting Time Warping in Sequence Databases)

  • 김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.643-654
    • /
    • 2001
  • 본 논문에서는 대형 시퀀스 데이타베이스에서 타임 워핑을 지원하는 유사 검색을 효과적으로 처리하는 방안에 관하여 논의한다 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 타임 워핑 거리는 삼각형 부등식 성질을 만족하지 못하므로 기존의 기법들은 착오 기각(false dismissal) 없이 다차원인덱스를 사용할 수 없었다. 이러한 기법들은 전체 데이타베이스를 스캔해야 하므로 대형 데이타베이스에서는 심각한 성능 저하의 문제를 가진다. 서픽스 트리를 사용하는 또 다른 기법은 큰 트리로 인한 성능상의 문제를 갖는다 본 논문에서는 타임 워핑을 지원하는 효과적인 유사 검색 기법을 제안한다. 제안된 기법의 주요 목표는 착오 기각 없이 대형 데이타베이스에서도 좋은 검색 성능을 보장하는 것이다. 이러한 목표를 위하여 본 연구에서는 삼각형 부등식을 만족하는 타임 워핑 거리의 새로운 하한 거리 함수 $D_{tw-Ib}를 고안한다. D_{tw-Ib}$는 각 시퀀스로부터 타임 워핑과 무관한 4-터플 특성 벡터를 추출한 다. 제안된 기법에서는 이러한 4-터플 특성 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 기반으로 유사 검색을 효율적으로 처리한다. 본 논문에서는 제안된 기법에서 착오 기각이 발생하지 않음을 증명한다. 또한, 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 의하면 제안된 기법은 기존의 기법들과 비교하여 실제 S&P 500 주식 데이타에 대하여 43배, 대형 생성 데이타에 대하여 720배가지 의 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

Linux File Systems에 따른 SQLite3 데이터베이스의 검색 성능 비교 (Comparison of Search Performance of SQLite3 Database by Linux File Systems)

  • 최진오
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.1-6
    • /
    • 2022
  • 최근 IoT 센서를 이용하여 데이터를 로컬에서 생산하고 스트림으로 제공하는 엣지 컴퓨팅(Edge Computing) 응용 분야가 넓어지고 있다. 대량으로 생산된 데이터는 실시간 처리를 위해 모바일 장치의 데이터베이스에 저장했다가 필요한 시점에 서버와 동기화된다. 이러한 응용 분야를 지원하기 위한 다양한 모바일 데이터베이스가 개발되었다. CloudScape, DB2 Everyplace, ASA, PointBase Mobile 등이며 그중 가장 널리 사용되는 대표적 모바일 데이터베이스는 리눅스 기반 SQLite3이다. 이 논문에서는 서버와 동기화 시 필요한 성능에 초점을 맞추었다. SQLite3의 정보 선택 시 필요한 검색 성능을 데이터베이스가 저장된 각 리눅스 파일 시스템의 종류에 따라 비교 분석하였다. 그래서 다양한 검색 쿼리 유형에 따라 파일 시스템별로 성능 차이를 확인하고 인덱스 사용 환경과 테이블 스캔 환경에 따라 더 적합한 리눅스 파일 시스템을 적용하는 기준을 마련하고 제시하였다.