• 제목/요약/키워드: 데이터베이스 워크로드

검색결과 15건 처리시간 0.033초

데이터베이스 워크로드 식별을 위한 수정된 퍼지 k-NN 알고리즘 (A Modified Fuzzy k-NN Algorithm for Identifying Database Workloads)

  • 오정석;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.70-72
    • /
    • 2005
  • 데이터베이스 관리자는 효과적인 데이터베이스 관리를 위해 워크로드 특성을 잘 알아야 한다. 워크로드 특성은 데이터베이스 응용분야에 따라 다르며, 데이터베이스 환경에서 하나 이상의 응용 분야가 수행될 수 있다. 복합적인 데이터베이스 응용 분야 때문에, 관리자가 데이터베이스 시스템에서 발생하는 워크로드를 식별하기가 더욱 어려워졌다. 복합적인 데이터베이스 응용 분야의 효과적인 데이터베이스 관리를 수행하기 위해 워크로드를 식별할 수 있는 방법이 요구된다. 이를 위해, 본 연구는 TPC-C와 TPC-W 성능평가의 워크로드와 두 성능평가의 혼합된 워크로드들을 생성하여 워크로드 식별을 수행하였다. 워크로드 식별은 퍼지 k-NN 알고리즘을 수정하여 진행하였다. 수정된 k-NN 알고리즘은 혼합 비율에 따라 시험 워크로드 데이터와 훈련 워크로드 데이터간의 워크로드 식별 실험에 사용되었고, 분류를 위한 k-NN, 퍼지 k-NN, 분산 가중치 퍼지 k-NN 알고리즘의 결과와 비교되었다. 수정된 k-NN 알고리즘은 다른 알고리즘보다 k 인자에 따른 변동과 오차율이 감소하여 워크로드 식별에 더 적합함을 보였다. 본 논문의 결과는 복합된 데이터베이스 응용 분야의 특성을 보이는 데이터베이스 환경에서 워크로드 식별 정보를 창조하여 융통성 있는 튜닝 기법을 고려하는데 기여한다.

  • PDF

SVM 워크로드 분류기를 통한 자동화된 데이터베이스 워크로드 식별 (Automatic Identification of Database Workloads by using SVM Workload Classifier)

  • 김소연;노홍찬;박상현
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.84-90
    • /
    • 2010
  • 데이터베이스 시스템의 응용분야가 데이터웨어하우징에서 전자상거래에 이르기까지 광범위해지면서 데이터베이스 시스템이 대형화되었다. 이로 인해 데이터베이스 시스템의 성능 향상을 위한 튜닝이 중요한 논점이 되었다. 데이터베이스 시스템의 튜닝은 워크로드 특성을 고려하여 수행할 필요가 있다. 그러나 복합적인 데이터베이스 환경에서 워크로드를 식별하기는 어려우므로 자동적인 식별 방법이 요구된다. 본 논문에서는 데이터베이스 워크로드를 자동적으로 식별하는 SVM 워크로드 분류기를 제안한다. TPC-C와 TPC-W 성능 평가에서 자원할당 파라미터 변경에 따른 워크로드 데이터를 수집하여 SVM을 통해 분류 한다. SVM의 커널별 커널 파라미터와 오류 허용 임계치 값인 C의 조정을 통하여 최적의 SVM 워크로드 분류기를 선택한다. 제안한 SVM 워크로드 분류기와 Decision Tree, Naive Bayes, Multilayer Perceptron, K-NN 분류기의 분류 성능을 비교한 결과, SVM 워크로드 분류기가 다른 기계 학습 분류기보다 9% 이상 향상된 분류 성능을 보였다.

데이터베이스 워크로드에서의 자원 식별 (Resource Identification in Database Workloads)

  • 오정석;이상호
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.183-190
    • /
    • 2006
  • 데이터베이스 응용분야에 따라 데이터베이스 워크로드는 서로 다른 자원 사용 형태를 보인다. 데이터베이스 관리자는 워크로드 특성을 반영하는 자원 관리를 통하여 시스템 성능을 향상시킬 수 있다. 본 논문은 성능지표와 자원간의 관계를 분석하여 데이터베이스 시스템 성능에 영향을 주는 자원을 선별하는 방법을 제시한다. 첫째, 본 방법은 피어슨 상관계수와 유의도 검정을 적용하여 데이터베이스 시스템 자원 확장에 대해 감소되거나 증가되는 성능지표를 선별한다. 둘째, 감소/증가 관계를 갖는 성능지표를 이용하여 데이터베이스 시스템에 성능에 영향을 주는 자원을 선별한다. 실험은 TPC-C 및 TPC-W 환경에서 본 방법을 수행하였으며, 제안된 자원 선별 방법에 대한 검증 시험을 수행하였다.

테이블 연관관계 도출을 통한 데이터베이스스 워크로드 분석 (Database Workload Analysis Based on Table Relationships)

  • 김민수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.303-306
    • /
    • 2006
  • 데이터베이스 시스템을 효율적으로 운영하기 위하여 데이터베이스 관리자는 시스템의 자원 사용과 응용 프로그램에 의한 워크 로드의 특징을 알아야 한다. 워크 로드 분석을 위해 테이블, 리소스, 튜닝 방법론 등 여러 연구가 진행되어 왔으나 워크 로드를 형성하는 역할이 특정 테이블에만 집중되어 있는 현상에 대해서는 연구된 적이 없었다. 본 논문에서는 운영 시스템의 테이블 간의 연관 관계를 도출해 보고 연관 관계를 가지는 테이블 들이 워크 로드에 참여하는 유형과 횟수를 분석하는 워크 로드 분석 도구를 제안하고 대형 CRM 분석 시스템에 적용하여 데이터베이스 시스템의 워크로드를 분석해 본다.

  • PDF

혼합 워크로드 처리를 위한 컬럼 그룹 기반 동적 페이지 저장 관리 설계 (A Design of Column-Group based Dynamic Page Storage Model for Mixed Workloads)

  • 박경현;원희선;류근호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권2호
    • /
    • pp.335-341
    • /
    • 2018
  • 기존의 데이터베이스시스템은 정적 페이지 저장 모델을 사용하기 때문에 최근 데이터베이스 시장에서 요구하는 혼합 워크로드를 효율적으로 처리하기에는 한계를 가진다. 이에 본 논문에서는 혼합 워크로드의 특성을 반영할 수 있는 동적 페이지 저장 모델을 소개한다. 또한 혼합 워크로드를 분석하여 최적화된 컬럼 그룹을 추출한 후 동적으로 페이지를 구성하는 방법을 소개한다. 마지막으로 실험을 통해 본 논문에서 제안한 컬럼 그룹 기반의 동적 페이지 저장 모델이 기존의 페이지 저장 모델과 비교할 때 혼합 워크로드를 처리하는데 보다 효율적임을 보인다.

데이타베이스 워크로드 분석 : 실험적 연구 (Database Workload Analysis : An Empirical Study)

  • 오정석;이상호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.747-754
    • /
    • 2004
  • 데이타베이스 시스템을 효율적으로 사용하기 위해 데이타베이스 관리자는 데이타베이스 시스템의 성능 특징들을 알아야 한다 데이터베이스 시스템에서 자원 사용은 워크로드에 따라 다르게 나타난다. 본 논문의 목적은 상이할 워크로드에서 데이타베이스 튜닝에 도움이 될 수 있도록 데이타베이스 시스템의 성능 특징 분석하고 식별하는 것이다. 이를 위해, OLTP 환경을 나타내는 TPC-C 워크로드와 웹기반의 전자상거래 환경을 나타내는 TPC-W워크로드에서 14개의 성능 지표에 의해 결정되는 자원 사용 형태를 분석하고 4개(데이타 버퍼, 개인 메모리, I/O 프로세스, 공유 메모리)의 자원 할당 변경에 따른 자원 사용 형태의 변화를 분석한다. 분석에 대한 결과로서 14개 중 8개의 성능 지표는 워크로드에서 성능차이를 보이고, 데이타 버퍼 자원의 변경은 데이타베이스 시스템에 영향을 준다. 본 논문의 결과는 데이타베이스 시스템 자동 튜닝의 기초 자료로서 사용될 수 있다.

빅데이터 플랫폼 환경에서의 워크로드별 암호화 알고리즘 성능 분석 (Analysis of Encryption Algorithm Performance by Workload in BigData Platform)

  • 이선주;허준범
    • 정보보호학회논문지
    • /
    • 제29권6호
    • /
    • pp.1305-1317
    • /
    • 2019
  • 공공기관 및 기업의 빅데이터 플랫폼 환경에서 데이터 보호를 위한 암호화는 필수적인 요소이나 실제 빅데이터 워크로드를 고려한 암호화 알고리즘에 대한 성능 검증 연구는 많이 진행되지 않았다. 본 논문에서는 몽고 DB(MongoDB) 환경에서 데이터와 노드를 추가하여 빅데이터의 6가지 워크로드별로 AES, ARIA, 3DES별로 성능 변화 추이를 분석하였다. 이를 통해 빅데이터 플랫폼 환경에서 각 워크로드 별 최적의 블록기반 암호 알고리즘이 무엇인지 확인하고, NoSQL 데이터베이스 벤치마크(YCSB)를 사용하여 데이터와 노드 구성환경에서 다양한 워크로드별로 테스트를 통해 MongoDB의 성능을 고려한 최적화된 아키텍처를 제안한다.

ArangoDB기반 벤치마킹 시스템 설계 및 구현 (Design and Implementation of a Benchmarking System Based on ArangoDB)

  • 최도진;백연희;이소민;김윤아;김남영;최재용;이현병;임종태;복경수;송석일;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.198-208
    • /
    • 2021
  • ArangoDB는 대용량 데이터 저장을 위해 많은 응용에서 활용되고 있는 NoSQL 데이터베이스 시스템이다. ArangoDB와 같은 새로운 NoSQL 데이터베이스 시스템을 실제 환경에 적용하기 위해서 성능을 평가해 줄 수 있는 벤치마킹 시스템이 필요하다. 본 논문에서는 응용 계층뿐만 아니라 커널 계층에서의 성능이 측정 가능한 ArangoDB 기반 벤치마킹 시스템을 설계하고 구현한다. 클러스터 환경에서의 NoSQL 데이터베이스 시스템 성능을 측정하기 위해서 YCSB를 일부 수정한다. 또한, 기존 자료 분석을 통해 실세계에서 발생하는 세가지 워크로드 유형을 정의한다. 세 가지 워크로드 유형의 벤치마킹을 통해 ArangoDB에서 활용 가능한 워크로드를 도출하였고, 응용 계층뿐만 아니라 커널 계층의 성능이 가시화될 수 있음을 입증하였다. 기존 데이터베이스에서 ArangoDB로 데이터 이전 작업이 필요한 환경에서는 본 시스템의 벤치마킹을 통해 적용 가능성과 리스크 검토가 가능할 것으로 기대된다.

NoSQL 데이터베이스 엔진을 이용한 스토리지 벤치마킹 시스템 (Storage Benchmarking System Using NoSQL Database Engines)

  • 최도진;박수빈;박송희;백연희;신보경;최재용;박재열;임종태;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.445-446
    • /
    • 2019
  • 빅데이터 시대의 도래로 다양한 NoSQL 데이터베이스 엔진이 활용되고 있다. NoSQL 데이터베이스 엔진 기반의 다양한 응용들이 수행될 때 스토리지의 성능을 평가하기 위한 스토리지 벤치마킹 툴이 요구된다. 본 논문에서는 NoSQL 데이터베이스를 이용한 스토리지 벤치마킹 시스템을 설계한다. 제안하는 스토리지 벤치마킹 시스템은 IO 추적기를 통해 스토리지의 성능을 측정하고, 웹 UI를 통해 사용자 정의 워크로드 생성, 벤치마킹 실행, 결과 확인을 수행할 수 있다.

  • PDF

데이터베이스 압축 성능 향상을 위한 선택적 압축 전략 (A Selective Compression Strategy for Performance Improvement of Database Compression)

  • 이기훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.371-376
    • /
    • 2015
  • 사물인터넷 (IoT)은 데이터의 양을 상당히 증가시킨다. 데이터베이스 압축은 저장 시스템 비용과 I/O 대역폭을 절약할 수 있기 때문에 빅데이터에 있어서 중요하다. 그러나 데이터베이스 압축은 압축된 페이지에 대한 업데이트로 인해 OLTP와 같은 쓰기 집중적인 워크로드에 대해 낮은 성능을 보일 수 있다. 본 논문에서는 데이터베이스 압축의 성능 향상을 위한 실용적 가이드라인을 제시한다. 특히, 압축 페이지 크기에 의한 계산으로부터 예상되는 공간 절약과 거의 같은 공간 절약을 보이는 테이블들만을 압축하는 SELECTIVE 전략을 제시한다. TPC-C 벤치마크와 MySQL을 이용한 실험을 통해 SELECTIVE 전략이 압축하지 않는 방법에 비해 1.1배 높은 성능을 보이면서 17.3%의 공간을 절약한다는 것을 보였다.