A Selective Compression Strategy for Performance Improvement of Database Compression (데이터베이스 압축 성능 향상을 위한 선택적 압축 전략)

  • Lee, Ki-Hoon
    • KIPS Transactions on Software and Data Engineering
    • v.4 no.9
    • pp.371-376
    • 2015
  • The Internet of Things (IoT) significantly increases the amount of data. Database compression is important for big data because it can reduce costs for storage systems and save I/O bandwidth. However, it could show low performance for write-intensive workloads such as OLTP due to the updates of compressed pages. In this paper, we present practical guidelines for the performance improvement of database compression. Especially, we propose the SELECTIVE strategy, which compresses only tables whose space savings are close to the expected space savings calculated by the compressed page size. Experimental results using the TPC-C benchmark and MySQL show that the strategy can achieve 1.1 times better performance than the uncompressed counterpart with 17.3% space savings.

The Analysis of Genome Database Compaction based on Sequence Similarity (시퀀스 유사도에 기반한 유전체 데이터베이스 압축 및 영향 분석)

  • Kwon, Sunyoung;Lee, Byunghan;Park, Seunghyun;Jo, Jeonghee;Yoon, Sungroh
    • KIISE Transactions on Computing Practices
    • v.23 no.4
    • pp.250-255
    • 2017
  • Given the explosion of genomic data and expansion of applications such as precision medicine, the importance of efficient genome-database management continues to grow. Traditional compression techniques may be effective in reducing the size of a database, but a new challenge follows in terms of performing operations such as comparison and searches on the compressed database. Based on that many genome databases typically have numerous duplicated or similar sequences, and that the runtime of genome analyses is normally proportional to the number of sequences in a database, we propose a technique that can compress a genome database by eliminating similar entries from the database. Through our experiments, we show that we can remove approximately 84% of sequences with 1% similarity threshold, accelerating the downstream classification tasks by approximately 10 times. We also confirm that our compression method does not significantly affect the accuracy of taxonomy diversity assessments or classification.

A Study on XML Compress method for efficient integration and storing of XML-based Clinical Information (XML 기반의 통합 임상정보를 효율적으로 저장하기 위한 XML 압축 기법에 대한 연구)

  • Yu, Wee-Hyuk;Jeong, Jong-Il;Lee, Tae-Heon;Shin, Dong-Kyoo;Shin, Dong-Il
    • Annual Conference of KIPS
    • 2005.05a
    • pp.71-74
    • 2005
  • 임상정보 문서는 환자 진료기록뿐만 아니라 처방전, 개인적 유전자정보를 가지고 있다. 이러한 임상 정보 문서는 병원 시스템들간에 교환 및 공유함으로써 양질의 의료서비스를 제공할 수 있다. 이와 관련하여 임상정보의 통합을 위한 기존의 연구들은 각각 HL7 메시지를 XML 문서로 변환하고 XML 기반의 CDA 를 관계형 데이터베이스에 저장하는 연구가 진행되었다. 그러나 관계형 데이터베이스는 문서의 데이터 별 테이블 단위로 생성, 저장된다. 그러나 HL7 과 CDA 는 문서 중심의 XML 문서이기 때문에 관계형 데이터베이스에 저장 시 문서 별 많은 변이가 존재하여 테이블 증가를 갖는다. 따라서 비정규적인 구조에 적합한 데이터베이스를 선택하기 위해 XML 전용 데이터베이스와 관계형 데이터베이스 비교하고 효율적 저장을 위해 압축기법을 제시한다. 압축기법을 적용한 임상 정보 데이터베이스는 대용량 임상정보 문서의 크기를 압축함으로써 문서의 크기를 줄임으로써 데이터베이스의 효율적 저장을 향상시킨다.

Motion-Capture-Based Animation in Mobile Embedded Systems Using Motion Capture Database Reduction Technique (데이터베이스 축소기법을 사용한 모바일 임베디드 시스템에서의 모션 캡쳐 기반 애니메이션)

  • Han, Young-Mo
    • The KIPS Transactions:PartB
    • v.14B no.6
    • pp.437-444
    • 2007
  • The objective of this paper is to accommodate the existing motion-capture-based animation to small memories and low computing powers of mobile embedded systems. To use efficiently memories, we propose a paradigm in which a motion capture database is compressed on a PC and so-compressed motion capture database is decompressed little by little on mobile embedded systems and the decompressed data are eliminated right after used. As a compression method for this paradigm we propose an approach that compresses captured motion rendering parameters using a polynomial function fitting method. To enhance its performance we also propose an optimization method for the degree of the polynomial fitting function. Using so-obtained compression method we demonstrate motion-capture-based animation on commercial mobile embedded systems.

Face recognition rate comparison using Principal Component Analysis in Wavelet compression image (Wavelet 압축 영상에서 PCA를 이용한 얼굴 인식률 비교)

  • 박장한;남궁재찬
    • Journal of the Institute of Electronics Engineers of Korea CI
    • v.41 no.5
    • pp.33-40
    • 2004
  • In this paper, we constructs face database by using wavelet comparison, and compare face recognition rate by using principle component analysis (Principal Component Analysis : PCA) algorithm. General face recognition method constructs database, and do face recognition by using normalized size. Proposed method changes image of normalized size (92${\times}$112) to 1 step, 2 step, 3 steps to wavelet compression and construct database. Input image did compression by wavelet and a face recognition experiment by PCA algorithm. As well as method that is proposed through an experiment reduces existing face image's information, the processing speed improved. Also, original image of proposed method showed recognition rate about 99.05%, 1 step 99.05%, 2 step 98.93%, 3 steps 98.54%, and showed that is possible to do face recognition constructing face database of large quantity.

A Service Strategy of Binary Document Images in Digital Library (전자도서관에서의 이진 문서영상 서비스 방안)

  • 한영미;허봉식;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • 1998.04a
    • pp.154-159
    • 1998
  • 최근의 전자도서관에서 문서영상 데이터베이스를 구축하여 사용자에게 원하는 정보의 원문을 그대로 서비스하고 있는데, 주로 200 dpi 문서영상에 대해 TIFF 영상포맷에서의 ITU-T T.6 압축방법을 사용하고 있다. 본 연구에서는, 문서영상 데이터베이스의 확장성, 지속성, 효율성 등을 고려하여, 문서 영상의 스캐닝 해상도의 600 dpi가 적당하며, 압축방법은 JBIG이 타당함을 제시하였다. 아울러, 모니터 및 프린터 기반 서비스의 특성을 분석하여 서비스 해상도를 차별화하는 방법인 단계별 서비스 방안을 제시함으로써 JBIG의 단점인 과다한 복구시간 문제를 해결하였다. 대표적인 문서영상들에 대한 실험을 통해, JBIG의 높은 압축율 및 제시된 단계별 서비스 방안의 타당성을 확인하였다.

Medical Image Database for Morphometric and Functional Analysis of Brain Images (뇌 영상의 형태적 및 기능적 분석을 위한 의료 영상 데이터베이스)

  • Kim, Tae-U
    • The KIPS Transactions:PartB
    • v.8B no.2
    • pp.164-172
    • 2001
  • 본 논문에서는 시각화와 공간적, 속성 혼합 쿼리를 수행할 수 있는 관계형 데이터베이스를 설계하고 구현하였다. 쿼리에 사용되는 데이터형은 슬라이스, MPR, 볼륨 렌더링으로 시각화할 수 있으며, 쿼리는 아탈라스를 이용하는 경우와 그렇지 않는 경우를모두 고려하였다. 영상 데이터는 공간충전 곡선으로 공간적으로 클러스트링한 후 무손실 압축하여 데이터베이스에 저장된다. 본 논문은 저장 데이터의 양을 줄이기 위하여 관심영역의 크기에 따라 창의 크기가 변하는 적응적 Hibert 곡선을 제안하였으며, 실험에서 Hibert 곡선의 적용한 데이터보다 약 1.15배 높은 압축율을 보였다. 또한 아틀라스에 대한 뇌종양의 공간적 쿼리 결과를 통하여 본 의료 영상 데이터베이스의 유용성을 보였다.

Simple Wavelet-based Histogram of Multidimensional Selectivity Estimation for Spatio-temporal Databases (시공간데이터베이스의 다차원 선택도 추정을 위한 웨이블렛 기반 히스토그램)

  • Kwon, Jung-Min;Shin, Byung-Chul;Lee, Jong-Yun
    • Proceedings of the Korean Information Science Society Conference
    • 2005.11b
    • pp.34-36
    • 2005
  • 선택도 추정 기법은 상용 데이터베이스에서 질의 최적화를 위해 많이 사용하고 있다. 그 중 선택도 추정 기법에 가장 많이 사용되고 있는 기법은 히스토그램이다. 최근 시공간 데이터베이스 관련 연구에서 시간$\cdot$공간 데이터베이스의 선택도 추정 기법이 활발하게 이루어지고 있다. 이 히스토그램 추정 기법이 과거에서 현재시점까지 범위 질의 수행을 성공적으로 이루어지고 있지만 대량의 데이터들을 효율적으로 관리하기에는 저장오버헤드가 너무 크다. 본 논문에서는 시공간데이터베이스에서 성공적으로 선택도 추정을 다룬 히스토그램 추정 기법을 보완하여 과거 이력데이터들의 저장을 효율적으로 할 수 있는 압축기법을 제안한다. 현재 객체에 대해서는 기존 연구에서 성공적으로 이루어진 히스토그램 기반 추정 기법을 응용하고 과거 이력데이터에 대해서는 압축기법인 웨이블렛을 응용하여 선택도추정의 오류율과 저장오버헤드의 향상이 기대된다.

Design and Implementation of MPEG-2 Compressed Video Information Management System (MPEG-2 압축 동영상 정보 관리 시스템의 설계 및 구현)

  • Heo, Jin-Yong;Kim, In-Hong;Bae, Jong-Min;Kang, Hyun-Syug
    • The Transactions of the Korea Information Processing Society
    • v.5 no.6
    • pp.1431-1440
    • 1998
  • Video data are retrieved and stored in various compressed forms according to their characteristics, In this paper, we present a generic data model that captures the structure of a video document and that provides a means for indexing a video stream, Using this model, we design and implement CVIMS (the MPEG-2 Compressed Video Information Management System) to store and retrieve video documents, CVIMS extracts I-frames from MPEG-2 files, selects key-frames from the I -frames, and stores in database the index information such as thumbnails, captions, and picture descriptors of the key-frames, And also, CVIMS retrieves MPEG- 2 video data using the thumbnails of key-frames and v31ious labels of queries.

Technique about Data Capacity Adaptation for the Mobile Compressed Data Management System (모바일 압축 데이터 관리 시스템(CDMS)를 위한 데이터 가용 크기 변경 기법)

  • Jang, Jin-Kun;Shin, Young-Jae;Lee, Jeong-Wha;Son, Jin-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • 2007.10c
    • pp.107-112
    • 2007
  • 휴대용 정보기기는 정보의 디지털화로 인해 많아지고 있는 디지털 정보를 처리 및 저장해야 되는 상황이 되었다. 따라서 휴대용 정보기기에서는 무수한 디지털 정보를 효과적으로 관리하기 위해 모바일 DBMS을 사용하게 되었고, 저장장치로는 플래시 메모리를 사용하고 있다. 플래시 메모리는 일반 디스크보다 고비용이기 때문에 데이터를 보다 효율적으로 저장하기 위하여 압축 데이터 관리 시스템(CDMS)과 같은 압축을 사용한 관리도 사용되고 있다. 하지만 압축을 사용하여 저장공간을 효율적으로 사용하기 위한 CDMS의 연구는 데이터베이스 파일 크기를 고정하여 관리하였다. 하지만 이것은 실제사용에 있어서는 실용적이지 못하다. 따라서 본 논문에서는 이러한 CDMS를 보완하여 데이터베이스 파일 크기를 동적으로 변환하는 기법을 제시한다.

