• 제목/요약/키워드: Compressed database

검색결과 45건 처리시간 0.027초

추론한 데이타 타입을 이용한 질의 가능 XML 압축 (A Queriable XML Compression using Inferred Data Types)

  • 박명제;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.441-451
    • /
    • 2005
  • HTML은 데이타베이스와 같은 특수한 형태의 저장소 대신, 전형적인 파일 시스템에 저장되는 경우가 대부분이다. 이와 마찬가지로, 최근 인터넷 상에서의 데이타 교환 및 표현의 표준으로 부각되는 XML 역시 파일 시스템을 통하여 저장되는 경우가 현저하다. 하지만, XML 문서가 지니는 비정규적인 구조와 장황성 때문에, 디스크 공간이나 네트워크 상의 대역폭의 사용이 정규적인 구조를 지니는 데이터에 비해 크다. 이러한 XML 문서의 비효율성을 해결하고자, XML 문서의 압축에 관한 연구가 진행되었다. 최근에 연구된 XML 압축 기법들을 살펴보면, 압축된 XML 문서에 대한 질의를 전혀 지원하지 않거나, 질의를 지원하더라도 XML 문서 내의 데이타 값들의 특성을 고려하지 않고 단순히 기존의 압축 방법들을 적용하기 때문에 영역 질의를 지원하기 위해서는 압축의 일부를 복원해야 한다. 그 결과, 압축된 XML 문서에 대한 질의 성능이 저하되었다. 따라서, 본 연구에서는 압축된 XML 문서에 직접적이고 효율적인 질의를 지원하는 XML 압축 기법을 제안하고자 한다. XML 문서의 각 태그를 사전 압축 방법을 사용하여 압축하고자 하며, 태그 별로 데이타들의 타입을 추론하여 추론된 타입에 적절한 압축 방법을 사용하여 데이타 값들을 압축하고자 한다. 또한, 제안하는 압축 기법의 구현 및 성능 평가를 통하여, 구현한 XML 압축기가 실생활에 사용되는 XML 문서들을 효율적으로 압축하며 압축된 XML 문서에 대해 향상된 질의 성능을 제공하는 것을 보인다.

의료영상 압축을 위한 통합압축환경시스템 구현 (Implement of Integration Compression Environment System Compressing Medical Images)

  • 추은형;박무훈
    • 한국정보통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.142-148
    • /
    • 2003
  • 병원에서 발생하는 대용량 의료영상들을 저장 및 전송 할 경우에 저장 매체 수요의 증가와 네트워크 속도의 저하 등의 문제점들이 야기된다. 이러한 문제점들을 해결하기 위한 방안으로 의료영상의 압축이 필요하게 되었다. 본 논문에서는 개개의 여러 압축방법들로 하나의 통합된 환경에서 다양한 종류의 의료영상들을 압축할 수 있는 통합압축환경시스템을 설계 및 구현하였다. 이 통합압축환경에 구현된 압축방법들 중에는 DICOM 3.0규약을 따르는 RLC, 무손실 JPEG 압축방식, JPEG방식들이 있다. 그리고 JPEG2000에 사용되어진 이산웨이블릿변환을 이용한 압축방식과 병 변에 대한 정확성을 높이고 압축률을 좋게 하기 위해서 하나의 영상에서 무손실 압축과 손실 압축을 동시에 하는 방법을 제안하였다. 그리고 영상 정보를 효율적 관리할 수 있게 데이터베이스와 연동이 가능하도록 하였다.

Construction of PANM Database (Protostome DB) for rapid annotation of NGS data in Mollusks

  • Kang, Se Won;Park, So Young;Patnaik, Bharat Bhusan;Hwang, Hee Ju;Kim, Changmu;Kim, Soonok;Lee, Jun Sang;Han, Yeon Soo;Lee, Yong Seok
    • 한국패류학회지
    • /
    • 제31권3호
    • /
    • pp.243-247
    • /
    • 2015
  • A stand-alone BLAST server is available that provides a convenient and amenable platform for the analysis of molluscan sequence information especially the EST sequences generated by traditional sequencing methods. However, it is found that the server has limitations in the annotation of molluscan sequences generated using next-generation sequencing (NGS) platforms due to inconsistencies in molluscan sequence available at NCBI. We constructed a web-based interface for a new stand-alone BLAST, called PANM-DB (Protostome DB) for the analysis of molluscan NGS data. The PANM-DB includes the amino acid sequences from the protostome groups-Arthropoda, Nematoda, and Mollusca downloaded from GenBank with the NCBI taxonomy Browser. The sequences were translated into multi-FASTA format and stored in the database by using the formatdb program at NCBI. PANM-DB contains 6% of NCBInr database sequences (as of 24-06-2015), and for an input of 10,000 RNA-seq sequences the processing speed was 15 times faster by using PANM-DB when compared with NCBInr DB. It was also noted that PANM-DB show two times more significant hits with diverse annotation profiles as compared with Mollusks DB. Hence, the construction of PANM-DB is a significant step in the annotation of molluscan sequence information obtained from NGS platforms. The PANM-DB is freely downloadable from the web-based interface (Malacological Society of Korea, http://malacol.or/kr/blast) as compressed file system and can run on any compatible operating system.

고차원에서 선택율 추정을 위한 블록 히스토그램 압축방법 (Block Histogram Compression Method for Selectivity Estimation in High-dimensions)

  • 이주홍;전석주;박선
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.927-934
    • /
    • 2003
  • 데이터베이스 질의 최적화기는 가장 효율적인 실행계획을 구하기 위해서 질의의 선택율을 추정한다. 일반적으로 애트리뷰트들은 서로 독립적이지 않기 때문에 여러 개의 애트리뷰트를 가지는 질의에 대해서는 다차원 선택을 추정 기법이 필요하다. 대부분의 상용 데이터베이스에서는 히스토그램이 계산 오버헤드가 많지 않고 작은 에러율로 데이터 분포를 를 근사 시킬 수 있기 때문에 실용적으로 많이 사용되고 있다. 그러나 여러 개의 애트리뷰트를 가진 다차원 지?l의 경우에서는 차원이 높아 질수록 에러율을 낮추기 위해 많은 저장 공간을 필요로 하기 때문에 히스토크램 방법이 적합하지 않다. 이 논문에서는 다차원 선택을 추정을 위한 새로운 기법을 제안한다. 다차원 공간에서 크기가 작은 히스토그램 버켓을 많이 만들고 이 버켓의 정보를 DCT로 압축하여 선택을 추정에 사용함으로써 에러율을 작게 하고 저장 공간의 사용량도 줄인다. 폭 넓은 실험 결과는 본 논문에서 제시한 방법들의 타당성과 이점을 확인시켜 준다.

Implement of Integration Compression Environment Using Medical Images

  • Chu, Eun-Hyoung;Park, Mu-Hun
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.268-272
    • /
    • 2003
  • Large medical images in PACS are compressed for saving storage space and improving network speed. The integrated compression environment was designed and developed for uniting of various compression methods. Various compression algorithm-RLE compression, lossless JEPG, JPEG, was built into it, complying with DICOM. A image compression using DWT was also implemented in it. And a unified algorithm of lossless compression and lossy compression was designed to improve images quality and to make compression ratios high. And integrated compression environment was operating together with a database program for efficient and user-friendly management.

  • PDF

플래시메모리-SSD의 인덱스 연산 성능 향상을 위한 압축된 핫-콜드 클러스터링 기법 (A Compressed Hot-Cold Clustering to Improve Index Operation Performance of Flash Memory-SSD Systems)

  • 변시우
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.166-174
    • /
    • 2010
  • SSD는 데스크탑 및 이동형 컴퓨터의 저장 장치를 지원하는 우수한 미디어이다. SSD는 비휘발성, 낮은 전력 소모, 빠른 데이터 접근 속도 등의 특징으로 데스크탑 및 서버용 데이터베이스의 핵심 저장 요소가 되었다. 하지만, 일반 RAM 메모리에 비하여 상대적으로 느린 연산 특성을 고려하여 기존의 전통적인 인덱스 관리 기법을 개선할 필요가 있다. 이를 위하여, 본 논문은 CHC-Tree 라고 하는 압축된 핫-콜드 클러스터링에 기반하는 새로운 인덱스 관리 기법을 제안한다. CHC-Tree는 인덱스 노드를 핫-콜드 세그먼트로 분류하며, 인덱스 노드의 키와 포인터를 압축한다. 콜드 세그먼트의 비활용노드의 오프셋 압축으로 느린 쓰기연산의 부담을 줄인다. 또한, 실험 결과를 통하여 기존의 B-Tree 기반의 인덱스 관리 기법보다 인덱스 검색 연산에서 26%, 인덱스 수정 연산에서 23% 이상 우수함을 확인하였다.

JPEG-2000 부분 엔트로피 복호화에 의향 질감 영상 데이터베이스 검색 (Texture Image Database Retrieval Using JPEG-2000 Partial Entropy Decoding)

  • 박하중;정호열
    • 한국통신학회논문지
    • /
    • 제32권5C호
    • /
    • pp.496-512
    • /
    • 2007
  • 본 논문에서는 엔트로피 복호화 과정을 부분적으로 수행하여 특징 벡터를 구성하는 새로운 JPEG-2000 압축 영상 검색 시스템을 제안한다. 제안하는 방법은 JPEG-2000 엔트로피 부호화 과정을 통해 발생하는 다양한 문맥 정보를 이용한다. 엔트로피 부호화 기술은 주위 인접한 웨이블릿 계수들의 부호 및 중요 상태 계수의 구조적인 패턴을 분석하여 세 가지의 부호화 패스 및 네 가지의 부호화 기술을 통해 총 19가지의 문맥 정보를 발생한다. 문맥 정보는 산술 부호화 과정에서 부호화 하는 심벌의 확률을 예측하기 위한 모델을 제공한다. 그리고 문맥 정보는 영상의 국부적인 특징을 서술 할 수 있기 때문에 다양한 패턴 특성을 나타내는 질감 영상을 효율적으로 정의할 수 있다. 또한 제안하는 알고리즘은 JPEG-2000 압축 영상에서 복호화 과정을 부분적으로 수행하기 때문에 영상 검색을 수행하기 위한 검색 시간에서 뛰어난 성능을 나타낼 수 있다. 실험을 위해 MIT VisTex 질감 영상을 이용하여 다양한 왜곡 영상 및 유사 영상 데이터베이스를 구성하였으며 기존 검색 알고리즘을 구현하여 제안하는 검색 시스템과 비교 및 평가한다. 본 논문에서 제안하는 알고리즘이 기존 검색 방법보다 검색 성능에서 뛰어날 뿐만 아니라 검색 시간에서도 많은 이득을 얻을 수 있다.

모바일 DBMS를 위한 효율적인 압축 데이터 관리 시스템의 개발 (Development of the Efficient Compressed Data Management System for Embedded DBMS)

  • 신영재;황진호;김학수;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제15D권5호
    • /
    • pp.589-598
    • /
    • 2008
  • 최근 휴대용 정보기기 사용이 보편화되어지고, 정보의 디지털화로 인해 휴대용 정보기기에서 처리되어야 하는 정보가 무수히 많아지고 있다. 이로 인해 휴대용 정보기기에서는 정보들을 효과적으로 관리하기 위해 모바일 DBMS의 사용이 요구되고 있다. 또한 휴대용 정보기기에서 보편적으로 사용되는 저장장치는 NAND형 플래시 메모리로 단위 공간당 비용이 기존의 하드디스크에 비해 수십 배 가량 높아 저장 공간의 효율적인 관리가 요구되고 있다. 따라서 본 논문에서는 플래시메모리를 저장매체로 사용하는 모바일 DBMS에서 압축 기법을 사용한 효율적인 데이터 관리 시스템을 제안한다. 제안되는 압축 기반 시스템은 저장 공간의 절약을 가져오고, 데이터 입출력을 줄인다. 이러한 이점은 플래시 메모리의 수명을 연장시키는 효과 또한 기대할 수 있다.

수치지형도를 이용한 연속지적도의 지도 일반화 기법 연구 (The Map Generalization Methodology for Korean Cadastral Map using Topographic Map)

  • 박우진;이재은;유기윤
    • Spatial Information Research
    • /
    • 제19권1호
    • /
    • pp.73-82
    • /
    • 2011
  • 최근, 지적도 이용에 대한 요구사항이 공공기관과 민간부문에서 높아지고 있는 추세이다. 지적도를 웹 환경 또는 모바일 환경에서 활용하기 위해서는 원 지도자료를 임의 단계의 축척 별로 압축해 놓은 다축척 공간표현 데이터베이스로 구축되어야 할 필요가 있다. 본 연구에서는 기존의 연속지적도를 다축척 공간표현 데이터베이스로 구축하는데 있어서 지형도와의 중첩과 폴리곤 지도 일반화 기법을 적용하는 방안에 대해서 제안하였다. 이 과정은 크게 지형도 네트워크 데이터 재구조화, 네트워크 위계에 따른 필지경계선 병합, 선형 단순화 기법 적용의 세 단계로 이루어져 있다. 본 연구에서 제안된 일반화 기법을 수원지역의 연속지적도에 적용한 결과, 1:5,000, 1:20,000, 1:100,000 세 축척의 연속지적도로 각각 일반화 되었으며, 데이터 압축률은 각각 15%, 8%, 1% 수준으로 나타났다.

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법 (Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web)

  • 김덕환;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.464-475
    • /
    • 2003
  • 웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.