• 제목/요약/키워드: data duplication

검색결과 204건 처리시간 0.026초

SSD 스토리지 시스템에서 PRAM 캐시를 이용한 데이터 중복제거 기법 (Data Deduplication Method using PRAM Cache in SSD Storage System)

  • 이승규;김주경;김덕환
    • 전자공학회논문지
    • /
    • 제50권4호
    • /
    • pp.117-123
    • /
    • 2013
  • 최근 클라우드 스토리지 환경에서 전통적인 스토리지장치인 하드디스크를 대체하여 SSD(Solid-State Drive)의 사용량이 증가하고 있다. SSD는 기계적인 동작이 없어 빠른 입출력 성능을 가지는 반면 덮어쓰기가 불가능한 특성을 가지고 있어 공간 효율성을 위한 관리가 중요하다. 이와 같은 마모도 특성을 갖는 SSD의 공간 효율성을 효과적으로 관리하기 위해 데이터 중복제거 기법을 이용한다. 하지만 데이터 중복제거 기법은 데이터 청킹, 해싱, 해시값 검색과정 연산을 포함하기 때문에 오버헤드가 발생하는 문제점이 있다. 본 논문에서는 SSD 스토리지 시스템에서 PRAM 캐시를 이용한 데이터 중복제거 기법을 제안한다. 제안한 방법은 DRAM의 1차 해시테이블에 PRAM에 캐싱된 데이터를 위한 해시값들을 저장하고, LRU(Least Recently Used)기법을 이용하여 관리한다. PRAM의 2차 해시테이블에는 SSD 스토리지에 저장된 데이터에 대한 해시값들을 저장하고, DRAM의 1차 해시테이블에 대한 백업을 PRAM에 유지함으로써 전원 손실등에 대비하여 신뢰성을 향상시킬 수 있다. 실험결과, 제안하는 기법은 기존의 DRAM에 모든 해시값들을 저장하여 관리하는 기법보다 SSD의 쓰기 횟수 및 연산시간을 워크로드별 평균 44.2%, 38.8%의 감소 효과를 보였다.

Evolutionary and Comparative Genomics to Drive Rational Drug Design, with Particular Focus on Neuropeptide Seven-Transmembrane Receptors

  • Furlong, Michael;Seong, Jae Young
    • Biomolecules & Therapeutics
    • /
    • 제25권1호
    • /
    • pp.57-68
    • /
    • 2017
  • Seven transmembrane receptors (7TMRs), also known as G protein-coupled receptors, are popular targets of drug development, particularly 7TMR systems that are activated by peptide ligands. Although many pharmaceutical drugs have been discovered via conventional bulk analysis techniques the increasing availability of structural and evolutionary data are facilitating change to rational, targeted drug design. This article discusses the appeal of neuropeptide-7TMR systems as drug targets and provides an overview of concepts in the evolution of vertebrate genomes and gene families. Subsequently, methods that use evolutionary concepts and comparative analysis techniques to aid in gene discovery, gene function identification, and novel drug design are provided along with case study examples.

A Phylogenetic Analysis for Hox Linked Gene Families of Vertebrates

  • Kim, Sun-Woo;Jung, Gi-La;Lee, Jae-Hyoun;Park, Ha-Young;Kim, Chang-Bae
    • Animal cells and systems
    • /
    • 제12권4호
    • /
    • pp.261-267
    • /
    • 2008
  • The human chromosomes 2, 7, 12 and 17 show genomic homology around Hox gene clusters, is taken as evidence that these paralogous gene families might have arisen from a ancestral chromosomal segment through genome duplication events. We have examined protein data from vertebrate and invertebrate genomes to analyze the phylogenetic history of multi-gene families with three or more of their representatives linked to human Hox clusters. Topology comparison based upon statistical significance and information of chromosome location for these genes examined have revealed many of linked genes coduplicated with Hox gene clusters. Most linked genes to Hox clusters share the same evolutionary history and are duplicated in concert with each other. We conclude that gene families linked to Hox clusters may be suggestion of ancient genome duplications.

Cellular IP 핸드오프 성능개선 (An Enhanced Handoff Mechanism for Cellular IP)

  • 김경아;김종권;박재윤
    • 정보처리학회논문지C
    • /
    • 제9C권1호
    • /
    • pp.89-96
    • /
    • 2002
  • 핸드오프는 무선 데이터 네트웍에서 TCP 성능을 저하시키는 가장 중요한 요인중 하나이다. 본 논문에서 패킷의 유신과, 중복이 없는 핸드오프 방법인 LPM(Last Packet Marking)을 제시한다. LPM은 Cellular IP 세미소프트 핸드오프를 개선한 방법으로 이동호스트에게 안전한 핸드오프 시점 알려준다. 새고 소개한 제어 패킷은 SPM(Semisoft reply Message) 하나이다. 컴퓨터 시뮬레이션을 통한 실험에서 LPM 방법은 패킷의 중복이나 유신이 없어서 TCP의 성능을 상당히 향상시켰다.

Evidence of genome duplication revealed by sequence analysis of multi-loci expressed sequence tagesimple sequence repeat bands in Panax ginseng Meyer

  • Kim, Nam-Hoon;Choi, Hong-Il;Kim, Kyung Hee;Jang, Woojong;Yang, Tae-Jin
    • Journal of Ginseng Research
    • /
    • 제38권2호
    • /
    • pp.130-135
    • /
    • 2014
  • Background: Panax ginseng, the most famous medicinal herb, has a highly duplicated genome structure. However, the genome duplication of P. ginseng has not been characterized at the sequence level. Multiple band patterns have been consistently observed during the development of DNA markers using unique sequences in P. ginseng. Methods: We compared the sequences of multiple bands derived from unique expressed sequence tagsimple sequence repeat (EST-SSR) markers to investigate the sequence level genome duplication. Results: Reamplification and sequencing of the individual bands revealed that, for each marker, two bands around the expected size were genuine amplicons derived from two paralogous loci. In each case, one of the two bands was polymorphic, showing different allelic forms among nine ginseng cultivars, whereas the other band was usually monomorphic. Sequences derived from the two loci showed a high similarity, including the same primer-binding site, but each locus could be distinguished based on SSR number variations and additional single nucleotide polymorphisms (SNPs) or InDels. A locus-specific marker designed from the SNP site between the paralogous loci produced a single band that also showed clear polymorphism among ginseng cultivars. Conclusion: Our data imply that the recent genome duplication has resulted in two highly similar paralogous regions in the ginseng genome. The two paralogous sequences could be differentiated by large SSR number variations and one or two additional SNPs or InDels in every 100 bp of genic region, which can serve as a reliable identifier for each locus.

클라우드 컴퓨팅을 위한 클라우드 스토리지 기술 분석 (Technical analysis of Cloud storage for Cloud Computing)

  • 박정수;정성재;배유미;경지훈;성경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.757-760
    • /
    • 2012
  • 클라우드 서비스 공급자가 제공하는 클라우드 스토리지 시스템은 대량의 데이터 저장 및 클라우드 컴퓨팅 처리의 핵심구성요소이다. 구글, 유투브, 페이스북 등과 같은 대형 벤더에서도 클라우드 스토리지를 사용하여 태블릿, 스마트폰 등 이기종 장치에서 사진, 동영상, 문서등을 공유하며, 쉽고 빠르게 네트워크를 통해 데이터의 대량 전송과 접근이 가능하다. 이로 인해 전세계적으로 데이터 성장 발전과 함께 클라우드 스토리지가 비지니스모델로 새롭게 부각받고 있다. 클라우드 스토리지는 네트워크 스토리지의 새로운 서비스 개념이며 데이터 구성, 스토리지 가상화, 데이터 복제와 중복제거, 보안 등을 포함한 클라우드 컴퓨팅 핵심기술이다. 본 논문에서는 클라우드 스토리지에 대해 분석한다.

  • PDF

극대용량 서지 링크드 데이터 구축의 효율성을 위한 RDF 트리플 저장소 접근 최소화에 관한 연구 (Research on Minimizing Access to RDF Triple Store for Efficiency in Constructing Massive Bibliographic Linked Data)

  • 이문호;최성필
    • 한국도서관정보학회지
    • /
    • 제48권3호
    • /
    • pp.233-257
    • /
    • 2017
  • 본 논문에서는 세계 최대 규모의 생의학 분야 서지 데이터베이스인 MEDLINE 전체를 링크드 데이터로 변환 구축하는 효율적인 방안을 제시한다. 이를 위해서 우선 MEDLINE 레코드 구조를 세부적으로 분석하여 적합한 RDF 스키마를 도출하고 각 레코드를 도출된 스키마에 유효한 RDF 파일로 변환하는 과정을 거친다. 본 논문에서는 변환된 레코드 단위의 모든 RDF 파일을 병합하여 이를 단일 RDF 트리플 저장소에 저장할 때 주어 URI 중복 확인 절차를 효율화하는 이중 일괄 등록 방법을 적용한다. 이 방법을 통해서 RDF 파일 단위로 링크드 데이터를 순차적으로 구축하는 방법과 비교했을 때 주어 URI 중복 제거를 위한 RDF 트리플 저장소 접근 횟수가 26,597,850회에서 2,400회로 감소하는 결과를 가져왔다. 따라서 본 연구의 결과는 대용량 서지 레코드 집합을 링크드 데이터로 변환하는 과정에서의 비효율성을 제거하고 신속성과 시의성을 확보할 수 있는 중대한 계기를 제공할 것으로 기대한다.

대용량 압축 데이터베이스를 위한 비대칭 색인 관리 기법 (Asymmetric Index Management Scheme for High-capacity Compressed Databases)

  • 변시우;장석우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.293-300
    • /
    • 2016
  • 전통적인 기존의 데이터베이스는 높은 성능을 얻기 위하여 느린 하드 디스크에서 관련된 레코드가 연속적으로 저장되어 있는 레코드 기반 모델을 활용한다. 그러나 읽기 집중적인 데이터 분석 시스템을 위해서는 컬럼 기반 압축 데이터베이스가 월등한 판독 성능으로 인하여 더 적합한 모델이 되고 있으며, 최근 플래시 메모리 SSD가 고속 분석용 시스템에 적합한 저장 매체로 선호되고 있다. 본 논문에서는 세로로 저장하는 컬럼 기반 스토리지 모델을 소개하고, 대용량 데이터웨어하우스 시스템을 위한 새로운 인덱스와 데이터 관리 기법을 제안한다. 제안된 인덱스 관리 기법은 두 개의 인덱스를 사용하는 비대칭 인덱스 이중화이며, 갱신용 마스터 인덱스와 판독용 컴팩트 인덱스를 활용하여 특히 읽기가 집중된 빅 데이터베이스에서 우수한 검색 성능을 얻는다. 그리고 본 데이터 관리 기법은 관련된 컬럼 압축과 두 개의 플래시 메모리 SSD를 이중화하여 높은 판독 성능과 처리 안정성에 도움을 준다. 고부하 워크로드 조건의 성능 평가 결과를 기반으로, 본 데이터 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 보이고자 한다.

디지털 3차원 실물복제기 시스템 및 공정기술 개발 (Development of Digital 3D Real Object Duplication System and Process Technology)

  • 김동수;안영진;이원희;최병호;장민호;백영종;최경현
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2005년도 춘계학술대회 논문집
    • /
    • pp.732-737
    • /
    • 2005
  • Distal 3D Real Object Duplication System(RODS) consists of 3D Scanner and Solid Freeform Fabrication System(SFFS). It is a device to make three-dimensional objects directly from the drawing or the scanning data. In this research, we developed an office type SFFS based on Three Dimensional Printing Process and a industrial SFFS using Dual Laser. An office type SFFS applied sliding mode control with sliding perturbation observer(SMCSPO) algorithm for control of this system. And we measured process variables about droplet diameter measurement and powder bed formation etc. through experiments. Also, in order to develop more elaborate and speedy system for large objects than existing SLS process, this study applies a new Selective Multi-Laser Sintering(SMLS) process and 3-axis dynamic Focusing Scanner for scanning large area instead of the existing $f\theta$ lens. In this process, the temperature has a great influence on sintering of the polymer. Also the laser parameters are considered like that laser beam power, scan speed, scan spacing. Now, this study is in progress to eveluate the effect of experimental parameters on the sintering process.

  • PDF

임베디드 SQL 기반 정보시스템의 개발 및 관리 방법에 대한 연구 (A Study on the Development and Maintenance of Embedded SQL based Information Systems)

  • 송용욱
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제19권4호
    • /
    • pp.25-49
    • /
    • 2010
  • As companies introduced ERP (Enterprise Resource Planning) systems since the middle of 1990s, the databases of the companies has become centralized and gigantic. The companies are now developing data-mining based applications on those centralized and gigantic databases for knowledge management. Almost of them are using $Pro^*C$/C++, a embedded SQL programming language, and it's because the $Pro^*C$/C++ is independent of platforms and also fast. However, they suffer from difficulties in development and maintenance due to the characteristics of corporate databases which have intrinsically large number of tables and fields. The purpose of this research is to design and implement a methodology which makes it easier to develop and maintain embedded SQL applications based on relational databases. Firstly, this article analyzes the syntax of $Pro^*C$/C++ and addresses the concept of repetition and duplication which causes the difficulties in development and maintenance of corporate information systems. Then, this article suggests a management architecture of source codes and databases in which a preprocessor generates $Pro^*C$/C++ source codes by referring a DB table specification, which would solve the problem of repetition and duplication. Moreover, this article also suggests another architecture of DB administration in which the preprocessor generates DB administration commands by referring the same table specification, which would solve the problem of repetition and duplication again. The preprocessor, named $PrePro^*C$, has been developed under the UNIX command-line prompt environment to preprocess $Pro^*C$/C++ source codes and SQL administration commands, and is under update to be used in another DB interface environment like ODBC and JDBC, too.