• 제목/요약/키워드: erasure coding

검색결과 22건 처리시간 0.019초

A Family of Concatenated Network Codes for Improved Performance With Generations

  • Thibault, Jean-Pierre;Chan, Wai-Yip;Yousefi, Shahram
    • Journal of Communications and Networks
    • /
    • 제10권4호
    • /
    • pp.384-395
    • /
    • 2008
  • Random network coding can be viewed as a single block code applied to all source packets. To manage the concomitant high coding complexity, source packets can be partitioned into generations; block coding is then performed on each set. To reach a better performance-complexity tradeoff, we propose a novel concatenated network code which mixes generations while retaining the desirable properties of generation-based coding. Focusing on the code's erasure performance, we show that the probability of successfully decoding a generation on erasure channels can increase substantially for any erasure rate. Using both analysis (for small networks) and simulations (for larger networks), we show how the code's parameters can be tuned to extract best performance. As a result, the probability of failing to decode a generation is reduced by nearly one order of magnitude.

전송시간의 변화가 큰 네트워크에서 이레이저 코딩을 적용한 긴급 데이터 전송 방법 및 성능 분석 (Expediting Data through Erasure Coding in Networks with High Coefficient of Variation of Transfer Time)

  • 이구연;이용
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권2호
    • /
    • pp.137-145
    • /
    • 2014
  • 본 논문에서는 전송시간의 변화가 큰 네트워크 환경에서 이레이저 코딩을 이용한 종단간, M개의 패킷으로 구성된 긴급 메시지의 전달 지연 단축 기법을 제안한다. 제안된 기법에서는 전송할 M개의 긴급 패킷들을 g개의 패킷으로 구성된 b개의 그룹으로 분할하고, 각 그룹에 대하여 r개의 리던던시 패킷이 추가된 이레이저 코딩을 수행한 후 전송한다. 각 그룹은 g+r개의 패킷 중에서 g개의 패킷이 도착하면 복구가 되며, 모든 그룹이 목적지에 도착하면, 전체의 긴급 메시지가 전달된다. 이레이저 코딩을 적용하게 되면 전달 지연은 단축이 되나, 추가적인 패킷 전송 및 코딩과 디코딩과정으로 인한 비용이 발생하게 되므로, 이러한 추가적인 전송비용을 고려하여 제안 기법의 최적 그룹 수 및 리던던시 패킷의 수에 대한 분석을 수행한다. 분석 결과로부터 제안된 기법은 전송시간의 변화가 큰 네트워크에서 큰 효과를 내며, 특히 긴급한 메시지의 전송이 필요할 때 유용함을 알 수 있다.

A Disk-based Archival Storage System Using the EOS Erasure Coding Implementation for the ALICE Experiment at the CERN LHC

  • Ahn, Sang Un;Betev, Latchezar;Bonfillou, Eric;Han, Heejune;Kim, Jeongheon;Lee, Seung Hee;Panzer-Steindel, Bernd;Peters, Andreas-Joachim;Yoon, Heejun
    • Journal of Information Science Theory and Practice
    • /
    • 제10권spc호
    • /
    • pp.56-65
    • /
    • 2022
  • Korea Institute of Science and Technology Information (KISTI) is a Worldwide LHC Computing Grid (WLCG) Tier-1 center mandated to preserve raw data produced from A Large Ion Collider Experiment (ALICE) experiment using the world's largest particle accelerator, the Large Hadron Collider (LHC) at European Organization for Nuclear Research (CERN). Physical medium used widely for long-term data preservation is tape, thanks to its reliability and least price per capacity compared to other media such as optical disk, hard disk, and solid-state disk. However, decreasing numbers of manufacturers for both tape drives and cartridges, and patent disputes among them escalated risk of market. As alternative to tape-based data preservation strategy, we proposed disk-only erasure-coded archival storage system, Custodial Disk Storage (CDS), powered by Exascale Open Storage (EOS), an open-source storage management software developed by CERN. CDS system consists of 18 high density Just-Bunch-Of-Disks (JBOD) enclosures attached to 9 servers through 12 Gbps Serial Attached SCSI (SAS) Host Bus Adapter (HBA) interfaces via multiple paths for redundancy and multiplexing. For data protection, we introduced Reed-Solomon (RS) (16, 4) Erasure Coding (EC) layout, where the number of data and parity blocks are 12 and 4 respectively, which gives the annual data loss probability equivalent to 5×10-14. In this paper, we discuss CDS system design based on JBOD products, performance limitations, and data protection strategy accommodating EOS EC implementation. We present CDS operations for ALICE experiment and long-term power consumption measurement.

분산 파일시스템의 소거 코딩 구현 및 성능 비교 (Implementation and Performance Measuring of Erasure Coding of Distributed File System)

  • 김재열;김영철;김동오;김홍연;김영균;서대화
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1515-1527
    • /
    • 2016
  • 최근의 빅데이터, 머신러닝, 클라우드 컴퓨팅 분야의 성장에 따라 대용량의 비정형 데이터를 저장할 수 있는 스토리지의 중요성은 날로 커지고 있다. 이에 따라 MAHA-FS, GlusterFS, Ceph 등의 개방형 하드웨어 기반의 분산 파일시스템 기술이 많은 주목을 받고 있다. 이러한 저비용 분산 파일시스템들은 데이터의 내결함성을 보장하기 위하여 초기에 복제 방식을 사용하였으나, 스토리지의 용량이 커질수록 복제 방식이 가지는 스토리지 공간의 저효율성이 점차 부각되면서 이를 보완하려는 방향으로 연구가 진행되고 있다. 본 논문은 복제방식을 대체하여 스토리지 공간 효율성을 향상시킬 수 있는 소거코딩 기법을 MAHA-FS 분산 파일시스템에 적용하여 스토리지의 효율성을 높이고, 소거코딩 지원에 따라 발생하는 데이터 일관성 문제를 해결하는 효율적인 방식으로 VDelta 기법을 제안하고 적용하였다. 본 논문은 MAHA-FS와 GlusterFS의 소거코딩의 구조적 차이점을 기술하고 두 파일시스템의 성능을 비교하여 MAHA-FS의 소거코딩 성능이 GlusterFS에 비해 우수함을 확인하였다.

다양한 도움 노드의 수를 가지는 재생 부호의 설계 (The Design of Regenerating Codes with a Varying Number of Helper Nodes)

  • 이혁;이정우
    • 한국통신학회논문지
    • /
    • 제41권12호
    • /
    • pp.1684-1691
    • /
    • 2016
  • 최근 분산 저장 시스템에 erasure code를 활용하여 저장소 효율성을 높이려는 연구가 활발히 진행되고 있다. 재생 부호(regenerating codes)는 erasure code의 일종으로, 높은 저장소 효율성과 네트워크 효율성을 가지는 코드이다. (n,k,d)-재생 부호는 n개의 저장소 노드를 가지며, 손실된 노드가 발생하였을 때, 해당 노드는 d개의 살아남은 노드로부터 정보를 다운로드받아 복구될 수 있다. 하지만 일반적인 재생 부호는 노드 복구 시 정확히 d개의 도움 노드들을 사용해야 하며, 노드 손실이 빈번하거나, 노드 간 접속이 불안정한 환경에서, d개 이하의 노드들에만 접속 가능할 경우에 유연하게 대처할 수 없다. 본 논문에서는 약간의 복구 대역폭의 희생을 통하여, $$k{\leq_-}{\bar{d}}{\leq_-}d$$의 다양한 도움 노드의 수 ${\bar{d}}$개로 노드를 복구할 수 있는 유연한 코드 운용 방식을 제안하였다.

Practical Schemes for Tunable Secure Network Coding

  • Liu, Guangjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권3호
    • /
    • pp.1193-1209
    • /
    • 2015
  • Network coding is promising to maximize network throughput and improve the resilience to random network failures in various networking systems. In this paper, the problem of providing efficient confidentiality for practical network coding system against a global eavesdropper (with full eavesdropping capabilities to the network) is considered. By exploiting a novel combination between the construction technique of systematic Maximum Distance Separable (MDS) erasure coding and traditional cryptographic approach, two efficient schemes are proposed that can achieve the maximum possible rate and minimum encryption overhead respectively on top of any communication network or underlying linear network code. Every generation is first subjected to an encoding by a particular matrix generated by two (or three) Vandermonde matrices, and then parts of coded vectors (or secret symbols) are encrypted before transmitting. The proposed schemes are characterized by tunable and measurable degrees of security and also shown to be of low overhead in computation and bandwidth.

토러스 연결망 기반의 대용량 멀티미디어용 분산 스토리지 시스템 (Torus Network Based Distributed Storage System for Massive Multimedia Contents)

  • 김재열;김동오;김홍연;김영균;서대화
    • 한국멀티미디어학회논문지
    • /
    • 제19권8호
    • /
    • pp.1487-1497
    • /
    • 2016
  • Explosively growing service of digital multimedia data increases the need for highly scalable low-cost storage. This paper proposes the new storage architecture based on torus network which does not need network switch and erasure coding for efficient storage usage for high scalability and efficient disk utilization. The proposed model has to compensate for the disadvantage of long network latency and network processing overhead of torus network. The proposed storage model was compared to two most popular distributed file system, GlusterFS and Ceph distributed file systems through a prototype implementation. The performance of prototype system shows outstanding results than erasure coding policy of two file systems and mostly even better results than replication policy of them.

A Simple Coded ARQ for Satellite Broadcasting

  • Liva, Gianluigi;Kissling, Christian;Hausl, Christoph
    • Journal of Communications and Networks
    • /
    • 제12권6호
    • /
    • pp.577-581
    • /
    • 2010
  • We introduce a novel packet retransmission technique which improves the efficiency of automatic retransmission query (ARQ) protocols in the context of satellite broadcast/multicast systems. The proposed coded ARQ technique, similarly to fountain coding, performs transmission of redundant packets, which are made by linear combinations of the packets composing the source block. Differently from fountain codes, the packets for the linear combinations are selected on the basis of the retransmission requests coming from the user terminals. The selection is performed in a way that, at the terminals, the source packets can be recovered iteratively by means of simple back-substitutions. This work aims at providing a simple and efficient alternative to reliable multicast protocols based on erasure correction coding techniques.

신뢰성 향상과 성능개선을 위해 다양한 Erasure 코드를 적용한 SSD 기반 RAID-6 시스템 구조 (SSD-based RAID-6 System Architecture for Reliability and Performance Enhancement)

  • 송재석;허준무;양유석;김덕환
    • 전자공학회논문지CI
    • /
    • 제47권6호
    • /
    • pp.47-56
    • /
    • 2010
  • 전통적인 대용량 스토리지 시스템을 위해 하드디스크 기반의 RAID 시스템이 사용되고 있다. 그러나 하드디스크 기반의 RAID 시스템은 외부의 충격에 약하기 때문에 데이터의 신뢰성이 낮고 스핀들 모터의 빈번한 동작으로 인해 전력소모가 많다. 따라서 본 논문에서는 하드디스크를 대체하여 다양한 Erasure 코드를 적용한 SSD 기반 RAID-6 시스템을 제안한다. 제안된 방법으로 Reed-Solomon, EVENODD, Liberation 코딩 기법을 파일시스템 레벨과 디바이스 드라이버 레벨에 각각 적용하였다. 그리고 SSD의 수명저하에 미치는 영향을 최소화하기 위하여 데이터 할당 기법을 적용하였다. 제안된 Erasure 코드가 적용된 RAID-6 시스템에 HDD 와 SSD 를 사용하여 실험한 결과 Liberation 코드가 다른 코드에 비해 SSD 수명저하에 영향을 적게 끼침을 파악하였으며, Erasure 코드들을 파일시스템 레벨에 적용 하였을 경우보다 디바이스 드라이버 레벨에 적용하였을 때 성능이 더 높았다. 또한 HDD를 기반으로 사용하였을 경우 보다 SSD 를 기반으로 사용하였을 경우에 입출력 성능이 4.5%~8.5% 더 향상 되었고 전력소모는 18%~40% 절감되었다.

Decoding of LT-Like Codes in the Absence of Degree-One Code Symbols

  • Abdulkhaleq, Nadhir I.;Gazi, Orhan
    • ETRI Journal
    • /
    • 제38권5호
    • /
    • pp.896-902
    • /
    • 2016
  • Luby transform (LT) codes were the first practical rateless erasure codes proposed in the literature. The performances of these codes, which are iteratively decoded using belief propagation algorithms, depend on the degree distribution used to generate the coded symbols. The existence of degree-one coded symbols is essential for the starting and continuation of the decoding process. The absence of a degree-one coded symbol at any instant of an iterative decoding operation results in decoding failure. To alleviate this problem, we proposed a method used in the absence of a degree-one code symbol to overcome a stuck decoding operation and its continuation. The simulation results show that the proposed approach provides a better performance than a conventional LT code and memory-based robust soliton distributed LT code, as well as that of a Gaussian elimination assisted LT code, particularly for short data lengths.