• 제목/요약/키워드: heterogeneous distributed storage systems

검색결과 10건 처리시간 0.024초

Optimal Heterogeneous Distributed Storage Regenerating Code at Minimum Remote-Repair Bandwidth Regenerating Point

  • Xu, Jian;Cao, Yewen;Wang, Deqiang;Wu, Changlei;Yang, Guang
    • ETRI Journal
    • /
    • 제38권3호
    • /
    • pp.529-539
    • /
    • 2016
  • Recently, a product-matrix (PM) framework was proposed to construct optimal regenerating codes for homogeneous distributed storage systems (DSSs). In this paper, we propose an extended PM (EPM) framework for coding of heterogeneous DSSs having different repair bandwidths but identical storage capacities. Based on the EPM framework, an explicit construction of minimum remote-repair bandwidth regenerating (MRBR) codes is presented for a specific heterogeneous DSS, where two geographically different datacenters with associated storage nodes are deployed. The data reconstruction and regeneration properties of the MRBR code are proved strictly. For the purpose of demonstration, an example implementation of MRBR code is provided. The presented MRBR code is the first optimal strict-regenerating code for heterogeneous DSSs. In addition, our proposed EPM framework can be applied to homogeneous systems also.

Adaptive-and-Resolvable Fractional Repetition Codes Based on Hypergraph

  • Tiantian Wang;Jing Wang;Haipeng Wang;Jie Meng;Chunlei Yu;Shuxia Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권4호
    • /
    • pp.1182-1199
    • /
    • 2023
  • Fractional repetition (FR) codes can achieve exact uncoded repair for multiple failed nodes, with lower computational complexity and bandwidth overhead, and effectively improve repair performance in distributed storage systems (DSS). The actual distributed storage system is dynamic, that is, the parameters such as node storage overhead and number of storage nodes will change randomly and dynamically. Considering that traditional FR codes cannot be flexibly applied to dynamic distributed storage systems, a new construction scheme of adaptive-and-resolvable FR codes based on hypergraph coloring is proposed in this paper. Specifically, the linear uniform regular hypergraph can be constructed based on the heuristic algorithm of hypergraph coloring proposed in this paper. Then edges and vertices in hypergraph correspond to nodes and coded packets of FR codes respectively, further, FR codes is constructed. According to hypergraph coloring, the FR codes can achieve rapid repair for multiple failed nodes. Further, FR codes based on hypergraph coloring can be generalized to heterogeneous distributed storage systems. Compared with Reed-Solomon (RS) codes, simple regenerating codes (SRC) and locally repairable codes (LRC), adaptive-and-resolvable FR codes have significant advantages over repair locality, repair bandwidth overhead, computational complexity and time overhead during repairing failed nodes.

에너지 및 성능 효율적인 이종 모바일 저장 장치용 동적 부하 분산 (Energy and Performance-Efficient Dynamic Load Distribution for Mobile Heterogeneous Storage Devices)

  • 김영진;김지홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.9-17
    • /
    • 2009
  • 본 논문에서는 운영체제 수준에서 에너지 절감과 함께 I/O 성능 개선을 목적으로 하여 소형 하드 디스크와 플래시 메모리를 이종의 저장 장치로 가지는 모바일 시스템에 대해 동적 부하 분산 기법을 제안한다. 제안 기법은 부하가 에너지 및 성능 효율적인 방법으로 하드디스크와 플래시 메모리의 이종성의 저장 장치 구성에 대해서 어떻게 효율적으로 분산될 수 있을 것인지를 발견하기 위하여 파일 배치 기법과 버퍼 캐시 관리 기법을 결합하는 접근법을 취한다. 제안한 기법은 폭넓은 시뮬레이션을 통해서 기존의 기법들과 비교하여 이종의 모바일 저장장치들에 대해서 더 개선된 실험 결과를 보이는 것으로 나타났다.

RDP: A storage-tier-aware Robust Data Placement strategy for Hadoop in a Cloud-based Heterogeneous Environment

  • Muhammad Faseeh Qureshi, Nawab;Shin, Dong Ryeol
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권9호
    • /
    • pp.4063-4086
    • /
    • 2016
  • Cloud computing is a robust technology, which facilitate to resolve many parallel distributed computing issues in the modern Big Data environment. Hadoop is an ecosystem, which process large data-sets in distributed computing environment. The HDFS is a filesystem of Hadoop, which process data blocks to the cluster nodes. The data block placement has become a bottleneck to overall performance in a Hadoop cluster. The current placement policy assumes that, all Datanodes have equal computing capacity to process data blocks. This computing capacity includes availability of same storage media and same processing performances of a node. As a result, Hadoop cluster performance gets effected with unbalanced workloads, inefficient storage-tier, network traffic congestion and HDFS integrity issues. This paper proposes a storage-tier-aware Robust Data Placement (RDP) scheme, which systematically resolves unbalanced workloads, reduces network congestion to an optimal state, utilizes storage-tier in a useful manner and minimizes the HDFS integrity issues. The experimental results show that the proposed approach reduced unbalanced workload issue to 72%. Moreover, the presented approach resolve storage-tier compatibility problem to 81% by predicting storage for block jobs and improved overall data block placement by 78% through pre-calculated computing capacity allocations and execution of map files over respective Namenode and Datanodes.

유비쿼터스 학습(u-Learning)을 위한 미디에이터 기반의 분산정보 활용방법 (A Practical Method of a Distributed Information Resources Based on a Mediator for the u-Learning Environment)

  • 주길홍
    • 정보교육학회논문지
    • /
    • 제9권1호
    • /
    • pp.79-86
    • /
    • 2005
  • 컴퓨터와 통신 기술이 발전함에 따라 네트워크를 통한 일반 사용자들의 컴퓨터 활용 빈도와 요구하는 데이터의 양이 급격히 증가되었다. 이에 따라 최근의 교육 시스템들은 정보의 활용성을 향상시키기 위하여 이질적인 시스템들을 의미상으로 연결하고 있다. 따라서 최근의 웹 기반 교수-학습은 학습자 스스로 학습 내용, 학습 시간 및 학습 순서를 선택하고 조직하는 유비쿼터스 학습방향으로 나아가고 있다. 즉, 학습자 개개인의 특성(선수 지식, 학습 양식, 흥미, 관심)에 맞는 적응적인 교수-학습 환경을 제공하는 방향으로 변화되고 있다. 본 논문은 유비쿼터스 학습 환경에서 다양한 분산정보의 통합을 위하여 사용자들이 요구하는 학습내용을 각 지역서버의 자치성을 유지하면서 효과적으로 학습하기 위한 미디에이터내의 처리방법에 대해 제안한다. 또한 과거와 최근의 학습내용의 활용형태가 다양하게 변할 수 있으므로 시간에 따른 감쇄율을 활용빈도에 적용하여 최근의 활용빈도의 변화에 민감하게 반응하고 활용형태의 변화에 따라 적응적으로 학습내용을 사용할 수 있는 방법을 제안한다.

  • PDF

지능적 계산법을 이용한 분산적 P2P 오버레이 멀티케스트 네트워크 구성 기법 (A Distributed Method for Constructing a P2P Overlay Multicast Network using Computational Intelligence)

  • 박재성
    • 한국ITS학회 논문지
    • /
    • 제11권6호
    • /
    • pp.95-102
    • /
    • 2012
  • 본 논문에서는 지능적 계산법인 개미-군집 이론을 응용한 분산적 피어 선택을 통해 통신 대역폭, 데이터 처리 능력 및 저장 용량이 상이한 피어들로 구성된 P2P 오버레이 멀티케스트 네트워크를 효율적으로 구성할 수 있는 방안을 제안한다. 제안 기법은 피어의 용량뿐만 아니라 피어가 서비스하고 있는 자식 노드의 수 및 멀티케스트 소스와 피어 사이의 거리를 고려하여 부모 피어를 선택한다. 따라서 제안기법은 멀티케스트 소스와 피어 사이의 거리를 작게 유지한다는 측면에서 효율적인 네트워크 구성을 가능하게 한다. 또한 제안기법은 특정 서버가 참여 노드의 상태 정보를 이용하는 기존의 중앙집중적 방식에 비해 각 피어들의 로컬 정보를 이용하는 분산적 방식이므로, 참여 노드의 수에 따른 확장성이 우수하다. 모의실험을 통해 제안 기법은 소수의 대용량 피어가 다수의 소용량 피어를 지원함으로써 수천개의 피어가 오버레이 네트워크에 참여하더라도 오버레이 네트워크의 크기를 작게 유지할 수 있다는 것을 보였다.

클라우드 환경에서 데이터 통합 관리를 위한 TMDM (TMDM for Data Integration Management in Cloud Environment)

  • 문석재;신효영;정계동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.970-973
    • /
    • 2012
  • 클라우드 환경에서 기업들은 상호 연결되지 않은 여러 개의 시스템과 데이터베이스에 각각 마스터 정보를 분산 저장하여 사용하고 있다. 관리되지 않은 마스터 정보는 부정확하고, 상호 불일치하기에 비즈니스 프로세스의 효율성을 저하시키고, 최적의 의사결정을 할 수가 없게된다. 효율적이고 오류 없는 비즈니스 프로세스 운용을 위해서는 고품질의 마스터 정보의 관리가 필요하다. 본 논문은 클라우드 환경에서 상호 연계되는 마스터 정보 간의 발생하는 이질적인 문제를 해결하고, 비즈니스 프로세스를 효율적으로 운용하기 위한 방안으로 TMDM(Topic Maps Master Data Management)을 제안한다. TMDM는 데이터 간의 연관성을 고려한 Topic Maps를 이용하여 마스터 정보 간의 상호 불일치 문제를 해결하기 위해 제안된 지식 저장소이다. Topic Maps는 하나의 토픽을 통해 토픽이 표현하는 주제에 관련된 모든 지식 정보를 접근할 수 있도록 토픽간의 association을 통해 연결할 수 있다. 이러한 점은 클라우드 내에서 레거시 시스템 간 마스터 정보에도 적용할 수 있다.

  • PDF

이질적인 공간정보시스템의 상호 운용성을 위한 효과적인 지리데이터의 GML 사상 (Efficient Publishing Spatial Information as GML for Interoperability of Heterogeneous Spatial Database Systems)

  • 정원일;배해영
    • 한국멀티미디어학회논문지
    • /
    • 제7권1호
    • /
    • pp.12-26
    • /
    • 2004
  • 과거 지리정보시스템은 고유의 독립적인 형식으로 지리 정보를 구축하여 서비스를 제공하여 왔으며, 최근에는 기존의 이질적인 지리정보시스템간의 다양한 지리 정보를 효율적으로 활용하기 위해 지리정보시스템에서의 상호 운용성 제공이 요구되고 있다. 이에 OGC(Open GIS Consortium)에서는 분산 환경에서 이질적인 지리정보시스템들간의 상호 운용성을 제공하기 위해 GML(Geography Markup Language)을 제안하였다. GML은 XML(extensible Markup Language)을 기반으로 공간 정보와 비 공간 정보를 포함하는 지리정보를 저장하고 전송하기 위한 인코딩 방법에 대한 명세를 제공하고 있다. 또한, GML은 웹 환경에서 맵 서버를 통해 지리 정보를 서비스하기 위한 인터페이스의 구현에 관한 명세를 포함하고 있다. 이에 GML 문서에서의 지리 정보와 기존의 지리정보시스템들이 가지는 지리정보간의 호환을 위한 연구가 활발히 진행되고 있다. 본 논문에서는 이질적인 지리 정보들의 상호 운용성을 제공하기 위해 GML 문서와 지리정보시스템간의 지리 정보를 사상시키는 기법을 제안한다. 이를 위해 기존의 지리정보시스템의 지리 정보를 GML 문서로 표현하는 방법과 GML 문서에 나타나는 지리 정보를 공간데이터베이스로 구축하는 방법에 대해 기술한다. 제안된 지리 정보 사상 기법을 통해 기 구축된 지리 정보간의 상호 운용성을 제공하여 웹 기반의 통합된 지리 정보서비스를 위한 프레임워크로 제공될 수 있다.

  • PDF

미디에이터 시스템의 적응적 구체화 질의 선택방법 (An Adaptive Materialized Query Selection Method in a Mediator System)

  • 주길홍;이원석
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.83-94
    • /
    • 2004
  • 다양한 분산정보의 통합을 위하여 전역 사용자들이 요구하는 데이터들을 지역서버의 자치성을 유지하면서 효과적으로 제공하기 위한 미디 에이터 시스템의 연구가 활발하게 진행되고 있다. 그러나, 미디에이터에서의 전역질의를 효율적으로 처리하기 위한 방법의 연구는 상대적으로 매우 미흡한 실정이다. 미디에이터에서 전역질의는 원격지서버의 질의처리 단위인 부분질의의 집합으로 표현되어진다. 따라서, 미디에이터가 부분질의의 결과를 구체화방법으로 관리한다면 관련된 질의의 결과를 사용자에게 신속하게 제공할 수 있다. 그러나, 미디에이터에서는 통합 스키마의 변경이 자유롭고, 사용자의 질의가 자주 변할 수 있기 때문에 최적의 구체화부분질의를 결정하기 위해서 전역질의의 빈발정도를 지속적으로 파악해야 한다. 따라서, 부분질의의 수가 증가할수록 최적화의 수행시간이 매우 길어지기 때문에 부분질의 빈도의 최근의 변화를 적절하게 반영하지 못한다. 따라서 본 논문에서는 미디에이터 시스템의 저장공간의 활용율을 극대화하는 최적의 구체화부분질의 군을 선택하는 방법을 제안한다. 또한 과거와 최근의 부분질의의 활용형태가 다양하게 변할 수 있으므로 시간에 따른 감쇄율을 활용빈도에 적용하여 최근의 활용빈도의 변화에 민감하게 반응하고 활용형태의 변화에 따라 적응적으로 새로운 구체화부분질의 군을 선택할 수 있는 방법을 제안한다.

IoT에서 효율적인 서비스 제공을 위한 이름 기반 서비스 탐색 메커니즘 (A Name-based Service Discovering Mechanism for Efficient Service Delivery in IoT)

  • 조국현;김정재;류민우;차시호
    • 한국산학기술학회논문지
    • /
    • 제19권6호
    • /
    • pp.46-54
    • /
    • 2018
  • IoT는 다양한 디바이스들이 통신을 통해 사용자에게 서비스를 제공하는 환경이다. IoT의 특성으로 인해 데이터들은 이종간의 정보시스템에 분산되어 저장된다. 이러한 상황에서 IoT 엔드 애플리케이션은 데이터가 어디에 있는지 또는 스토리지의 형태가 어떠한지 알 수 없어도 데이터를 액세스할 수 있어야 한다. 이러한 메커니즘을 SD(Service Discovery)라고 한다. 그러나 현재까지의 SD 구조는 물리적 디바이스를 중심으로 탐색하기 때문에 몇 가지 문제점이 발생한다. 첫째, 물리적 위치에 따른 서비스 탐색으로 인해 반환시간이 증대된다. 둘째, 디바이스와 서비스를 따로 관리하는 데이터 구조가 요구된다. 이는 관리자의 서비스 구성복잡도를 증가시킨다. 이로 인해 디바이스 중심의 SD 구조는 실제 IoT에 적용하기에는 적합하지 않은 구조로 되어 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 NSSD(Name-based Service Centric Service Discovery)라는 SD 구조를 제안한다. NSSD는 이름 기반의 중앙집중형 SD를 제공하며 IoT 에지 게이트웨이를 캐싱 서버로 사용해 서비스 탐색속도를 향상시킨다. 기존의 DNS와 DHT 기반 DS 구조와의 시뮬레이션을 통해 NSSD가 평균 반환시간에 있어 약 2배 정도 향상된 성능을 제공함을 입증하였다.