• Title/Summary/Keyword: File Cluster

Search Result 114, Processing Time 0.026 seconds

Parallel Processing of k-Means Clustering Algorithm for Unsupervised Classification of Large Satellite Images: A Hybrid Method Using Multicores and a PC-Cluster (대용량 위성영상의 무감독 분류를 위한 k-Means Clustering 알고리즘의 병렬처리: 다중코어와 PC-Cluster를 이용한 Hybrid 방식)

  • Han, Soohee;Song, Jeong Heon
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.37 no.6
    • /
    • pp.445-452
    • /
    • 2019
  • In this study, parallel processing codes of k-means clustering algorithm were developed and implemented in a PC-cluster for unsupervised classification of large satellite images. We implemented intra-node code using multicores of CPU (Central Processing Unit) based on OpenMP (Open Multi-Processing), inter-nodes code using a PC-cluster based on message passing interface, and hybrid code using both. The PC-cluster consists of one master node and eight slave nodes, and each node is equipped with eight multicores. Two operating systems, Microsoft Windows and Canonical Ubuntu, were installed in the PC-cluster in turn and tested to compare parallel processing performance. Two multispectral satellite images were tested, which are a medium-capacity LANDSAT 8 OLI (Operational Land Imager) image and a high-capacity Sentinel 2A image. To evaluate the performance of parallel processing, speedup and efficiency were measured. Overall, the speedup was over N / 2 and the efficiency was over 0.5. From the comparison of the two operating systems, the Ubuntu system showed two to three times faster performance. To confirm that the results of the sequential and parallel processing coincide with the other, the center value of each band and the number of classified pixels were compared, and result images were examined by pixel to pixel comparison. It was found that care should be taken to avoid false sharing of OpenMP in intra-node implementation. To process large satellite images in a PC-cluster, code and hardware should be designed to reduce performance degradation caused by file I / O. Also, it was found that performance can differ depending on the operating system installed in a PC-cluster.

Elemental Correlations of Chemical Compositions in Co-rich Mn-crusts of the Republic of Marshall Islands (마샬공화국 고코발트망간각 화학조성의 원소 상관관계)

  • 황의덕;장세원;김두영
    • Journal of the Mineralogical Society of Korea
    • /
    • v.12 no.2
    • /
    • pp.77-90
    • /
    • 1999
  • Characteristics and variations of chemical compositions in Co-rich crusts occurred in the EEZ of the Republic of Marshall Islands were reviewed. Correlation coefficient analysis, hierarchical cluster analysis, and Q-mode factor analysis for 62 samples were done in this study. All data were selected and gathered from the open file report of the cooperative cruise done by United States Geological Survey with Scripps Institute of Oceanography, University of Hawaii or Korea Ocean Research Development Institute. The average of crust thickness. Co content, and Ni content of 62 samples from the 21 seamounts were 30mm, 0.58 wt% and 0.40%, respectively. The mineral phases and associated elements assigned by correlation coefficients, cluster analysis and Q-mode factor analysis are following four. 1) CFA: P, Ca, CO2, Y, Sr: 2) Mn-oxide mineral: As, Mn, Co, Na: 3) Al-silicate mineral: Pd,Si, Al, Cu, Fe: 4) PGE-bearing mineral: Rh, Pt, Ir.

  • PDF

Design and Implementation of The Communication Module for a Linux Cluster File System (리눅스 클러스터 파일 시스템을 위한 통신모듈의 설계 및 구현)

  • 박의수;유찬곤;손호신;최현호;김형식;유관종
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.649-651
    • /
    • 2002
  • 클러스터 파일 시스템은 기존의 클러스터링 기술을 파일 시스템에 적용하여, 각 노드 단위로 파일 시스템을 구성할 때 발생되는 저장 공간과 대역폭의 제약문제를 극복하기 위한 방법이다. 클러스터 파일 시스템은 하나의 원본 파일을 여러 노드에 나누어 저장하므로, 효율적인 노드간 데이터 통신을 필요로 하며, 노드 내부에서도 클러스터 파일 시스템과 어플리케이션과의 전용 데이터 교환 메커니즘을 지원해야 한다. 본 논문에서는 클러스터 파일 시스템이 안정적이고 효율적인 방법으로 멀티미디어 데이터를 분산 저장하기 위하여 필요한 통신 모듈을 설계 및 구현한다.

  • PDF

Design and Implementation of Consistency Check Program for Storage Area Network Based Cluster File System (SAN기반 클러스터 파일 시스템의 일관성 검증을 위한 검사 프로그램의 설계 및 구현)

  • 백주현;박성용;이장선;오상규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 기존 파일 시스템의 일관성 검사 프로그램 및 클러스터 파일 시스템의 특징 분석을 통해 클러스터 파일 시스템의 일관성을 검사하는데 필요한 프로그램 설계 요소 및 구현 방법에 관해 논한다. 나아가 이러한 설계 방법에 따라 구현된 프로그램을 실제 상용화된 클러스터 파일 시스템에 적용함으로써 검사 프로그램의 기능을 검증한다 이를 위해 뮤테이션 테스트(Mutation Test) 기법을 도입하여 일관성 검사 프로그램의 신뢰성 검증 방법을 고찰하고 그에 따른 테스트 결과를 살펴본다.

  • PDF

Cluster Sizing for Embedded Audio File Systems (임베디드 오디오 파일시스템의 클러스터 크기 연구)

  • Lim, Chang-Kyu;Lee, In-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.1523-1526
    • /
    • 2005
  • 본 논문에서는 현실 세계에서 사용되고 있는 디지털 오디오 파일들을 사용하여 전통적인 파일시스템에서의 클러스터 크기들이 파일시스템의 입출력 처리시간 및 공간 사용률 등의 성능 요소에 미치는 영향들을 분석하고 이를 디지털 오디오 파일의 특성에 맞게 개선함으로써, 임베디드 오디오 파일시스템의 클러스터 크기에 관한 개선된 디자인을 제시하고자 한다.

  • PDF

Failure Detection in the Linux Cluster File System $SANique^{TM}$ (리눅스 클러스터 화일 시스템 $SANique^{TM}$의 오류 탐지 기법)

  • 임화정;이규웅;이장선;오상규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.37-39
    • /
    • 2002
  • 본 논문은 SAN(storage area network)강에 네트워크-부착형 (network-attached) 저장 장치들을 직접 연결하여 화일 서버 없이 직접 데이터 전송이 가능한 SAN 기반의 리눅스 클러스터 공유 화일 시스템인 SANique$^{TM}$의 오류 탐지 기법 및 회복 기법에 대하여 기술한다. 클러스터 내의 노드 오류에 의해 발생하는 "split-brain"오류 상황 및 문제점을 공유 화일 시스템 환경 하에서 성의하고, 이 문제를 해결할 수 있는 오류 탐지기법을 제시한다.

  • PDF

Trends of Cluster File Systems Technology (클러스터 파일 시스템 기술 동향)

  • Kim, Y.C.;Park, K.T.;Lee, S.M.;Kim, H.Y.;Kim, Y.K.
    • Electronics and Telecommunications Trends
    • /
    • v.22 no.6
    • /
    • pp.139-149
    • /
    • 2007
  • 최근에 블로그, UCC, IPTV 등 사용자 중심의 인터넷 서비스와 언제 어디서나 웹을 통해 서비스를 받을 수 있는 유비쿼터스 컴퓨팅 환경으로의 변화는 대용량 저장 공간과 빠르고 안정된 서비스를 제공할 수 있는 대규모 클러스터 시스템 플랫폼을 필요로 한다. 그리고 이러한 대규모 클러스터 시스템 플랫폼을 효율적으로 관리하고 이용할 수 있는 클러스터 파일 시스템은 필수적이다. 본 고에서는 최근에 연구 개발되고 있는 클러스터 파일 시스템들을 소개하고 기술 동향에 대해 살펴본다.

Design and Implementation of Inline Data Deduplication in Cluster File System (클러스터 파일 시스템에서 인라인 데이터 중복제거 설계 및 구현)

  • Kim, Youngchul;Kim, Cheiyol;Lee, Sangmin;Kim, Youngkyun
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.8
    • /
    • pp.369-374
    • /
    • 2016
  • The growing demand of virtual computing and storage resources in the cloud computing environment has led to deduplication of storage system for effective reduction and utilization of storage space. In particular, large reduction in the storage space is made possible by preventing data with identical content as the virtual desktop images from being stored on the virtual desktop infrastructure. However, in order to provide reliable support of virtual desktop services, the storage system must address a variety of workloads by virtual desktop, such as performance overhead due to deduplication, periodic data I/O storms and frequent random I/O operations. In this paper, we designed and implemented a clustered file system to support virtual desktop and storage services in cloud computing environment. The proposed clustered file system provides low storage consumption by means of inline deduplication on virtual desktop images. In addition, it reduces performance overhead by deduplication process in the data server and not the virtual host on which virtual desktops are running.

A Genetic-Based Optimization Model for Clustered Node Allocation System in a Distributed Environment (분산 환경에서 클러스터 노드 할당 시스템을 위한 유전자 기반 최적화 모델)

  • Park, Kyeong-mo
    • The KIPS Transactions:PartA
    • /
    • v.10A no.1
    • /
    • pp.15-24
    • /
    • 2003
  • In this paper, an optimization model for the clustered node allocation systems in the distributed computing environment is presented. In the presented model with a distributed file system framework, the dynamics of system behavior over times is carefully thought over the nodes and hence the functionality of the cluster monitor node to check the feasibility of the current set of clustered node allocation is given. The cluster monitor node of the node allocation system capable of distributing the parallel modules to clustered nodes provides a good allocation solution using Genetic Algorithms (GA). As a part of the experimental studies, the solution quality and computation time effects of varying GA experimental parameters, such as the encoding scheme, the genetic operators (crossover, mutations), the population size, and the number of node modules, and the comparative findings are presented.

BeanFS: A Distributed File System for Large-scale E-mail Services (BeanFS: 대규모 이메일 서비스를 위한 분산 파일 시스템)

  • Jung, Wook;Lee, Dae-Woo;Park, Eun-Ji;Lee, Young-Jae;Kim, Sang-Hoon;Kim, Jin-Soo;Kim, Tae-Woong;Jun, Sung-Won
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.36 no.4
    • /
    • pp.247-258
    • /
    • 2009
  • Distributed file systems running on a cluster of inexpensive commodity hardware are being recognized as an effective solution to support the explosive growth of storage demand in large-scale Internet service companies. This paper presents the design and implementation of BeanFS, a distributed file system for large-scale e-mail services. BeanFS is adapted to e-mail services as follows. First, the volume-based replication scheme alleviates the metadata management overhead of the central metadata server in dealing with a very large number of small files. Second, BeanFS employs a light-weighted consistency maintenance protocol tailored to simple access patterns of e-mail message. Third, transient and permanent failures are treated separately and recovering from transient failures is done quickly and has less overhead.