• 제목/요약/키워드: File system

검색결과 2,273건 처리시간 0.038초

하둡 플랫폼을 이용한 대량의 스몰파일 처리방법 (Processing Method of Mass Small File Using Hadoop Platform)

  • 김창복;정재필
    • 한국항행학회논문지
    • /
    • 제18권4호
    • /
    • pp.401-408
    • /
    • 2014
  • 하둡(Hadoop)은 맵리듀스(MapReduce) 분산처리 프로그래밍 모델과 HDFS(Hadoop distributed file system) 분산 파일시스템으로 구성된다. 하둡은 빅데이터 처리에 적합한 프레임워크로서, 대량의 스몰파일 처리에 문제점이 있다. 하둡에서 대량의 스몰파일 처리는 하나의 파일마다 매퍼가 생성되며, 파일의 메타정보를 저장하기 위해 많은 메모리가 필요한 문제점이 있다. 본 논문은 하둡 플랫폼에서 다양한 방법으로 대량의 스몰파일 처리방법을 비교 검토하였다. 일반 압축은 데이터의 크기와 상관없이 하나의 매퍼로 처리해야 하기 때문에, 하둡 처리 포맷으로 적절하지 않다. 시퀀스 와 하둡 아카이브 파일의 처리는 스몰파일을 압축 및 병합을 통해 네임노드의 메모리 문제가 제거되었다. 하둡 아카이브 파일은 스몰파일의 병합시간이 시퀀스 파일보다 빠른 속도를 보였다. CombineFileInputFormat 클래스를 이용한 처리는 병합과정이 필요 없으며, 빅데이터 처리방법과 유사한 속도를 보였다.

HFAT: Log-Based FAT File System Using Dynamic Allocation Method

  • Kim, Nam Ho;Yu, Yun Seop
    • Journal of information and communication convergence engineering
    • /
    • 제10권4호
    • /
    • pp.405-410
    • /
    • 2012
  • Several attempts have been made to add journaling capability to a traditional file allocation table (FAT) file system. However, they encountered issues such as excessive system load or instability of the journaling data itself. If journaling data is saved as a file format, it can be corrupted by a user application. However, if journaling data is saved in a fixed area such as a reserved area, the storage can be physically corrupted because of excessive system load. To solve this problem, a new method that dynamically allocates journaling data is introduced. In this method, the journaling data is not saved as a file format. Using a reserved area and reserved FAT status entry of the FAT file system specification, the journaling data can be dynamically allocated and cannot be accessed by user applications. The experimental results show that this method is more stable and scalable than other log-based FAT file systems. HFAT was tested with more than 12,000 power failures and was stable.

대형 멀티미디어 파일을 위한 파일 시스템 구현 (An Implementation of a File System for Large Multimedia File)

  • 손정수;이민석
    • Journal of Information Technology Applications and Management
    • /
    • 제10권4호
    • /
    • pp.169-183
    • /
    • 2003
  • 멀티미디어 시스템에서는 통상적으로 매우 큰 크기의 파일이 저장되고 재생된다. 이 파일들은 읽기 중심이며 재사용 가능성이 낮아 기존의 파일 시스템들이 가정하는 형태의 파일이 아니기 때문에 이런 파일이 자주 사용되는 멀티미디어 시스템의 경우 기존 파일 시스템의 성능은 그리 좋지 않다. 본 논문에서는 멀티미디어시스템을 위한 새로운 파일 시스템을 구현하였다. 성능 측정 결과 새 파일 시스템이 기존 파일 시스템인 Ext2, Ext3 보다 쓰기, 읽기, 쓰기/읽기 동시 수행에 있어서 각각 39.75% ∼ 40.67%, 36.48% ∼ 43.36%, 28.04% ∼ 32.60% 높은 성능을 나타내었다. 이 파일 시스템은 리눅스 상에서 구현되었으며 어렵지 않게 다른 운영 체제에도 적용이 가능하다.

  • PDF

XFS 파일 시스템 채택에 따른 리눅스 시스템 변화 분석 (Analysis of Linux System changes by adoption XFS File System)

  • 성경
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.497-503
    • /
    • 2018
  • 엔터프라이즈 리눅스 시장의 대표주자인 RHEL 7에서 기본 파일 시스템을 EXT에서 XFS로 변경하면서 파일 시스템의 크기, 파일 크기 등과 같이 최대 지원 사양을 대폭 증가시켰다. 단순히 지원 사양만 증가시킨 것 아니라, 데몬 기반으로 동작하면서 고용량 디스크 및 SSD(solid state drive)와 같은 고성능 디스크에서 탁월한 성능을 보이는 것으로 나타나고 있다. 파일 시스템의 변경은 관련 명령어의 변경, 백업 도구의 변경, 디스크 쿼터 설정 변경과 같은 직접적인 운영 기법의 변화를 의미한다. XFS 파일시스템의 변경은 리눅스 시스템 운영에 많은 변화를 주고 있지만 서버 분야에서 차지하는 리눅스 운영체제의 위치를 더욱 굳건히 하게 되는 계기가 될 것으로 판단된다.

파일 부분 암호화 지원을 위한 시스템 호출의 설계 및 구현에 관한 연구 (Design and Implementation of a System Call Interface for Supporting File Partial Encryption)

  • 서혜인;김은기
    • 한국정보통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.557-567
    • /
    • 2018
  • 현재 디스크에 파일을 암호화하여 저장하기 위한 다양한 파일 암호화 솔루션이 존재한다. 하지만 기존의 파일 암호화 솔루션은 암호화 및 복호화를 파일 혹은 디렉터리 단위로 일괄되게 처리한다. 본 논문에서는 파일의 부분 암호화를 지원하는 시스템 호출을 제안한다. 파일 데이터의 암호화를 원하는 부분에서 사용자는 시스템 호출 인터페이스로 암호화 정보를 설정한다. 그다음 파일 데이터를 쓰면 설정된 내용으로 데이터가 암호화되어 저장된다. 또한 복호화 정보를 설정한 뒤 파일 데이터를 읽어오면, 설정된 정보가 적용되어 필요한 부분만을 복호화 한다. 제안된 시스템 호출을 위해 검사, 관리, 암호화, 복호화, HMAC 모듈이 필요한 시스템 호출에 따라 구성되며, 이는 리눅스 환경에서 구현되었다. 또한 구현된 시스템 호출의 동작을 개발 보드에서 검증하였으며, 그 수행 속도를 측정하여 성능을 분석하였다.

STEP을 이용한 CAD 데이터 변환 시스템의 구현 (Implementation of CAD Data Translation System using STEP)

  • 이영준;고굉욱;유상봉
    • 한국CDE학회논문집
    • /
    • 제1권2호
    • /
    • pp.87-96
    • /
    • 1996
  • IGES is a file format which has gained widespread use but has certain limitations such as limited information coverage and ambiguous definitions. In order to overcome the limitations of existing neutral file formats, STEP has been developed as a more comprehensive mechanism for product data exchange by ISO. This paper describes a file translation system between IGES and STEP. In this system, three EXPRESS schemata are defined for IGES, STEP and the translation relationship between IGES and STEP. Object codes are generated from the schemata and linked with file access libraries to IGES and STEP files. The translation was verified by visualization and reverse translation. The system developed in this study can easily applied to translate other file formats because the file structure and translation relationship are defined in EXPRESS - a high level information modeling language.

  • PDF

분산 데이터베이스 시스템에서의 최적 파일 이동 정책 (Optimal File Migration Policies in Distributed Database Systems)

  • 이기태;김재련
    • 산업경영시스템학회지
    • /
    • 제18권33호
    • /
    • pp.1-10
    • /
    • 1995
  • The allocation of files is essential to the efficiency and effectiveness of a distributed system that must meet geographically dispersed data processing demands. In this paper, we address an optimization model that generates optimal file migration policies in distributed database systems. The proposed model is a more generalized model that includes system's capacity constraints - computing sites' storage capacity and communication networks' capacity - which have not taken into consideration in previous researches. Using this model, we can establish initial file allocation, file reallocation and file migration polices that minimize a system operating cost under system's capacity constraints at an initial system design or reorganization point The proposed model not only can be adopted by small-sized systems but also provides a foundation for effective and simple heuristics for adaptive file migration in large systems.

  • PDF

Hadoop Distribute file system에서 Small file을 효과적으로 처리하기 위한 파일 병합 기법 연구 (A File Merging Scheme for Efficient Handling of Small Files in Hadoop Distributed File System)

  • 박종창;윤희용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.15-17
    • /
    • 2013
  • HDFS(Hadoop Distribute File System)는 대용량 파일 처리를 목적으로 설계 되었으며 현재 이상적인 분산 파일 시스템으로 각광 받고 있다. 이러한 HDFS는 기존 분산파일 시스템과 많은 유사성을 가지고 있으나, Fault Tolerance를 제공하고, 데이터 엑세스 패턴을 스트리밍 방식으로 지원하여 대용량 파일을 효율적으로 저장할 수 있다는 차별성을 가지고 있다. 하지만 실제 HDFS 데이터 집합에는 Small file이 차지하는 비중이 상당히 높으며, 이러한 다수의 Small file 은 데이터 처리에 있어 높은 비용을 초래할 뿐 아니라 Master Node 의 파일 처리 및 메모리 성능에 악영향을 미친다. 따라서 본 논문에서는 HDFS에서 Small file 이 미치는 영향을 분석하고 이러한 문제점을 해결 할 수 있는 로컬 인덱스 파일기반의 파일 병합 기법을 제안한다.

Constructing relationships in a hierarchical file system

  • Yoon, Young-Woo
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.902-908
    • /
    • 2006
  • We propose a scheme for more efficient navigation in a hierarchical file system. In the proposed scheme, a program running in the background computes the degree of relationship between a current file and others, and builds a list of the most related files. The current relationship metric being used by the program is a linear combination of five parameters: the name, the directory path, the type, the created time, and the last accessed time of a file. A simulated annealing algorithm is used in order to determine the weighting factors of the parameters. A set of experiments were conducted in order to access the effectiveness of the proposed scheme.

  • PDF

분산 파일 시스템 기반 NoSQL의 데이터 안정성을 위한 범용 트랜잭션 관리 기법 (General-purpose Transaction Management Technique for Data Stability of NoSQL on Distributed File System)

  • 권영현;윤도현;박호진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.299-306
    • /
    • 2015
  • 본 논문에서는, 분산 파일 시스템을 기반으로 하는 NoSQL의 데이터 안정성 확보를 연구하였다. 본 논문의 궁극적 목표인 분산 파일 시스템 기반의 NoSQL을 구현하는 과정에서 분산 파일 시스템의 제약 조건인 랜덤 쓰기 문제에 봉착했고, 이 문제의 해결을 위해 중간파일의 개념을 사용함으로써 어떠한 장애 상황에서도 데이터의 오염을 방지할 수 있었다. 또한 중간파일을 쓰는 과정에서 기존 파일 시스템에 비해 분산 파일 시스템이 가지는 성능적 열세를 인식하여, NoSQL을 위한 파일 블록 단위를 다시 정의하는 방법으로 성능적 손실을 크게 줄였다. 결과적으로, 본 논문에서는 보편적 분산 파일 시스템의 확장성을 가진 NoSQL을 개발함과 동시에 원자성, 일관성, 고립성, 성능 등의 조건을 만족하는 트랜잭션 관리 기법을 사용함으로써 데이터 안정성을 가지면서 실용적 사용에도 무리가 없는 NoSQL을 구현하였다.