• 제목/요약/키워드: File Storage

검색결과 453건 처리시간 0.027초

해쉬 체인 기반의 안전한 하둡 분산 파일 시스템 인증 프로토콜 (Secure Authentication Protocol in Hadoop Distributed File System based on Hash Chain)

  • 정소원;김기성;정익래
    • 정보보호학회논문지
    • /
    • 제23권5호
    • /
    • pp.831-847
    • /
    • 2013
  • 모바일 대중화에 따른 소셜 미디어의 확산과 함께 다양한 형태의 데이터가 대량으로 생산되고 있다. 이에 따라 대규모 데이터 분석을 통해 가치 있는 비즈니스 정보를 얻고자 하는 기업들의 빅데이터 기술 도입 및 활용 또한 날로 증가하는 추세이다. 특히, 하둡은 테라바이트 단위의 파일 저장 능력과 저렴한 구축비용, 빠른 데이터 처리 속도로 가장 대표적인 빅데이터 기술로 손꼽힌다. 하지만 현재 하둡 분산 파일 시스템의 사용자 인증을 위한 인증 토큰 시스템은 토큰 재전송 공격, 데이터노드 해킹 공격에 취약하다. 이는 하둡 분산 파일 시스템 상에 저장된 기업 기밀 데이터 및 고객 개인 정보 등의 안전을 위협할 수 있다. 본 논문에서는 토큰 및 데이터노드가 공격자에게 노출되었을 때 발생 가능한 하둡 분산 파일 시스템의 보안 취약성을 분석하고, 해쉬 체인을 사용한 보다 안전한 하둡 분산 파일 시스템 인증 프로토콜을 제안한다.

레코드 단위의 동기화를 지원하는 개별 클라우드 구현 기법 (Implementations of Record_Level Synchronized Safe Personal Cloud)

  • 홍동권
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.239-244
    • /
    • 2014
  • 클라우드 컴퓨팅 (Cloud Computing) 환경의 중요성, 편리성이 점점 커지면서 개인 정보 (프라이버시, privacy)에 대한 염려도 점점 더 커지고 있다. 클라우드 환경에서 개인 정보의 보호에 대한 연구와 노력은 계속 지속되고 있지만 개인 정보의 침해에 대한 염려는 항상 존재하고 있다. 또한 대부분의 클라우드 환경이 제공하는 파일 단위의 단순화된 동기화 기법은 파일의 부분 변경을 어렵게 한다. 특히 파일에 데이터베이스를 생성하는 SQLite와 같은 내장형 DBMS를 사용하는 데이터 중심 앱에서 단순한 파일 단위의 동기화는 많은 정보를 잃어버릴 수 있게 한다. 본 논문에서는 모바일 기기에서 데스크탑 컴퓨터를 이용하여 레코드 단위의 세밀한 동기화를 지원하는 개별 클라우드를 구축하는 기법을 제안하고, 데모 시스템을 구축하여 그 기능을 확인한다. 데모 시스템은 데스크탑 컴퓨터에 RESTFul 웹 서비스 기능을 구현한 후 모바일 기기의 스키마와 동일한 스키마를 클라우드 저장소인 데스크탑 컴퓨터에 구현하고, 낙관적 방식의 레코드 단위의 동기화를 지원하게 한다.

소규모 운영체제에서의 스트림데이터 처리기법 (The Processing Method of Stream Data in the Small-size Operating System)

  • 김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.871-874
    • /
    • 2007
  • 스트림 데이터들은 매우 용량이 크며, 짧은 보고 주기, 비동기적인 보고 시간을 가진다. 이러한 시스템의 질의는 최신의 값을 검색하는 현재질의, 과거 특정시점의 값을 검색하는 스냅샷 질의, 과거부터 현재까지의 값들을 검색하는 슬라이딩 윈도우 질의 등이 있다. 이 논문에서는 소규모 운영체제에서 파일 구조화된 데이터베이스를 이용하여 스트림 데이터들을 효율적으로 관리하는 기법을 제안하고자한다. 그리고 스트림 데이터에 대한 슬라이딩 윈도우 질의를 포함한 다양한 질의를 수용하는 질의 모델을 제안한다. 제안한 기법들을 원자로 안전 운전원 모듈에 적용하여 그 유용성을 검증하고자 한다. 운전원 모듈(COM)은 QNX 운영체제를 기반으로 하며, 파일 데이터베이스는 QNX COM의 적은 저장장치, 낮은 계산 능력을 감안하여 델타버젼과 버퍼링 등의 방법을 도입한다.

  • PDF

SSD 환경 아래에서 GlusterFS 성능 최적화 (Performance Optimization in GlusterFS on SSDs)

  • 김덕상;엄현상;염헌영
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.95-100
    • /
    • 2016
  • 빅데이터, 클라우드 컴퓨팅 시대가 오면서 데이터 사용량이 점점 증가하고 있고 이러한 빅데이터를 신속히 처리하기 위한 시스템들이 개발되고 있다. 그 중 데이터를 저장하기 위한 시스템으로 분산 파일 시스템이 널리 사용되고 있다, 이러한 분산 파일 시스템 중에는 글러스터 파일 시스템(GlusterFS)이 있다. 또한 기술의 발달로 고성능 장비인 Nand flash SSD (Solid State Drive)의 가격이 하락함에 따라서 데이터센터로 도입이 증가되는 추세이다. 따라서 GlusterFS에서도 SSD를 도입하려고 하지만, GlusterFS는 하드디스크를 기반으로 설계되었기 때문에 SSD를 이용했을 시 구조적인 문제로 성능 저하가 발생하게 된다. 이러한 구조적인 문제점들에는 I/O-cache, Read-ahead, Write-behind Translator들이 있다. 랜덤 I/O에 장점이 있는 SSD에 맞지 않는 기능들을 제거함으로써, 4KB 랜덤 읽기의 경우 255%까지의 성능 향상 결과와, 64KB 랜덤 읽기의 경우 50%까지의 성능 향상 결과를 얻었다.

ModClark 모형을 이용한 유출 해석 (Runoff Analysis using ModClark Model)

  • 안상진;윤석환
    • 한국수자원학회논문집
    • /
    • 제38권3호
    • /
    • pp.245-257
    • /
    • 2005
  • 본 연구에서는 격자로 분할된 유역에 ModClark 모형을 적용하여 수문모형의 매개변수를 산정하고 격자분할에 따른 유출변화에 대해서 검토하였다. 연구대상 유역은 IHP (국제수문개발계획)의 대표유역의 하나인 금강수계의 보청천 유역으로 하였다. 유역의 수문지형정보들은 HEC-GeoHMS를 이용하여 계산하였다. ModClark 모형은 격자형태의 강우자료를 요구하며 이 자료들은 HEC-DSS 파일 형태로 기록되어져 있어야 한다. 따라서 크리깅 방법을 이용하여 지점우량을 전체유역에 대한 격자 강우를 생성하였으며, Hec-DSSVue 프로그램을 이용하여 강우 입력자료를 DSS 파일로 생성하였다. 격자 크기 10000m, 5000m, 2000m 및 1000m에 대한 3가지 유출사상에 대해 모의하였으며, 모의 결과 첨두 홍수량, 유출체적, 첨두홍수 도달시간에 대해 실측수문곡선과 비교적 양호한 결과를 나타내었다.

페이지 주소 캐시를 활용한 NAND 플래시 메모리 파일시스템에서의 효율적 주소 변환 테이블 관리 정책 (An Efficient Address Mapping Table Management Scheme for NAND Flash Memory File System Exploiting Page Address Cache)

  • 김정길
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.91-97
    • /
    • 2010
  • 비휘발성, 저전력 소모, 안정성 등의 장점을 가진 NAND 플래시 메모리는 고집적화, 대용량화, 저가격화를 통하여 다양한 디지털시스템의 데이터 저장장치로 사용되고 있다. 플래시 메모리의 다양한 분야에서의 응용 확대와 동시에 플래시 메모리의 대용량화는 플래시 메모리의 주소 변환 테이블의 전체 크기를 증가시켜 SRAM에 저장하기에 용량이 부족한 문제점을 발생시킨다. 본 논문에서는 하이브리드 변환 기법 기반의 플래시 메모리 파일 시스템에서 페이지 주소 캐시를 이용한 효율적인 주소 테이블 관리 정책을 제안한다. 제안하는 기법은 다양한 메타 데이터 기반의 전체 테이블의 정보를 맵블록을 이용하여 효율적으로 통합 관리함으로써 높은 성능을 유지할 수 있다. PC 환경에서의 다양한 응용프로그램을 실험한 결과 제안하는 페이지 주소 캐시는 2.5% 이하의 낮은 미스율로 높은 효율성을 유지하며 전체 쓰기 연산 요청에서 평균 33%의 실제 쓰기 연산의 실행으로 전체 쓰기 연산에서 발생하는 오버헤드를 줄여 주었다.

데이터베이스 시스템의 원자성 쓰기 보장을 위한 스토리지 I/O 서브시스템 (Storage I/O Subsystem for Guaranteeing Atomic Write in Database Systems)

  • 한규화;신동군;김용석
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.169-176
    • /
    • 2015
  • 최근 데이터베이스 관리 시스템에서는 이중 쓰기 버퍼 기법의 단점을 보완할 수 있는 원자성 쓰기 기법이 제시되었다. 원자성 쓰기 기법을 지원하기 위해서는 파일시스템과 I/O 스케줄러 등의 I/O 서브시스템과 SSD의 원자성 쓰기의 보장이 필요하다. 본 연구에서는 MariaDB의 데이터 쓰기의 기본 단위를 사용하여, 쓰기 단위 연속 블록 할당 기법, 플래그 전달을 통한 I/O 명령 병합 방지 기법, 원자성 쓰기를 지원하는 SSD를 통해 MariaDB의 원자성 쓰기를 지원하는 연구를 진행하였다. Tpcc-mysql와 SysBench를 사용하여 MariaDB에 제안된 기법을 적용한 결과, 원자성 쓰기 기법의 성능을 평가한 결과, 데이터베이스의 처리량이 이중 쓰기 버퍼 기법을 사용한 MariaDB 대비 약 40%~50% 향상된 것을 확인하였다.

시스템 환경이 Filebench 벤치마크에 미치는 영향 분석 (Analyses of the Effect of System Environment on Filebench Benchmark)

  • 송용주;김정훈;강동현;이민호;엄영익
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.411-418
    • /
    • 2016
  • 최근 낸드 플래시 메모리가 널리 보급됨에 따라 기존 파일 시스템의 한계를 보완하고 낸드 플래시 메모리의 장점을 활용하기 위한 파일 시스템 연구가 활발히 진행되고 있다. 이렇게 제안된 파일 시스템들에 대해서는, 일반적으로 벤치마크를 통해 성능 측정이 이루어진다. 서버나 모바일 환경에서 실제 시스템의 성능 측정이 어려울 경우, 벤치마크는 측정하고자 하는 실제 시스템에 대한 직접적인 성능 측정 대신 워크로드를 통해 재현된 환경에서 소프트웨어적 성능 측정을 가능하게 한다. 이 때, 성능 측정 환경이 실제 시스템이 아니기 때문에 측정하는 시스템 환경에 따라서 일정하지 않은 성능 측정 결과를 보인다. 이에 본 논문에서는 파일 시스템의 성능을 측정하는데 흔히 사용되는 벤치마크 중에서 Filebench를 이용하여 여러 가지 시스템 환경에 따른 성능 측정 결과를 살펴보고 측정 결과의 변동이 생기는 원인을 알아본다. 실험 결과, 캐시 내부에 벤치마크 I/O 외의 성능 측정에 불필요한 I/O가 많이 발생할수록 벤치마크의 성능 측정 결과가 떨어지는 것을 확인하였다. 또한 fsync 동작이 포함된 백그라운드 I/O를 동작시키는 경우에는 최대 98.2%의 성능 저하가 발생하는 것을 확인하였다.

클라우드 컴퓨팅에 적합한 LDPC 부호 복제 기법 (An LDPC Code Replication Scheme Suitable for Cloud Computing)

  • 김세회;이원주;전창호
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.134-142
    • /
    • 2012
  • 본 논문에서는 클라우드 컴퓨팅에 적합한 LDPC 부호 복제 기법을 제안한다. 이를 위해 먼저 파일 가용성과 스토리지 오버헤드 분석을 통해 클라우드 컴퓨팅에 적합한 블록 수와 LDPC 부호 종류를 결정한다. 그리고 LDPC 부호를 정의하는 Tanner 그래프의 무작위 생성 방법과 생성한 LDPC 부호들의 반복적인 복호화 과정을 통한 성능 비교 방법을 제시한다. 또한 실험을 통하여 클라우드 컴퓨팅에 적합한 LDPC 부호 복제 기법의 그래프 정규성과 총 간선 수에 따른 성능 변화를 분석하였다. 이를 통해 LDPC 부호의 그래프 정규성이 좌-정규와 약 좌-정규 일 때와 총 간선 수가 최소이거나 최소에 근접한 값을 가질 때 가장 성능이 좋음을 확인할 수 있었다.

Apache Kudu와 Impala를 활용한 Lambda Architecture 설계 (Lambda Architecture Used Apache Kudu and Impala)

  • 황윤영;이필원;신용태
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권9호
    • /
    • pp.207-212
    • /
    • 2020
  • 데이터의 양은 기술의 발전으로 크게 증가하였고 이를 처리하기 위해 다양한 빅데이터 처리 플랫폼이 등장하고 있다. 이 중 가장 널리 사용되고 있는 플랫폼이 Apache 소프트웨어 재단에서 개발한 하둡이며, 하둡은 IoT 분야에도 사용된다. 그러나 기존에 하둡 기반 IoT 센서 데이터 수집 분석 환경은 하둡의 코어 프로젝트인 HDFS의 Small File로 인한 네임노드의 과부하 문제와 임포트된 데이터의 업데이트나 삭제가 불가능하다는 문제가 있다. 본 논문에서는 Apache Kudu와 Impala를 활용해 Lambda Architecture를 설계한다. 제안하는 구조는 IoT 센서 데이터를 Cold-Data와 Hot-Data로 분류해 각 성격에 맞는 스토리지에 저장하고 배치를 통해 생성된 배치뷰와 Apache Kudu와 Impala를 통해 생성된 실시간뷰를 활용해 기존 하둡 기반 IoT 센서 데이터 수집 분석 환경의 문제를 해결하고 사용자가 분석된 데이터에 접근하는 시간을 단축한다.