• 제목/요약/키워드: HDFs

검색결과 151건 처리시간 0.025초

Distributed Moving Objects Management System for a Smart Black Box

  • Lee, Hyunbyung;Song, Seokil
    • International Journal of Contents
    • /
    • 제14권1호
    • /
    • pp.28-33
    • /
    • 2018
  • In this paper, we design and implement a distributed, moving objects management system for processing locations and sensor data from smart black boxes. The proposed system is designed and implemented based on Apache Kafka, Apache Spark & Spark Streaming, Hbase, HDFS. Apache Kafka is used to collect the data from smart black boxes and queries from users. Received location data from smart black boxes and queries from users becomes input of Apache Spark Streaming. Apache Spark Streaming preprocesses the input data for indexing. Recent location data and indexes are stored in-memory managed by Apache Spark. Old data and indexes are flushed into HBase later. We perform experiments to show the throughput of the index manager. Finally, we describe the implementation detail in Scala function level.

MapReduce 프레임워크를 위한 JobTracker 결함허용 메커니즘 (A JobTracker Fault-tolerant Mechanism for MapReduce Framework)

  • 황병현;박기진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(A)
    • /
    • pp.317-318
    • /
    • 2010
  • 클라우드 컴퓨팅 서비스를 제공하기 위해서는 클라우드 컴퓨팅에 적합한 데이터 분산 저장 및 병렬 처리가 가능한 IT 인프라 구축이 필수적이다. 이를 위해서 분산 파일 시스템 중 하나인 HDFS(Hadoop File System)와 병렬 데이터 처리를 지원하기 위한 MapReduce 프레임워크 관련 연구가 각광 받고 있다. 하지만 MapReduce 프레임워크를 구성하는 JobTracker 노드는 SPoF(Single Point of Failure)이기 때문에, 작업 도중 JobTracker 노드의 결함이 발생하게 되면 전체 작업이 실패하게 된다. 위와 같은 문제를 해결하기 위해서 본 논문에서는 MapReduce 프레임워크의 JobTracker 노드 결함 발생에 대처할 수 있는 결함허용 메커니즘을 제안하였다.

  • PDF

클라우드 가상화 기법을 이용한 컴퓨터 실습 교육시스템 (Implementation of a Computer Lab System using Cloud Virtualization)

  • 강신심;이봉환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.351-354
    • /
    • 2012
  • 클라우드 컴퓨팅의 핵심은 대규모 컴퓨팅 리소스를 유기적으로 연결시켜 효율적으로 사용하게 하는 것이다. 본 논문에서는 오픈 소스 기반의 클라우드 컴퓨팅 가상화 기법을 이용한 가상 컴퓨터 실습실을 설계하고 구현하여 교육현장에서 실습 장비의 노후나 소프트웨어의 잦은 업그레이드로 인한 문제점을 개선할 수 있도록 하였다.

  • PDF

HDFS에서 소형 파일의 효율적인 접근을 위한 메타데이터 동기화 기반의 분산 캐시 관리 기법 (A Distributed Cache Management Scheme Based on Metadata Synchronization for Efficient Accesses of Small Files in HDFS)

  • 오현교;김기연;황재민;박준호;임종태;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.47-48
    • /
    • 2014
  • 최근 개인 사용자에게 최적화된 정보 및 서비스를 제공하기 위해 다수의 소형파일에 대한 분석이 요구되고 있다. 이런 요구사항을 고려해 본 논문에서는 통신주기에 따라 캐시 메타데이터 동기화를 적용한 분산 캐시 관리 기법을 제안한다. 제안하는 기법은 다수의 소형파일을 병합하여 청크에 저장함으로써, 네임노드가 관리하는 메타데이터의 양을 줄였으며, 클라이언트 캐시에 캐시 메타데이터를 추가적으로 저장하는 구조를 갖는다. 또한, 클라이언트와 네임노드 간 통신주기 조절을 통해 클라이언트의 캐시 메타데이터를 갱신함으로써 불필요한 처리시간을 감소시킨다.

  • PDF

Sulfuretin Inhibits Ultraviolet B-induced MMP Expression in Human Dermal Fibroblasts

  • So, Hong-Seob;Kim, Seung-Hoon;Lee, Young-Rae
    • 동의생리병리학회지
    • /
    • 제25권3호
    • /
    • pp.533-539
    • /
    • 2011
  • Sulfuretin is one of the main flavonoids produced by Rhusverniciflua. Sulfuretin has been shown to exhibit many pharmacological activities including anti-oxidant, anti-obesity, anti-inflammatory and anti-mutagenic activities. However, the anti-skin photoaging effects of sulfuretin has not yet been reported. In the present study, we investigated the inhibitory effect of sulfuretin on the expression levels of MMP-1 and -3 in the human dermal fibroblast cells. Western blot analysis and real-time PCR revealed sulfuretin inhibited UVB-induced MMP-1 and -3 expressions in a dose-dependent manner. UVB-induced MAPK/NF-${\kappa}B$/p50 activation and MMP expression were completely blocked by pretreatment of sulfuretin. Taken together, sulfuretin could prevent UVB-induced MMP expressions through inhibition of MAPK/NF-${\kappa}B$/p50 activation.

하둡 분산 파일 시스템을 위한 효율적인 데이터 분산 저장 기법 (An Efficient Data Distribution Store Schemes for Hadoop Distributed File System)

  • 최성진;전대석;배대극;최부영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(D)
    • /
    • pp.163-166
    • /
    • 2011
  • 클라우드 컴퓨팅이란 인터넷 기술을 활용하여 모든 인프라 자원(소프트웨어, 서버, 스토리지, 네트워크 등)을 서비스화(as a Service)하여, 언제, 어디서든, 장치에 독립적으로 네트워크를 통해 사용하고, 사용한 만큼 비용을 지불하는 컴퓨팅으로써, 대표적인 서비스 업체로는 구글과 아마존이 있다. 최근 아파치 재단에서는 구글의 GFS와 동일 또는 유사한 시스템을 만들기 위해 HDFS 오픈소스 프로젝트를 진행하고 있다. HDFS는 빈번한 하드웨어 고장에도 원본 데이터를 복구할 수 있는 가용성을 보장하기 위해 파일 데이터를 블록 단위로 나누어, 다시 datanode에 복제하여 저장한다. 이 기법은 복제가 많아 질수록 가용성은 높아지나 스토리지가 증가한다는 단점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 행렬의 특성을 이용한 새로운 분산 저장 기법을 제안한다.

TCP Incast 문제 해결방안에 관한 연구 (A Study on Solutions for TCP Incast Problem)

  • 엄진영;석민수;최태환;안종석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.64-66
    • /
    • 2016
  • 대규모 데이터 센터는 클라우드 컴퓨팅을 가능하게 하고, 빅데이터 처리를 위해 널리 쓰이는 HDFS 혹은 MapReduce, Dryad와 같은 프레임워크는 분산 처리 환경에서 운영하는 것을 기반으로 설계되어 있어 일대일이 아닌 다대일 통신이 빈번히 발생한다. TCP Incast 문제는 다대일 통신에서 발생하는 문제로 단일 상위 서버에서 다수의 하위 서버로 일을 요청할 때, 요청된 결과가 단일 상위 서버로 동시에 응답할 때 발생한다. 기존의 분산 처리 환경에서는 작은 데이터를 처리하기 때문에 단일 상위 서버에서의 데이터 처리 부담이 적었다. 하지만 빅데이터를 처리하는 분산 처리 환경에서는 블록 단위의 큰 데이터를 처리하므로 데이터 처리 시간에 민감한 메시지 데이터에서 지연이 발생할 수 있다. 본 논문에서는 급격한 처리량 붕괴를 일으킬 수 있는 TCP Incast 문제 완화 알고리즘에 대하여 기술한다.

Hadoop을 활용하여 3D 프린터용 대용량 데이터 처리 알고리즘 개발 (Development of high volumes of data processing algorithm for 3D printers in Hadoop systems)

  • 남기원;이규영;김건영;김주현;김성석;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.691-693
    • /
    • 2017
  • 하둡 시스템은 대용량의 데이터를 처리할 수 있는 클러스터 기반 개방형 소프트웨어 프레임워크이다. 이는 하둡 분산 파일시스템(HDFS)과 MapReduce 모델을 활용하여 데이터의 병렬 처리를 지원한다. 본 연구에서는 3D 프린터를 위한 3D 모델 데이터를 G-code로 변환하는 알고리즘을 하둡을 활용하여 구현하였다. 4대의 컴퓨터에 하둡 시스템을 설치한 후 전처리-Map-Shuffling-Reduce의 과정을 거쳐 변환작업이 효율적으로 처리하였음을 보일 수 있었다.

클라우드 컴퓨팅을 활용한 D-CATV의 사용자 인증 및 접근 제어 방법연구

  • 양종원;이상동;채종수;서창호
    • 정보보호학회지
    • /
    • 제20권2호
    • /
    • pp.20-26
    • /
    • 2010
  • 기존의 케이블 방송망을 활용하여 개인화 방송 서비스를 제공하기 위해서는 하드디스크 등 PC형태를 갖춘 고가의 셋톱박스가 필요하며, SO 별로 서비스 제공을 위한 독립적인 인프라 구축이 필요한 실정이다. D-CATV 사업자의 경우 고화질 디지털 방송을 앞세워 한시적인 주문형 비디오 서비스 및 한정적인 웹서비스와 유사한 형태의 부가서비스를 제공하고 있으나, 기존 TV의 영역을 넘어선 IP망의 특생을 활용한 양방향서비스, 개인화 서비스를 원활히 제공하지 못하고 있다 이는 IPTV 사업자와 치열한 경쟁에서 서비스 측면에서 지속적인 열세의 빌미가 될 것이다. 본 논문에서는 스토리지 클라우드 컴퓨팅 환경을 적용한 차세대 D-CATV 서비스를 위해 SO업체들이 공동활용 가능한 클라우드 인프라 구축과 양방향 개인화 서비스 등 차세대 디지털방송 기반 기술을 위한 HDFS 기반 가상화된 스토리지 클라우드 시스템을 제안하며, 또한 D-CATV 서비스 접속을 위한 사용자 인증 및 콘텐츠 접근제어 시나리오 방법을 제안 하였다.

하둡 분산 파일 시스템 기반의 AVL트리를 이용한 동적 복제 관리 기법 (Dynamic Replication Management Scheme based on AVL Tree for Hadoop Distributed File System)

  • 류연중;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.337-340
    • /
    • 2014
  • 클라우드 시스템이 큰 이슈로 떠오르면서 그 기반이 되는 분산 파일 시스템에 관한 연구가 계속되고 있다. 최근 제안된 분산파일 시스템은 대부분 확장 가능하며 신뢰성이 있는 시스템으로 구성되어 있으며 내고장성(Fault tolerance)과 높은 가용성을 위해 데이터 복제 기법을 사용하며 하둡 분산 파일 시스템에서는 블락의 복제수를 기본3개로 지정한다. 그러나 이 정책은 복제수가 많아지면 많아질수록 가용성은 높아지지만 스토리지 또한 증가한다는 단점이 있다. 본 논문에선 이러한 문제점을 해결하기 위해 최소한의 블락 복제수와 복제된 블락을 효율적으로 배치하여 더 좋은 성능과 부하분산(Load Balancing)하기 위한 기법을 제안한다.

  • PDF