• Title/Summary/Keyword: 프리패칭

Search Result 25, Processing Time 0.025 seconds

Data Prefetching and Streaming for Improving the Performance of Mapreduce of Hadoop (하둡 맵리듀스 성능 향상을 위한 데이터 프리패칭과 스트리밍)

  • Lee, Jung June;Kim, Kyung Tae;Youn, Hee Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.151-154
    • /
    • 2015
  • 최근 소셜 네트워크, 바이오 컴퓨팅, 사물 인터넷 등의 출현으로 인해 기존의 IT환경보다 많은 데이터가 생성되고 있고, 이로 인해 효율적인 대용량 데이터 처리기법에 대한 연구가 진행 되고 있다. 맵리듀스는 데이터 집약적인 연산 어플리케이션에 효과적인 프로그래밍 모델로써, 대표적인 맵리듀스 어플리케이션으로는 아파치 소프트웨어 재단에서 개발 지원중인 하둡이 있다. 본 논문은 하둡 맵리듀스의 성능 향상을 위해 데이터 프리패칭 기법과 스트리밍 기법을 제안한다. 하둡 맵리듀스의 성능 이슈 중 하나는 맵리듀스 과정에서 입력 데이터 전송에 의한 작업 지연이다. 이러한 데이터 전송 시간을 최소화하기 위해, 기존 맵리듀스와는 달리 데이터 전송을 담당하는 프리패칭 스레드를 별도로 생성하였다. 그 결과 데이터의 맵리듀스 작업 중에도 데이터 전송이 가능하게 되어 전체 데이터 처리 시간을 줄일 수 있었다. 이러한 프리패칭 기법을 사용해도 하둡 맵리듀스의 특성상 최초 데이터 전송 시에는 작업대기를 하게 되는데, 이 대기시간을 줄이고자 스트리밍 기법을 사용하여 데이터 전송에 의한 대기시간을 추가로 줄일 수 있었다. 제안하는 기법의 성능을 측정하기 위해 수학적인 모델링을 하였으며, 성능 측정결과 기존의 하둡 맵리듀스 및 프리패칭 기법만 적용된 맵리듀스 보다 스트리밍 기법이 추가 적용된 맵리듀스의 성능이 향상되었음을 확인 할 수 있었다.

  • PDF

Scalable Data Management Using User-Based Caching and Prefetching in Distributed Virtual Environments (사용자 기반의 캐싱과 프리패칭을 이용한 분산 가상 환경하에서의 확장성 있는 데이터 관리 기법)

  • 박성주;이동만;한승현;임민규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.697-699
    • /
    • 2001
  • 가상환경에서의 실시간 상호작용을 지원하기 위해 가상세계의 데이터를 서버에서 클라이언트로 복제 해놓는 방법이 쓰여지고 있다. 효과적인 복제를 위해서는 두 가지 기법 - 우선 순위기반의 객체 전송과 캐싱 및 프리패칭 기법이 쓰이고 있다. 기존의 캐시와 프리패칭 기법들은 사용자와 객체간의 지역적 관계를 이용하고 있지만, 이는 어떤 종류의 객체가 사용자에게 더 중요한 지를 결정할 수 없는 단점이 있다. 본 연구에서는 지역적 관계 뿐 아니라 개별 사용자의 객체에 대한 관심도로부터 발생하는 객체에 대한 우선 순위를 이용하여 사용자 기반의 캐싱과 프리패칭을 사용하는 분산 가상환경 하에서의 확장성 있는 데이터 관리 기법을 제안한다. 또한 이 기법에서는 사용자의 행동 모드를 구분함으로써 더욱 높은 캐시 적중 비율을 얻을 수 있다.

  • PDF

Improving Flash Translation Layer for Hybrid Flash-Disk Storage through Sequential Pattern Mining based 2-Level Prefetching Technique (하이브리드 플래시-디스크 저장장치용 Flash Translation Layer의 성능 개선을 위한 순차패턴 마이닝 기반 2단계 프리패칭 기법)

  • Chang, Jae-Young;Yoon, Un-Keum;Kim, Han-Joon
    • The Journal of Society for e-Business Studies
    • /
    • v.15 no.4
    • /
    • pp.101-121
    • /
    • 2010
  • This paper presents an intelligent prefetching technique that significantly improves performance of hybrid fash-disk storage, a combination of flash memory and hard disk. Since flash memory embedded in a hybrid device is much faster than hard disk in terms of I/O operations, it can be utilized as a 'cache' space to improve system performance. The basic strategy for prefetching is to utilize sequential pattern mining, with which we can extract the access patterns of objects from historical access sequences. We use two techniques for enhancing the performance of hybrid storage with prefetching. One of them is to modify a FAST algorithm for mapping the flash memory. The other is to extend the unit of prefetching to a block level as well as a file level for effectively utilizing flash memory space. For evaluating the proposed technique, we perform the experiments using the synthetic data and real UCC data, and prove the usability of our technique.

A Peer to Peer Prefix Patching Scheme for VoD Servers (VoD 서버를 위한 P2P 기반의 프리픽스 패칭 기법)

  • Lee, Chi-Hun;Lee, Keun-Jeong;Choi, Chang-Yeol;Choi, Hwang-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.217-220
    • /
    • 2005
  • VoD 시스템의 병목현상의 주요원인은 저장장치 또는 네트워크 입출력으로 인한 대역폭 요구량과 디지털 비디오의 장시간 서비스로 인한 높은 대역폭 요구량 때문이다. 패칭은 멀티캐스트 사용하여 VoD 시스템의 병목 현상을 극복한 가장 효과적인 기술 중 하나이다. 본 논문에서는 클라이언트를 이용한 프리픽스 패칭 사용과 함께 서버로부터 정규 멀티캐스트 스트림을 사용하여 기존의 패칭 기법을 개선하기 위한 P2Prefix 패칭 기법을 제안한다. 제안된 기법에서 각 클라이언트는 동일한 비디오 스트림을 요청하는 다른 클라이언트에게 프리픽스 스트림을 제공하기 위한 패칭 서버로서의 역할을 한다. 그 결과, 서버 대역폭 요구량은 서버로부터 패칭 채널을 제거하는 것으로 줄일 수 있다. 성능 평가에서 본 논문에서 제안한 패칭 기법이 기존의 패칭 기법과 비교해 볼 때 서버 대역폭 요구를 줄일 수 있음을 보인다.

  • PDF

Efficient Patching Scheme Based on Client Buffer Expanding for VOD Servers (VOD 서버에서 클라이언트 버퍼 확장을 통한 효율적인 패칭 기법)

  • Lee, Keun-Jung;Kwon, Chun-Ja;Choi, Hwang-Kyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.877-879
    • /
    • 2005
  • 본 논문은 클라이언트 버퍼 확장 기법과 프록시 프리픽스 캐싱을 응용하여 기존의 패칭 기법의 성능을 향상시키기 위한 새로운 패칭 기법을 제안한다. 제안된 기법은 프록시에서 비디오의 프리픽스를 캐싱하여 패칭 윈도우 크기를 확장한다. 또한 클라이언트의 버퍼로 부터 오버플로우된 스트림을 공유하고 저장하기 위해 프록시 버퍼를 통해 클라이언트의 버퍼 공간을 확장한다. 프록시에서 프리픽스와 패칭 윈도우 크기가 확장되므로 기존의 패칭 기법보다 서버의 대역폭 요구량이 현저히 줄어들게 된다. 성능 평가를 통해 제안된 기법이 서버의 대역폭 요구량을 줄일 수 있음을 보인다.

  • PDF

A Prefetching Scheme for Location-Aware Mobile Information Services (위치인식 이동정보서비스를 위한 프리패칭 방법론)

  • Kim, Moon-Ja;Cha, Woo-Suk;Cho, In-Jun;Cho, Gi-Hwan
    • The KIPS Transactions:PartC
    • /
    • v.8C no.6
    • /
    • pp.831-838
    • /
    • 2001
  • Mobile information service aims to provide some degree of effective information for real life activities of mobile users. Due to the user mobility and actual realism, it becomes very important technical issue to support an adaptive information service methodology to current situations of the terminal and/or user. This paper deals with a prefetching scheme for location-aware, out of the various context-aware which can be considered in mobile information service. It makes use of the velocity-based mobility model to shape the terminal and/or user's mobility behavior. Based on the moving speed and direction, the prefetching zone is proposed to define the number of prefetched information, so as to limit effectively the prefetched information whilst to preserve the location-aware adaptability. Using a simulator, the proposed scheme has been evaluated in the effectiveness point of view. The idea in this paper is expected to be able to extended to the other mobile service contexts, such as service time, I/O types of mobile terminals, network bandwidth.

  • PDF

A Dynamic Prefetchiong Scheme for Handling Small Files based on Hadoop Distributed File System (하둡 분산 파일 시스템 기반 소용량 파일 처리를 위한 동적 프리페칭 기법)

  • Yoo, Sang-Hyun;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.07a
    • /
    • pp.329-332
    • /
    • 2014
  • 클라우드 컴퓨팅이 활성화 됨에 따라 기존의 파일 시스템과는 다른 대용량 파일 처리에 효율적인 분산파일시스템의 요구가 대두 되었다. 그 중에 하둡 분산 파일 시스템(Hadoop Distribute File System, HDFS)은 기존의 분산파일 시스템과는 달리 가용성과 내고장성을 보장하고, 데이터 접근 패턴을 스트리밍 방식으로 지원하여 대용량 파일을 효율적으로 저장할 수 있다. 이러한 장점 때문에, 클라우드 컴퓨팅의 파일시스템으로 대부분 채택하고 있다. 하지만 실제 HDFS 데이터 집합에서 대용량 파일 보다 소용량 파일이 차지하는 비율이 높으며, 이러한 다수의 소 용량 파일은 데이터 처리에 있어 높은 처리비용을 초래 할 뿐 만 아니라 메모리 성능에 악영향을 끼친다. 하지만 소 용량 파일을 프리패칭 함으로서 이러한 문제점을 해결 할 수 있다. HDFS의 데이터 프리페칭은 기존의 데이터 프리페칭의 기법으로는 적용하기 어려워 HDFS를 위한 데이터 프리패칭 기법을 제안한다.

  • PDF

Prefetching Techniques of Efficient Continuous Spatial Queries on Mobile AR (모바일 AR에서 효율적인 연속 공간 질의를 위한 프리패칭 기법)

  • Yang, Pyoung Woo;Jung, Yong Hee;Han, Jeong Hye;Lee, Yon Sik;Nam, Kwang Woo
    • Spatial Information Research
    • /
    • v.21 no.4
    • /
    • pp.83-89
    • /
    • 2013
  • Recently various contents have been produced using the techniques that require high-performance computing process. A lot of services have been being producted as AR(Augmented Reality) service being combined with mobile information service that a moving user search various information based on one's location with. Mobile information service has a characteristic that it needs to get new information according to the location an user moves to. The characteristic requires a lot of communications when user search information moving to a different location. In order to make up for this drawback, we propose a prefetching technique based on speed and viewing angle in this paper. Existing prefetching techniques retrieve the following location of users considering moving speed and direction of the users. The data showed on the screen in AR is limited by the viewing angle of the mobile device. Due to the problems we discussed above, existing prefetching techniques have a demerit that they retrieve a lot more data than needed actually. We propose more efficient way of retrieving data with AR using the viewing angle of the mobile device. The method we propose reduces retrieval of unnecessary location using the users' speed, direction and viewing angle. This method is more efficient than the existing ways of retrieval because we don't need as many data.

An Efficient P2P Based Proxy Patching Scheme for Large Scale VOD Systems (대규모 VOD 시스템을 위한 효율적인 P2P 기반의 프록시 패칭 기법)

  • Kwon, Chun-Ja;Choi, Hwang-Kyu
    • The KIPS Transactions:PartA
    • /
    • v.12A no.5 s.95
    • /
    • pp.341-354
    • /
    • 2005
  • The main bottleneck for large scale VOD systems is bandwidth of storage or network I/O due to the large number of client requests simultaneously, and then efficient techniques are required to solve the bottleneck problem of the VOD system. Patching is one of the most efficient techniques to overcome the bottleneck of the VOD system through the use of multicast scheme. In this paper, we propose a new patching scheme, called P2P proxy patching, for improving the typical patching technique by jointly using the prefix caching and P2P proxy. In our proposed scheme, each client plays a role in a proxy to multicast a regular stream to other clients that request the same video stream. Due to the use of the P2P proxy and the prefix caching, the client requests that ive out of the patching window range can receive the regular stream from other clients in the previous patching group without allocating the new regular channels from the VOD server to the clients. In the performance study, we show that our patching scheme can reduce the server bandwidth requirement about $33\%$ less than that of the existing patching technique with respect to prefix size and request interval.

Performance Study of Probability-based Tile Pre-fetching and Cache Replacement Algorithms for Web Geographical Information Systems (웹 지리정보시스템을 위한 확률 기반의 타일 프리페칭과 캐쉬대채 알고리즘의 성능평가)

  • 강용균;김기창;김유성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.139-141
    • /
    • 2001
  • 기존의 웹 지리정보시스템에서 전송되는 지리 데이타의 단위가 매우 크기 때문에 사용자들은 지도의 긴초기로딩시간과 늦은 응답시간동안 기다려야 했다. 지리정보시스템에서 기존 연구들은 타일과 레이어의 개념을 이용하여 지도의 긴 초기로딩시간을 최적화하는데 초점을 맞추고 있으나 사용자들의 응답시간을 줄이는 연구는 상대적으로 적었다. 응답시간을 줄이기 위해서 일반적으로 서버로부터 사용자가 앞으로 사용하게 될 타일들을 미리 예측하여 클라이언트로 가져다 놓는 프리패칭 메카니즘을 사용한다. 본 논문에서는 확률기반 모델로 표현된 사용자의 타일접근패턴을 이용하여 앞으로 사용될 타일을 정확하게 예측하여 응답시간을 줄이는 프리패칭 알고리즘과 이와 연동하는 캐쉬대체정책을 제안했다. 제안된 알고리즘을 시뮬레이션을 통해 실험해 본 결과 사용자 응답시간이 36%~40%정도 빨라지는 성능향상을 보였다.

  • PDF