Acknowledgement
Supported by : 정보통신산업진흥원
최근 온라인 상에는 분산 처리 환경을 바탕으로 대량의 데이터들이 생성, 수정 및 삭제가 되고 있다. 이러한 환경에서의 효율적인 데이터 처리를 위해 많은 연구들이 진행되고 있으며, 특히 데이터의 입력을 컨텐츠 단위의 청크(content-based chunk)로 분할하고, 이에 MapReduce를 적용하여 효율적으로 데이터 처리를 하는 incremental computation에 관한 연구가 주목 받고 있다. 본 논문에서는 위와 같은 연구에서 주로 이용되는 content-based chunking 기법에 대해 분석하고, 이러한 기법에서 발생 할 수 있는 위험요소에 대해서 기술한다.
Supported by : 정보통신산업진흥원