DOI QR코드

DOI QR Code

Intel Xeon Phi 에서의 Aho-Corasick 알고리즘을 위한 메모리 친화적인 고성능 병렬화

Memory-Efficient High Performance Parallelization of Aho-Corasick Algorithm on Intel Xeon Phi

  • Tran, Nhat-Phuong (Dept. of Compute Science and Engineering, Myongji University) ;
  • Jeong, Yosang (Dept. of Compute Science and Engineering, Myongji University) ;
  • Lee, Myungho (Dept. of Compute Science and Engineering, Myongji University)
  • 발행 : 2014.04.22

초록

Aho-Corasick (AC) 알고리즘은 실시간 성능을 요하는 많은 응용 분야에 적용되는 스트링 매칭 알고리즘으로서, 한번에 여러 개의 패턴들을 동시에 매칭시키는 것이 가능하다. 본 논문에서는 Intel 의 Many Integrated Core (MICO 아키텍쳐인 Xeon Phi 칩 상에서 AC 알고리즘을 병렬화한다. 이를 위하여 AC 알고리즘에서 입력 데이터에 대하여 여러 개의 패턴들을 동시에 매칭시키는 데에 사용되는 Deterministic Finite Automaton 구조를 압축시키는 새로운 기법을 제안한다. 이 기법은 캐시 미스를 감소시켜서 XeonPhi 상에서 AC 알고리즘의 성능을 크게 향상시킨다.

Aho-Corasick (AC) algorithm is a multiple patterns string matching algorithm commonly used in many applications with real-time performance requirements. In this paper, we parallelize the AC algorithm on the Intel's Many Integrated Core (MIC) Architecture, Xeon Phi Coprocessor. We propose a new technique to compress the Deterministic Finite Automaton structure which represents the set of pattern strings again which the input data is inspected for possible matches. The new technique reduces the cache misses and leads to significantly improved performance on Xeon Phi.

키워드