Performance Improvement of LZ77 Algorithm using a Strategy Table and a Genetic Algorithm

전략 테이블과 유전 알고리즘을 이용한 LZ77 알고리즘의 성능 개선

  • 정순철 (서울대학교 전기컴퓨터공학부) ;
  • 서동일 (서울대학교 전기컴퓨터공학부) ;
  • 문병로 (서울대학교 컴퓨터공학부)
  • Published : 2004.12.01

Abstract

Data compression techniques have been studied for decades because they saved space and time to reduce costs. The Lempel-Ziv 77 (LZ77) is a dictionary-based, lossless compression algorithm. The dictionary size of the LZ77 algorithm is fixed, and the performance of the algorithm is highly dependent on its dictionary size. In this paper, we suggest a dynamic LZ77 algorithm that changes its dictionary size during compression, and also we suggest a genetic algorithm to evolve the dictionary-resizing strategies. The suggested algorithm outperformed the original version up to about 16%.

저장 공간이나 전송 시간을 줄여서 비용을 아끼는 데이타 압축 기술은 그 유용성 때문에 오래전부터 연구되어 왔다. Lempel-Ziv 77(LZ77) 알고리즘은 실용적인 사전-기반 비손실 압축 알고리즘이다. 기존의 LZ77 알고리즘에서 알고리즘의 성능에 큰 영향을 미치는, 사전의 크기는 고정되어 있다. 본 논문에서는 사전의 크기를 동적으로 바꾸면서 압축을 하는 동적 LZ77 알고리즘과 동적 LZ77 알고리즘에서 사용하는 전략을 진화시키는 유전 알고리즘을 소개한다. 유전 알고리즘으로 진화시킨 전략을 가지고 동적 LZ77 알고리즘은 기존의 LZ77 알고리즘보다 최대 약 16%까지 더 좋은 압축 효율을 보여 주었다.

Keywords

References

  1. R. M. Gray, Source Coding Theory, Kluwer Academic Publishers, Boston, 1990
  2. J. Ziv and A. Lempel, 'A universal algorithm for sequential data compression,' IEEE Transactions on Information Theory, Vol. 23, pp. 337-342, 1977 https://doi.org/10.1109/TIT.1977.1055714
  3. J. A. Storer and T. G. Szymanski. 'Data compression via textual substitution,' Journal of ACM, Vol. 29, No. 4, pp. 928-951, 1982 https://doi.org/10.1145/322344.322346
  4. T. A. Welch, 'A technique for high-performance data compression,' IEEE Computer, Vol. 17, No. 6, pp. 8-19, 1984
  5. R. P. Brent, 'A linear algorithm for data compression,' Australian Computer Journal, Vol. 19, No. 2, pp. 64-68, 1987
  6. C. Bloom, 'LZP: a new data compression algorithm,' IEEE Data Compression Conference, 1996 https://doi.org/10.1109/DCC.1996.488353
  7. M. F. Oberhumer. 'LZO - a real-time data compression library,' URL: http://www.infosys.tuwien.ac.at/Staff/lux/marco/- lzo.html, 1997
  8. J. H. Holland, Adaptation in Natural and Artificial Systems, University of Michigan Press, Ann Arbor, 1975
  9. D. E. Goldberg, Genetic Algorithms in Search, Optimization, and Machine Learning, Addison-Wesley, 1989
  10. S. Jung and B. R. Moon, 'Toward minimal restriction of genetic encoding and crossovers for the 2D Euclidean TSP,' IEEE Trans. on Evolutionary Computation, Vol. 6, No. 6, 2002
  11. T. N. Bui and B. R. Moon. Genetic algorithm and graph partitioning. IEEE Trans. on Computers, Vol. 45, No.7, pages 841-855, 1996 https://doi.org/10.1109/12.508322
  12. W. K. Ng and C. V. Ravishankar, 'A preliminary study of genetic data compression,' International Conference on Genetic Algorithms, pp. 566-573, 1995
  13. 문병로, 유전 알고리즘, 다성 출판사, 2001
  14. T. C. Bell, J. G. Cleary, and I. H. Witten, Text Compression, Prentice Hall, Englewood Cliffs, NJ, 1990
  15. T. N. Bui and B. R. Moon, 'Hyperplane synthesis for genetic algorithms,' International Conference on Genetic Algorithms, pp. 102-109, 1993