小樱 发表于 2022/1/18 05:55

linux tar文件三种压缩方式压缩率对比和速度,gz、bz2、xz

linux tar文件三种压缩方式压缩率对比和速度,gz、bz2、xz

安装必须组件
yum -y install tar gzip bzip2 xz

以 gzip 压缩,极快,压缩率低 real 0m21.620s
以 bzip2 压缩,慢,压缩率最高 real 2m59.534s
以 xz 压缩,极慢,压缩率比bz2稍低 real 5m5.909s

压缩率对比,数据内容为服务器log日志文件。
-rw-r--r-- 1 root root67949013 Mar 30 23:24 access2.tar.bz2
-rw-r--r-- 1 root root 113661131 Mar 30 23:21 access2.tar.gz
-rw-r--r-- 1 root root74934004 Mar 30 23:28 access2.tar.xz

由此可见,考虑压缩率的情况下,bzip2压缩方式的bz2格式是最好的,考虑速度快CPU性能消耗少,那就是gzip的gz格式

hikari56 发表于 2022/2/12 04:28

站长好 ummm这方面刚好也有一点自己的看法
压缩性能受影响的因素其实有挺多的 你测试的应该是文本文件 对于熵值更大的混乱二进制文件可能会有不一样的表现
也要看算法和压缩参数 网上有一些测试得更细致的结果可以参考参考

虽然主流支持得不是很好但如果是个人使用(别人要打开你的压缩包可能会遇到麻烦) 我个人比较推荐lz4算法:https://github.com/lz4/lz4
如果是要主流支持并且利于分享(当然最广泛采纳的应该是zip(rar都次之)) 我非常非常推荐7zip 7z格式本身有一定优化可以使得同样压缩算法下文件可能会小一丢丢 而且也支持你说的bz2算法以及我觉得常用并且性价比比较高的LZMA2
而且命令行操作的话 也非常推荐7zip官方的p7zip 因为 熟悉以后你会发现 特别好用 一网打尽一切压缩问题 当然这个命令行需要一点学习成本有点点复杂 但我觉得是值得的
{:130:}

小樱 发表于 2022/2/12 18:58

hikari56 发表于 2022/2/12 04:28
站长好 ummm这方面刚好也有一点自己的看法
压缩性能受影响的因素其实有挺多的 你测试的应该是文本文件 对 ...

是的,为了便捷肯定是系统自带的压缩算法好,无需另外用源码编译安装
Linux上主要压缩需求也就是log等文本文件了,,二进制压缩不常见,除非用于打包发布软件版本,一般编译器在生成二进制时,编译器都会直接压缩二进制文件,所以二次压缩二进制文件基本没有效果。
页: [1]
查看完整版本: linux tar文件三种压缩方式压缩率对比和速度,gz、bz2、xz