浮点数压缩9：Lzsse和Lizard

在现代数据存储系统中，经常需要大量地存储浮点数，这就需要压缩算法。众所周知，传统的压缩算法比如 DEFLATE, LZ4 和 Snappy 等可用于压缩通用数据，但是它们对浮点数进行压缩时并不十分高效。本文将介绍两个浮点数压缩算法：LZSSE 和 Lizard。

LZSSE 压缩算法的原理是利用 SSE2 指令集中的数学运算，对浮点数进行压缩。其压缩过程分为两个主要步骤。首先，将浮点数转换为整数，这样可以更加高效地进行压缩。然后，在压缩后的整数中，将连续的相同整数段压缩为更短的标记。这种方法可以在不损失精度的情况下，将浮点数压缩到原始尺寸的 25% 左右。

另一个高效的浮点数压缩算法是 Lizard。Lizard 的设计灵感来自于 LZW 压缩算法，但是通过一些聪明的技巧，Lizard 在压缩浮点数时比 LZW 更加高效。Lizard 的压缩过程可以分为三个步骤。首先，通过舍入和偏移的方式，将所有浮点数转换成整数。然后，将所有整数看成是字符串，并利用 LZW 压缩的方式将它们压缩成更短的标记。最后，通过变换整数的位数，将压缩后的整数进一步压缩。这种方法可以将浮点数压缩到原始尺寸的 20% 左右。

总之，LZSSE 和 Lizard 是两个十分高效的浮点数压缩算法，它们都可以将数据压缩到原始尺寸的 25% 到 20% 左右。因此，如果你需要存储大量的浮点数，不妨考虑使用这两种算法来节省存储空间。

详情参考

了解更多有趣的事情：https://blog.ds3783.com/

偏执的码农

浮点数压缩9：Lzsse和Lizard

发表回复取消回复

近期文章

近期评论

归档

分类

偏执的码农

浮点数压缩9：Lzsse和Lizard

发表回复 取消回复

近期文章

近期评论

归档

分类

发表回复取消回复