最近在看列存,最近学习的东西有点多啊!
列存的压缩的原理目前理解有以下几种方式:
1.列的数据类型已知,可以对其进行压缩。
2.列不需要对齐,比如本来只有1个字节,元组中就需要分配4个字节来存储。有些数据库系统要求四字节对齐,有些是八字节对齐。
3.将列的数据统一在另外一个表中存储,原始表中只存序号。这样会减少很多重复的数据,查询性能也非常高。
后续再补充。