列式数据库有助于减少联机分析处理(OLAP)的负载,因为查询会涉及到列的一个子集,但这些列都有大量的行数。列式存储格式使我们可以采用一些基于每列的轻量级压缩算法(lightweightcompressionalgorithms)。向量化的数据处理通过有效使用CPU缓冲机制的方法,来开发更快速的分析查询引擎。Arrow的列式数据结构允许使用轻量级方案,如字典编码(dictionaryencoding)、位压缩(bitpacking),或是运行长度编码(runlength),这样在压缩比例一定时,可