深入理解列存格式:Arrow,Parquet,ORC

本文深入对比Arrow、Parquet、ORC三种列存格式,分析其在压缩、编码、读写性能等方面的差异,总结各自优劣及适用场景。

2025年10月13日 · 4 分钟 · Yuxia Luo

Lance - AI时代的数据格式标准?

Lance是一种专为机器学习和AI优化的列式数据格式,通过摒弃RowGroup、引入DataPage及内置索引,解决Parquet在随机访问、超大列、大宽表支持上的不足,更好适配AI工作负载并对接主流AI生态。

2025年4月26日 · 3 分钟 · Yuxia Luo