- 现状: - 按 parquet 文件/sub-file 分区,不均衡 - 每个文件可能大小差距很大 - 解决: - 按 paquent row group 分区 - 通常 128 MB - 1GB - work stealing - [Coralogix share](https://youtu.be/9u4cNmL14Xs?t=2163)