#database/olap
[discuss](https://lists.apache.org/thread/tqyn1cro5ohl3c3fkjb1zvxbo03sofn7)
- catalog
如果 table 从外部删除而非通过 Flink SQL DDL,Fink如何删除物理存储。
- log 和 file 集成
file storage需要存储 kafka 的 offset
- change tracking
batch insert 可以选择不产生变更
场景:修复过去的数据(比如10天前的),流式读取不需要(它只需要最新的)
- 数据过期
是否不基于固定的 TTL 而是基于某个 time columns
- PK eventual consistency mode vs checkpoint
- PK
changes是否会产生:
- sink with PK:Flink SQL不会产生 UPDATE_BEFORE
- database 如 MYSQL,会产生 UPDATE_BEFORE
- Upsert-Kafka, 可能不会包含完整/正确的 UPDATE_BEFORE,
所以下游需要有一个 normailized node 来去重(基于 PK 去重)
- watermark
写 watermark 到 storage,好处:loop join支持 watermark align