Projection 优化最佳实践¶

原文：Best Practices for Projection Optimization

概述¶

Vertica 以优化查询执行的格式将数据存储在 projection 中。与物化视图类似，projection 将结果集存储在磁盘上，而不是每次查询时重新计算。Vertica 会自动用更新或新增的数据刷新这些结果集。

有时你需要手动刷新 projection 以确保最新数据存在。例如，在已有数据的表上新建 projection 时，该 projection 不会自动加载已有数据，必须执行刷新后才能参与查询。

刷新 projection 也会推进 AHM，缩短 AHM 与当前 epoch 之间的差距，从而减少 catalog 的内存使用。

本文涵盖：

Projection 以优化查询执行的格式存储数据，类似物化视图。Projection 提供以下好处：

确保有足够的临时空间和磁盘空间来完成 projection 刷新。通常，磁盘空间为 projection 大小的 2–3 倍可以避免刷新问题。

其他可能影响 projection 性能的空间问题：

如果磁盘空间不足导致刷新失败，需要执行 rollback（回滚），终止当前事务并丢弃所有变更。参见创建与回滚事务。

监控磁盘空间相关系统表：

选择合适的逻辑排序顺序可以最大化查询性能。

详见 Choosing Sort Order: Best Practices

在大表上创建分段 projection 可以将查询执行负载分散到多个节点。分段实现以下目标：

选择分段列是关键决策：

详见：Segmented Projections、HASH

Database Designer 会为数据实现最优编码。创建 projection 时，应为列指定合适的编码以优化查询性能。合适的编码可以减少数据库存储占用并提升查询性能。

详见：Encoding Types、Column Encoding

使用以下系统表监控 projection 状态和性能：

系统表	说明
`PROJECTIONS`	列出 projection 信息
`PROJECTION_CHECKPOINT_EPOCHS`	checkpoint epoch 刷新详情
`PROJECTION_COLUMNS`	projection 列信息（编码类型、排序顺序、统计类型、统计最后更新时间）
`PROJECTION_DELETE_CONCERNS`	列出删除数据时可能存在性能问题的 projection

当为已有数据的表创建 projection 时，Vertica 不会自动将数据加载到新 projection 中。必须手动刷新，否则新 projection 无法参与对锚表的查询执行。

良好的 projection 设计是合并准备的基础（参见 How to Create a Design）。好的设计能让查询优化器更容易选择最佳 projection 进行合并，避免额外的排序和数据传输操作，提升 MERGE 性能。

K-safety 设置 Vertica 数据库集群的容错能力。K 值代表集群中数据的副本数量，这些副本允许其他节点接管故障节点的查询处理。

在 projection 中实现 K-Safety 取决于使用分段还是非分段 projection：

在创建 projection 时设置 K-Safety 值。