23.4.x New Features¶
23.4版本发布时间:2023年10月
1、数据导出与复制 (Data Export and Replication)¶
1.1 源端发起的服务器复制¶
现在支持从源数据库主动发起基于服务器的复制。
- 操作方式:与目标端发起的复制类似,但需要在源数据库连接目标数据库,并在调用
REPLICATE时通过 TO 子句指定目标数据库。
2、数据加载 (Data Load)¶
2.1 新文件自动加载¶
引入数据加载器(Data Loader)机制,可自动从指定路径加载新文件,无需手动干预。
- 优势:相比使用外部表,直接加载到 ROS 表可节省对象存储的 API 成本。
- 机制:加载器绑定路径与目标表,自动尝试加载未处理过的文件,并具备重试限制以防止畸形文件导致死循环。支持通过存储过程定期调度执行。
2.2 ORC 解析器支持宽松模式匹配¶
ORC 解析器新增宽松模式匹配功能,行为与 Parquet 一致。
- 特性:允许仅选择所需列并忽略其他列,不再强制要求消耗所有列或严格遵循列顺序。
- 要求:表中的列名必须与数据中的列名匹配,且数据类型必须匹配或可转换。
2.3 任意分区路径支持¶
扩展了分区剪枝功能,不再局限于 Hive 风格的分区数据。
- 功能:支持从任意分区路径(如
/data/2023/01)加载和剪枝。Vertica 能自动从路径中提取值(如年份、月份),并在查询时跳过不需要的分区目录。
3、机器学习 (Machine Learning)¶
3.1 卡方独立性检验¶
新增 CHI_SQUARED 函数,用于计算两个分类变量的条件卡方独立性检验,以评估变量间独立的概率,并支持基于其他变量集进行条件测试。
3.2 ARIMA 模型支持差分¶
ARIMA 模型现在支持差分操作,用于消除或减少时间序列数据中的趋势。
- 配置:通过将积分参数
d设置为 1 到 10 之间的整数,指定差分阶数。
4、管理控制台 (Management Console)¶
4.1 界面全面重构¶
管理控制台(MC)进行了显著的 UI/UX 升级,旨在提供更一致的用户体验。
- 首页仪表盘: redesigned 后的首页作为信息中心,展示各数据库和子集群的关键详情,并提供快捷操作入口。
- 工具栏与导航:采用新的多级面板设计,区分系统级导航和特定区域导航,工具栏集成了告警、语言选择及用户操作等快捷入口。
4.2 GCP 自定义镜像¶
支持为 Google Cloud Platform (GCP) 创建自定义 MC 镜像。
- 流程:基于发布的 MC 镜像创建实例 -> 添加依赖或修改配置 -> 制作新镜像。该镜像可用于创建或恢复子集群。
5、安全与认证 (Security and Authentication)¶
5.1 无密码认证¶
CONNECT TO VERTICA 命令现在支持省略用户密码,通过以下方式认证:
- 凭据转发:将当前用户的密码转发至目标数据库。
- TLS 认证:使用 TLS 进行身份验证。
5.2 端点免认证¶
部分文档和健康检查端点不再需要认证,包括 NMA 的 /api-docs/、/v1/health 以及 HTTPS 服务的 /v1/version、/swagger/ui 等。
6、存储过程与安装 (Stored Procedures & Install)¶
6.1 存储过程 OUT/INOUT 参数¶
存储过程现在支持使用 OUT 和 INOUT 参数模式返回结果集(针对非复杂数据类型)。
6.2 安装脚本跳过 RPM 复制¶
安装脚本新增 --no-rpm-copy 选项。
- 用途:跳过向集群各节点复制 RPM 包的耗时步骤。前提是 RPM 包必须已存在于
--hosts指定的各节点上,并通过--rpm-path提供本地路径。