跳转至

23.4.x New Features

23.4版本发布时间:2023年10月

1、数据导出与复制 (Data Export and Replication)

1.1 源端发起的服务器复制

现在支持从源数据库主动发起基于服务器的复制。

  • 操作方式:与目标端发起的复制类似,但需要在源数据库连接目标数据库,并在调用 REPLICATE 时通过 TO 子句指定目标数据库。

2、数据加载 (Data Load)

2.1 新文件自动加载

引入数据加载器(Data Loader)机制,可自动从指定路径加载新文件,无需手动干预。

  • 优势:相比使用外部表,直接加载到 ROS 表可节省对象存储的 API 成本。
  • 机制:加载器绑定路径与目标表,自动尝试加载未处理过的文件,并具备重试限制以防止畸形文件导致死循环。支持通过存储过程定期调度执行。

2.2 ORC 解析器支持宽松模式匹配

ORC 解析器新增宽松模式匹配功能,行为与 Parquet 一致。

  • 特性:允许仅选择所需列并忽略其他列,不再强制要求消耗所有列或严格遵循列顺序。
  • 要求:表中的列名必须与数据中的列名匹配,且数据类型必须匹配或可转换。

2.3 任意分区路径支持

扩展了分区剪枝功能,不再局限于 Hive 风格的分区数据。

  • 功能:支持从任意分区路径(如 /data/2023/01)加载和剪枝。Vertica 能自动从路径中提取值(如年份、月份),并在查询时跳过不需要的分区目录。

3、机器学习 (Machine Learning)

3.1 卡方独立性检验

新增 CHI_SQUARED 函数,用于计算两个分类变量的条件卡方独立性检验,以评估变量间独立的概率,并支持基于其他变量集进行条件测试。

3.2 ARIMA 模型支持差分

ARIMA 模型现在支持差分操作,用于消除或减少时间序列数据中的趋势。

  • 配置:通过将积分参数 d 设置为 1 到 10 之间的整数,指定差分阶数。

4、管理控制台 (Management Console)

4.1 界面全面重构

管理控制台(MC)进行了显著的 UI/UX 升级,旨在提供更一致的用户体验。

  • 首页仪表盘: redesigned 后的首页作为信息中心,展示各数据库和子集群的关键详情,并提供快捷操作入口。
  • 工具栏与导航:采用新的多级面板设计,区分系统级导航和特定区域导航,工具栏集成了告警、语言选择及用户操作等快捷入口。

4.2 GCP 自定义镜像

支持为 Google Cloud Platform (GCP) 创建自定义 MC 镜像。

  • 流程:基于发布的 MC 镜像创建实例 -> 添加依赖或修改配置 -> 制作新镜像。该镜像可用于创建或恢复子集群。

5、安全与认证 (Security and Authentication)

5.1 无密码认证

CONNECT TO VERTICA 命令现在支持省略用户密码,通过以下方式认证:

  • 凭据转发:将当前用户的密码转发至目标数据库。
  • TLS 认证:使用 TLS 进行身份验证。

5.2 端点免认证

部分文档和健康检查端点不再需要认证,包括 NMA 的 /api-docs//v1/health 以及 HTTPS 服务的 /v1/version/swagger/ui 等。

6、存储过程与安装 (Stored Procedures & Install)

6.1 存储过程 OUT/INOUT 参数

存储过程现在支持使用 OUTINOUT 参数模式返回结果集(针对非复杂数据类型)。

6.2 安装脚本跳过 RPM 复制

安装脚本新增 --no-rpm-copy 选项。

  • 用途:跳过向集群各节点复制 RPM 包的耗时步骤。前提是 RPM 包必须已存在于 --hosts 指定的各节点上,并通过 --rpm-path 提供本地路径。