24.2.x New Features¶
24.2版本发布时间:2024年4月
一、容器与 Kubernetes 集成 (Containers and Kubernetes)¶
1. 基础设施与安全¶
- AWS Secrets Manager 集成:VerticaDB Operator 现在支持直接访问 AWS Secrets Manager,实现敏感信息的统一管理。
- OpenShift 支持:兼容 OpenShift 的 restricted-v2 SCC 策略,这是目前最严格的 SCC 策略,增强了在 OpenShift 环境下的安全性。
- NMA 边车容器:Node Management Agent (NMA) 现以边车容器形式运行,通过 REST API 供 Operator 管理集群。
2. 自定义资源定义 (CRD) 增强¶
- VerticaRestorePointsQuery (Beta):这是一个 Beta 功能,用于从归档中检索还原点,以便将数据库恢复或回滚到先前状态。参数包括
restorePoint.archive、id和index。 - VerticaScrutinize:用于运行 scrutinize 工具收集诊断信息,便于技术支持团队解决问题。
- 命名空间作用域:通过 Helm charts 部署时,可配置 Operator 仅监听特定命名空间内的资源(需设置
controllers.enable和controllers.scope参数)。
3. 数据摄取¶
- 容器化 Kafka 调度器:提供 Helm chart 形式的 Kafka 调度器,可自动将数据从 Kafka 加载到 Vertica 表中。
二、数据加载与存储 (Data Load & Storage)¶
1. 自动化加载¶
- AWS SQS 触发器:数据加载器支持处理 SQS 队列消息。当 S3 存储桶中添加新文件时,Vertica 可根据队列事件自动运行
EXECUTE DATA LOADER。 - Iceberg 格式支持:
CREATE EXTERNAL TABLE ICEBERG现在同时支持 Iceberg 元数据格式的 版本 1 和版本 2。
2. 存储配置¶
- S3 代理支持:Vertica 现在支持通过代理访问 S3,相关参数包括
S3Proxy和S3BucketConfig中的 proxy 字段。
三、数据库管理与 API (Database Management)¶
1. HTTPS 管理端点增强¶
新增或增强了多个 REST API Endpoint,用于精细化监控和管理:
| 端点路径 | 功能描述 | 返回关键信息 |
|---|---|---|
/v1/node/connections |
查看节点连接数 | 总连接数、用户会话、初始化连接数 |
/v1/subclusters/{name}/drain |
排出子集群连接 | 支持 {"cancel": false/true} 控制排出状态 |
/v1/subscriptions |
查看节点分片订阅 | 订阅状态 (ACTIVE/PENDING 等)、是否为主订阅 |
/v1/nodes |
查看节点存储路径 | data_path (数据/临时路径)、depot_path (仓库路径) |
2. 路由规则更新¶
支持通过 ALTER ROUTING RULE 语句动态地向路由规则中添加或移除子集群。
四、备份恢复与驱动 (Backup & Drivers)¶
1. vbr 目标命名空间自动创建¶
在执行 vbr 恢复或复制任务时,若 --target-namespace 参数指定的命名空间不存在,系统将自动创建该命名空间(采用源命名空间的分片数量)。
2. ADO.NET 驱动 OAuth 支持¶
- 简化配置:ADO.NET 驱动仅需提供一个由客户端获取的 Access Token。
- 外部处理:令牌刷新等流程需由驱动外部处理。
- 未来计划:JDBC 和 ODBC 驱动将在后续版本中采用类似方案。
五、机器学习 (Machine Learning)¶
1.偏最小二乘法 (PLS) 回归支持¶
Vertica 现已支持 PLS 回归模型,这是一种结合了主成分分析 (PCA) 和线性回归特性的算法。
- 算法原理:提取一组潜在成分以解释预测变量与响应变量之间尽可能多的协方差,并利用这些成分进行回归预测。
- 适用场景:特别适用于预测变量数量多于观测值数量,或预测变量之间存在高度共线性的情况。在这些普通线性回归难以收敛的场景下,PLS 能有效构建准确模型。
- 相关函数:
PLS_REG用于模型训练,PREDICT_PLS_REG用于预测。
2.向量自回归 (VAR) 支持¶
Vertica 现已支持 VAR 模型,用于捕捉多个时间序列变量随时间变化的动态关系。
- 算法优势:与仅考虑单变量的 AR 模型不同,VAR 模型包含了不同变量之间的反馈机制,能分析变量在滞后时间步长上的相互作用。
- 智能执行:
AUTOREGRESSOR函数具备自适应能力:- 单值列:自动执行自回归 (AR)。
- 多值列:自动执行向量自回归 (VAR)。
- 预测函数:使用
PREDICT_AUTOREGRESSOR进行预测。
六、安全与认证 (Security and Authentication)¶
1.OAuth2 安全配置参数增强¶
针对即时 (JIT:just-in-time) 配置用户,新增了更细粒度的安全配置参数:
OAuth2JITRolesClaimName:识别 IdP 角色声明,自动分配默认角色(替代了旧的OAuth2JITClient)。OAuth2JITGroupsClaimName:识别 IdP 组声明,自动分配组角色。OAuth2JITForbiddenRoles:在自动分配过程中限制特定角色。
2.OAuth 认证与 JWT 自动角色分配¶
- 认证参数:提供了
groups_claim_name、oauth2_jit_authorized_roles、role_group_suffix、roles_claim_name等参数,用于配置支持 JIT 的 OAuth 认证记录。 - JWT 支持:支持为使用 JWT 验证类型认证记录的 JIT 用户自动分配角色。
3.LDAP Link 固定时间表¶
LDAP Link 服务引入了 LDAPLinkCron 参数,支持基于 Cron 表达式的固定时间表,作为 LDAPLinkInterval 的替代方案。
- 机制区别:
LDAPLinkInterval基于上次完成时间计算下次运行时间(相对间隔),而LDAPLinkCron允许指定精确的绝对运行时间,不受上次任务耗时影响。 - 示例:
ALTER DATABASE DEFAULT SET LDAPLinkCron='0 19 */2 * *';(每月2号 19:00 运行)。
️ 七、存储过程 (Stored Procedures)¶
1.调度步骤与范围¶
调度功能现已升级,支持在 Cron 表达式中使用步长(steps-指定间隔频率)和范围(ranges-指定连续区间),提供了更灵活的任务执行计划配置。