跳转至

Vertica RAID 存储方案

原文:RAID Storage for Vertica

Vertica 存储选项

Vertica 支持的存储选项包括:

  • 内部硬件存储阵列
  • SAN(存储区域网络)
  • NAS(网络附加存储)
  • DAS(直连存储)机箱

每种存储选项应向集群中的每个主机提供一个单一的本地文件系统。此外,存储必须根据 Vertica 知识库中 Vertica Hardware Guide 推荐的指南提供足够的带宽。

Vertica 采用高并发、横向扩展的 shared-nothing 集群架构。虽然某些集群环境可以使用共享存储设备,但对于 Vertica 来说,共享存储会显著限制性能

本文帮助你理解不同 RAID 存储选项之间的性价比权衡。选择共享存储是一个重要决策,因为某些设备会影响性能。

RAID 存储

RAID 架构对比

下图展示了 RAID 0、RAID 1+0、RAID 5 和 RAID 5+0 架构之间的主要差异。每种 RAID 架构将多个独立磁盘组合成操作系统看到的单个逻辑卷。除 RAID 0 外,所有 RAID 选项都提供一定程度的磁盘保护。

RAID 5 Vertica Newest

RAID 不是数据备份的一种形式。RAID 提高的是磁盘故障时存储阵列的可用性。在任何服务器或存储系统中,机械磁盘比 CPU 或内存芯片更容易发生故障。请务必按照 Vertica 文档中 备份与恢复数据库 的说明定期备份数据。

RAID 存储方案选择

每种 RAID 存储方案在成本、性能和可用性之间提供不同的平衡。没有任何 RAID 方案能同时优化这三者。下表描述了每种方案及其优缺点。

注意: 硬件选型和组合涉及磁盘、RAID 控制器、服务器和操作系统的广泛搭配。请始终查阅 硬件与虚拟机配置资源 获取最新推荐。

RAID 方案 优点 缺点 说明
RAID 0 成本低、I/O 性能好 无数据保护 不要对 Vertica 集群使用 RAID 0。选择其他 RAID 方案。
RAID 1+0 磁盘故障时数据保护、整体性能好、磁盘重建时间短、写性能好
RAID 5 磁盘故障时数据保护、可用容量高、相比同容量 RAID 1+0 成本更低 写性能差、磁盘重建时间长、重建期间性能下降、校验数据损坏时存在数据损坏风险、同一 RAID 组中可能发生多盘故障 如果选择 RAID 5,应配备热备盘以应对 RAID 组中需要替换的故障磁盘。
RAID 5+0 磁盘故障时数据保护、RAID 0 条带化、性能/成本/可用性/容量的平衡 并非所有硬件 RAID 阵列都支持

硬件 RAID vs 软件 RAID?

对于 Vertica 集群,应使用带有专用控制器的硬件 RAID。 硬件 RAID 控制器管理一组磁盘,并将其作为单个大卷呈现给主机。

软件 RAID 将 RAID 任务置于操作系统和 CPU 上运行。软件 RAID 会给 Vertica 主机带来显著开销——高达 40%——因此不适合 Vertica。此外,软件 RAID 的性能低于专用硬件 RAID 控制器。在软件 RAID 配置中,操作系统管理每个独立磁盘,导致 CPU 负载增加。

在虚拟环境中,由于磁盘设备大小可能受限,使用软件 RAID 可能是合适的。

推荐的 RAID 配置

下图展示了 Vertica 节点的推荐大小和卷配置(以 HPE ProLiant DL380 Gen9 24-SFF 服务器为例):

RAID 10 Vertica New1

每个节点包含两个内部镜像磁盘,用于存放操作系统、/opt 目录下的 Vertica 软件以及 catalog 磁盘。操作系统磁盘可使用 300 GB 或 600 GB 的磁盘,采用 RAID 1 镜像。

/data 卷通常容量为 6–10 TB,使用最多 24 块磁盘构建为 RAID 1+0。Vertica 数据库文件存放在此区域。I/O 性能非常重要,每个 CPU 核心至少应达到 60–80 MB/s 的吞吐量。例如,24 核节点应提供 1.4 GB/s 到 1.9 GB/s 的读写 I/O 吞吐量。

缓存设置

对于 HPE P840 PCIe 卡,将读缓存设为 10%写缓存设为 90%。对于其他类型的存储,始终运行 vioperf(Vertica I/O 性能测试)来验证每种配置。

块大小

256 KB 到 512 KB 的大块顺序 I/O 读取效果最佳。8–32 KB 的小块适用于事务性工作负载,但不适合 Vertica 数据库。

扩展阅读