Vertica 集成 H2O Flow¶
概述¶
H2O Flow 是 H2O 的 Web 用户界面,H2O 是一个开源机器学习和人工智能平台。使用 H2O Flow,可以捕获、重新运行、注释、呈现和分享 H2O 工作流。可以交互式地导入文件、构建和调整模型,并根据模型进行预测。
最新测试版本¶
| 软件 | 版本 |
|---|---|
| H2O | H2O 3.42.0.3 |
| 平台 | Red Hat Enterprise Linux release 8.8 |
| Vertica 客户端 | Vertica JDBC 23.3 |
| Vertica 服务器 | Vertica Database 23.3 |
安装 Vertica 客户端驱动¶
H2O Flow 使用 Vertica JDBC 驱动连接 Vertica:
- 导航到 Vertica 网站的 Client Drivers 页面。
- 下载 JDBC 驱动包。
下载和启动 H2O Flow¶
前提条件:需要 Java 7 或更高版本。
- 在 H2O 网站点击 Download H2O 下载 H2O zip 文件。
- 解压文件:
- 将 Vertica JDBC jar 文件复制到
~/Downloads/h2o-3.42.0.3目录,启动 H2O Flow: - 在浏览器中打开 H2O Flow:
连接 H2O Flow 到 Vertica¶
1、在 H2O Flow 中,选择 ImportSQLTable 将 SQL 表导入 H2O。

2、提供连接 URL、用户名和密码连接到 Vertica。
3、提供要从中导入数据的表名称。

4、点击 Import 加载数据。

5、导入成功后,点击 View 查看 H2O Flow 中的数据框。


已知限制¶
- INTERVAL、TIMESTAMPTZ、UUID、BINARY、LONGVARBINARY 和 VARBINARY 数据类型不显示,返回警告消息并将数据作为 null 加载到 H2O。
- TIMETZ 数据类型的时区不显示。
- NUMERIC 数据类型:小数点左侧最多 16 位、右侧最多 4 位的数值会四舍五入。
- TIME、DATE、TIMESTAMP 和 TIMETZ 数据类型以毫秒为单位显示 EPOCH 时间戳。
参考¶
原文来源:https://www.vertica.com/kb/H2O_CG/Content/Partner/H2O_CG.htm