跳转至

Vertica 集成 H2O Flow

概述

H2O Flow 是 H2O 的 Web 用户界面,H2O 是一个开源机器学习和人工智能平台。使用 H2O Flow,可以捕获、重新运行、注释、呈现和分享 H2O 工作流。可以交互式地导入文件、构建和调整模型,并根据模型进行预测。

最新测试版本

软件 版本
H2O H2O 3.42.0.3
平台 Red Hat Enterprise Linux release 8.8
Vertica 客户端 Vertica JDBC 23.3
Vertica 服务器 Vertica Database 23.3

安装 Vertica 客户端驱动

H2O Flow 使用 Vertica JDBC 驱动连接 Vertica:

  1. 导航到 Vertica 网站的 Client Drivers 页面。
  2. 下载 JDBC 驱动包。

下载和启动 H2O Flow

前提条件:需要 Java 7 或更高版本。

  1. 在 H2O 网站点击 Download H2O 下载 H2O zip 文件。
  2. 解压文件:
    cd ~/Downloads
    unzip h2o-3.42.0.3.zip
    cd h2o-3.42.0.3
    
  3. 将 Vertica JDBC jar 文件复制到 ~/Downloads/h2o-3.42.0.3 目录,启动 H2O Flow:
    java -cp h2o.jar:vertica-jdbc-23.3.0-0.jar water.H2OApp
    
  4. 在浏览器中打开 H2O Flow:
    http://<IP_Address>:54321
    

连接 H2O Flow 到 Vertica

1、在 H2O Flow 中,选择 ImportSQLTable 将 SQL 表导入 H2O。

截图

2、提供连接 URL、用户名和密码连接到 Vertica。

3、提供要从中导入数据的表名称。

截图

4、点击 Import 加载数据。

截图

5、导入成功后,点击 View 查看 H2O Flow 中的数据框。

截图

截图

已知限制

  • INTERVALTIMESTAMPTZUUIDBINARYLONGVARBINARYVARBINARY 数据类型不显示,返回警告消息并将数据作为 null 加载到 H2O。
  • TIMETZ 数据类型的时区不显示。
  • NUMERIC 数据类型:小数点左侧最多 16 位、右侧最多 4 位的数值会四舍五入。
  • TIMEDATETIMESTAMPTIMETZ 数据类型以毫秒为单位显示 EPOCH 时间戳。

参考


原文来源:https://www.vertica.com/kb/H2O_CG/Content/Partner/H2O_CG.htm