跳转至

Vertica 集成 Pentaho Business Analytics

连接指南

关于 Vertica 连接指南

Vertica 连接指南提供将第三方合作伙伴产品连接到 Vertica 的基本说明。连接指南基于我们针对特定版本的 Vertica 和合作伙伴产品的测试。

Vertica 和 Pentaho Business Analytics:测试版本

软件 版本
合作伙伴产品 Pentaho Business Analytics Enterprise Edition 9.2
组件 Dashboard、Analysis Report、Report Designer
桌面平台 Microsoft Windows Server 2016(64 位)
Vertica 客户端 Vertica JDBC Driver 11.1
Vertica 服务器 Vertica Server 11.1

Pentaho Business Analytics Server 概述

Pentaho 是一个提供数据移动和转换工具的平台,以及通过 Pentaho Data Integration 和 Pentaho Business Analytics 产品进行数据发现和即席报表的功能。本指南重点介绍该平台的商业分析组件。有关 ETL 的更多信息,请参阅 Pentaho PDI Tips and Techniques 文档。

安装 Pentaho Business Analytics (BA) 平台

  1. 访问 https://www.hitachivantara.com/en-us/products/pentaho-plus-platform/data-integration-analytics/download-pentaho.html。
  2. 向下滚动,点击 START YOUR TRIAL!
  3. 填写表单,点击 DOWNLOAD FREE TRIAL
  4. 将下载的 .exe 文件保存到计算机上。
  5. 双击安装程序 .exe,按照提示进行安装。

安装 Vertica 客户端驱动

Pentaho BA 使用 Vertica JDBC 驱动连接到 Vertica。Vertica JDBC jar 文件应放置在以下位置:

  1. 访问 Vertica 网站上的 Client Drivers 页面。
  2. 下载 JDBC 驱动包。

    注意:有关客户端和服务器兼容性的详细信息,请参阅 Vertica 文档中的 Client Driver and Server Version Compatibility

  3. 复制您下载的 JAR 文件。
  4. 找到 Pentaho 的安装目录。
  5. 将 Vertica JAR 文件粘贴到指定位置:
组件 JAR 文件位置
Analysis Report 和 Dashboard C:\<Pentaho>\server\pentaho-server\tomcat\lib
Report Designer C:\<Pentaho>\design-tools\report-designer\lib
  1. 重启 Pentaho BA 服务器。

连接 Pentaho Business Analytics 到 Vertica

  1. 启动 Pentaho BA 服务器后,打开 Web 浏览器,访问 http://localhost:8080/pentaho/Login。这是运行 Tomcat 服务器的默认 BA 服务器 URL。
  2. 将打开 Pentaho User Console。点击 Login as an Evaluator
  3. Administrator 下,点击 Go
  4. 使用用户名 "admin" 和密码 "password" 登录。
  5. 要设置指向 Vertica 数据库的数据源,点击 Manage Data Sources(管理数据源)按钮。
  6. 点击齿轮图标,选择 New Connection(新建连接)。
  7. 命名连接,并输入以下信息连接到数据库:
  8. Database type(数据库类型):Vertica 5+
  9. Access(访问方式):Native (JDBC)
  10. Host Name(主机名):Vertica 服务器名称或 IP 地址
  11. Database Name(数据库名称):您的数据库名称
  12. Port Number(端口号):默认端口为 5433
  13. User Name(用户名):您的 Vertica 用户名
  14. Password(密码):您的数据库密码
  15. 要验证连接是否成功,点击 Test(测试)。
  16. 在左侧面板中,点击 Options(选项)。
  17. 输入高级连接属性以启用 JDBC 设置,如会话标签和连接负载均衡。
  18. 点击 OK 关闭窗口。将列出新连接。

创建 Vertica 数据源

创建连接后,在创建报表/仪表板之前,需要指定包含分析所需信息的数据源。

  1. 使用浏览器登录 Pentaho User Console:http://localhost:8080/pentaho/Home。
  2. 在主页上,点击 Create New > Data Source(新建 > 数据源)。将打开数据源向导。
  3. 输入以下信息:
  4. Data Source Name(数据源名称):您的数据源名称。
  5. Source Type(源类型):选择 SQL Query(SQL 查询)以指定自定义查询,或选择 Database Table(s)(数据库表)以选择表。
  6. 如果使用 SQL Query,在左侧面板选择 Vertica 连接,在右侧面板输入自定义查询。
  7. 如果使用 Database Table(s),从连接列表中选择 Vertica 连接的名称,选择 Create data source for 选项。点击 Next(下一步)选择表并指定它们之间的连接。
  8. 点击 Finish(完成)完成过程。
  9. 数据源将列在 Manage Data Sources 下。您现在可以在 Pentaho Business Analytics Platform 的各个组件中使用此 Vertica 数据源。

创建报表/仪表板

我们使用 Pentaho Dashboard、Analysis Report 和 Report Designer 创建了报表。

Pentaho Dashboard

  1. 在浏览器中登录 Pentaho User Console:http://localhost:8080。
  2. 在主页上,点击 Create New > Dashboard(新建 > 仪表板)。
  3. 将出现 Dashboard 环境页面。
  4. 根据需求选择 Templates(模板)和 Themes(主题)。
  5. 选择 Insert content 图标,为表格格式结果选择数据表。选择之前创建的数据源。
  6. 将出现 Query Editor(查询编辑器)。
  7. 根据输入选择列,点击 Preview(预览),然后点击 OK
  8. 现在您可以在屏幕上看到结果。

Pentaho Analysis Report

  1. 在浏览器中登录 Pentaho User Console:http://localhost:8080。
  2. 在主页上,点击 Create New > Analysis Report(新建 > 分析报表)。
  3. 这将列出所有可用的数据源。
  4. 选择您为报表创建的数据源之一。
  5. 在分析主页上,根据输入拖放列。
  6. 根据需求从右上角选择格式。

Pentaho Report Designer

  1. 从开始菜单打开 Pentaho Report Designer(Pentaho 报表设计器)。
  2. 从菜单选择 File > New(文件 > 新建)创建空白报表。
  3. 从菜单选择 Data > Add Data Source > JDBC(数据 > 添加数据源 > JDBC)。将打开 JDBC Data Source 窗口。
  4. 在 Connections 下,点击 '+' 图标添加新的 Vertica 连接。将打开 Database Connection 窗口。
  5. 在 Database Connection 窗口的 General 选项卡中,输入连接详细信息:
  6. Connection name(连接名称):连接的名称
  7. Connection type(连接类型):选择 Vertica 5+
  8. Access(访问方式):选择 Native (JDBC)
  9. Host Name(主机名):Vertica 服务器名称或 IP 地址
  10. Database Name(数据库名称):您的数据库名称
  11. Port Number(端口号):默认端口为 5433
  12. User Name(用户名):您的 Vertica 用户名
  13. Password(密码):您的数据库密码
  14. 在 Options 选项卡中,输入高级连接属性以启用 JDBC 设置,如会话标签和连接负载均衡。
  15. 点击 Test(测试)测试连接,然后点击 OK
  16. 连接将列在 JDBC Data Source 窗口的 Connections 下。
  17. 在 JDBC Data Source 窗口中,在 Available Queries 下点击 '+' 图标添加新查询。
  18. 点击 OK 关闭窗口。
  19. 创建报表并发布到 Pentaho Report Server。

已知限制

Pentaho Dashboard

  • INTEGER:最多支持 16 位数字。
  • NUMERIC:最多支持 15 位数字,超出后值被四舍五入。
  • DOUBLE:小数点后值被截断。
  • TIME、TIMESTAMP、TIMETZ 和 TIMESTAMPTZ:不支持。
  • BINARY、VARBINARY 和 LONG VARBINARY:以未知格式显示。

Pentaho Analysis Report

  • NUMERIC:最多支持 308 位数字,超出后显示错误。
  • TIME 和 TIMETZ:不支持毫秒。
  • BINARY:不支持,会显示不正确的值。可以将值转换为十六进制以正确显示。

Pentaho Report Designer

  • 最小 DOUBLE 值:不支持,显示为 0。预览数据时可看到完整值。
  • TIME 和 TIMESTAMP:不显示毫秒。
  • TIMETZ 和 TIMESTAMPTZ:不显示毫秒和时区值。
  • BINARY、VARBINARY 和 LONG VARBINARY:不支持。显示对象而非值。

更多信息


原文来源:https://www.vertica.com/kb/Vertica-Integration-with-Pentaho-Business-Analytics/Content/Partner/Vertica-Integration-with-Pentaho-Business-Analytics.htm