Vertica 集成 Pentaho Business Analytics¶
连接指南¶
关于 Vertica 连接指南¶
Vertica 连接指南提供将第三方合作伙伴产品连接到 Vertica 的基本说明。连接指南基于我们针对特定版本的 Vertica 和合作伙伴产品的测试。
Vertica 和 Pentaho Business Analytics:测试版本¶
| 软件 | 版本 |
|---|---|
| 合作伙伴产品 | Pentaho Business Analytics Enterprise Edition 9.2 |
| 组件 | Dashboard、Analysis Report、Report Designer |
| 桌面平台 | Microsoft Windows Server 2016(64 位) |
| Vertica 客户端 | Vertica JDBC Driver 11.1 |
| Vertica 服务器 | Vertica Server 11.1 |
Pentaho Business Analytics Server 概述¶
Pentaho 是一个提供数据移动和转换工具的平台,以及通过 Pentaho Data Integration 和 Pentaho Business Analytics 产品进行数据发现和即席报表的功能。本指南重点介绍该平台的商业分析组件。有关 ETL 的更多信息,请参阅 Pentaho PDI Tips and Techniques 文档。
安装 Pentaho Business Analytics (BA) 平台¶
- 访问 https://www.hitachivantara.com/en-us/products/pentaho-plus-platform/data-integration-analytics/download-pentaho.html。
- 向下滚动,点击 START YOUR TRIAL!。
- 填写表单,点击 DOWNLOAD FREE TRIAL。
- 将下载的 .exe 文件保存到计算机上。
- 双击安装程序 .exe,按照提示进行安装。
安装 Vertica 客户端驱动¶
Pentaho BA 使用 Vertica JDBC 驱动连接到 Vertica。Vertica JDBC jar 文件应放置在以下位置:
- 访问 Vertica 网站上的 Client Drivers 页面。
- 下载 JDBC 驱动包。
注意:有关客户端和服务器兼容性的详细信息,请参阅 Vertica 文档中的 Client Driver and Server Version Compatibility。
- 复制您下载的 JAR 文件。
- 找到 Pentaho 的安装目录。
- 将 Vertica JAR 文件粘贴到指定位置:
| 组件 | JAR 文件位置 |
|---|---|
| Analysis Report 和 Dashboard | C:\<Pentaho>\server\pentaho-server\tomcat\lib |
| Report Designer | C:\<Pentaho>\design-tools\report-designer\lib |
- 重启 Pentaho BA 服务器。
连接 Pentaho Business Analytics 到 Vertica¶
- 启动 Pentaho BA 服务器后,打开 Web 浏览器,访问 http://localhost:8080/pentaho/Login。这是运行 Tomcat 服务器的默认 BA 服务器 URL。
- 将打开 Pentaho User Console。点击 Login as an Evaluator。
- 在 Administrator 下,点击 Go。
- 使用用户名 "admin" 和密码 "password" 登录。
- 要设置指向 Vertica 数据库的数据源,点击 Manage Data Sources(管理数据源)按钮。
- 点击齿轮图标,选择 New Connection(新建连接)。
- 命名连接,并输入以下信息连接到数据库:
- Database type(数据库类型):Vertica 5+
- Access(访问方式):Native (JDBC)
- Host Name(主机名):Vertica 服务器名称或 IP 地址
- Database Name(数据库名称):您的数据库名称
- Port Number(端口号):默认端口为 5433
- User Name(用户名):您的 Vertica 用户名
- Password(密码):您的数据库密码
- 要验证连接是否成功,点击 Test(测试)。
- 在左侧面板中,点击 Options(选项)。
- 输入高级连接属性以启用 JDBC 设置,如会话标签和连接负载均衡。
- 点击 OK 关闭窗口。将列出新连接。
创建 Vertica 数据源¶
创建连接后,在创建报表/仪表板之前,需要指定包含分析所需信息的数据源。
- 使用浏览器登录 Pentaho User Console:http://localhost:8080/pentaho/Home。
- 在主页上,点击 Create New > Data Source(新建 > 数据源)。将打开数据源向导。
- 输入以下信息:
- Data Source Name(数据源名称):您的数据源名称。
- Source Type(源类型):选择 SQL Query(SQL 查询)以指定自定义查询,或选择 Database Table(s)(数据库表)以选择表。
- 如果使用 SQL Query,在左侧面板选择 Vertica 连接,在右侧面板输入自定义查询。
- 如果使用 Database Table(s),从连接列表中选择 Vertica 连接的名称,选择 Create data source for 选项。点击 Next(下一步)选择表并指定它们之间的连接。
- 点击 Finish(完成)完成过程。
- 数据源将列在 Manage Data Sources 下。您现在可以在 Pentaho Business Analytics Platform 的各个组件中使用此 Vertica 数据源。
创建报表/仪表板¶
我们使用 Pentaho Dashboard、Analysis Report 和 Report Designer 创建了报表。
Pentaho Dashboard¶
- 在浏览器中登录 Pentaho User Console:http://localhost:8080。
- 在主页上,点击 Create New > Dashboard(新建 > 仪表板)。
- 将出现 Dashboard 环境页面。
- 根据需求选择 Templates(模板)和 Themes(主题)。
- 选择 Insert content 图标,为表格格式结果选择数据表。选择之前创建的数据源。
- 将出现 Query Editor(查询编辑器)。
- 根据输入选择列,点击 Preview(预览),然后点击 OK。
- 现在您可以在屏幕上看到结果。
Pentaho Analysis Report¶
- 在浏览器中登录 Pentaho User Console:http://localhost:8080。
- 在主页上,点击 Create New > Analysis Report(新建 > 分析报表)。
- 这将列出所有可用的数据源。
- 选择您为报表创建的数据源之一。
- 在分析主页上,根据输入拖放列。
- 根据需求从右上角选择格式。
Pentaho Report Designer¶
- 从开始菜单打开 Pentaho Report Designer(Pentaho 报表设计器)。
- 从菜单选择 File > New(文件 > 新建)创建空白报表。
- 从菜单选择 Data > Add Data Source > JDBC(数据 > 添加数据源 > JDBC)。将打开 JDBC Data Source 窗口。
- 在 Connections 下,点击 '+' 图标添加新的 Vertica 连接。将打开 Database Connection 窗口。
- 在 Database Connection 窗口的 General 选项卡中,输入连接详细信息:
- Connection name(连接名称):连接的名称
- Connection type(连接类型):选择 Vertica 5+
- Access(访问方式):选择 Native (JDBC)
- Host Name(主机名):Vertica 服务器名称或 IP 地址
- Database Name(数据库名称):您的数据库名称
- Port Number(端口号):默认端口为 5433
- User Name(用户名):您的 Vertica 用户名
- Password(密码):您的数据库密码
- 在 Options 选项卡中,输入高级连接属性以启用 JDBC 设置,如会话标签和连接负载均衡。
- 点击 Test(测试)测试连接,然后点击 OK。
- 连接将列在 JDBC Data Source 窗口的 Connections 下。
- 在 JDBC Data Source 窗口中,在 Available Queries 下点击 '+' 图标添加新查询。
- 点击 OK 关闭窗口。
- 创建报表并发布到 Pentaho Report Server。
已知限制¶
Pentaho Dashboard¶
- INTEGER:最多支持 16 位数字。
- NUMERIC:最多支持 15 位数字,超出后值被四舍五入。
- DOUBLE:小数点后值被截断。
- TIME、TIMESTAMP、TIMETZ 和 TIMESTAMPTZ:不支持。
- BINARY、VARBINARY 和 LONG VARBINARY:以未知格式显示。
Pentaho Analysis Report¶
- NUMERIC:最多支持 308 位数字,超出后显示错误。
- TIME 和 TIMETZ:不支持毫秒。
- BINARY:不支持,会显示不正确的值。可以将值转换为十六进制以正确显示。
Pentaho Report Designer¶
- 最小 DOUBLE 值:不支持,显示为 0。预览数据时可看到完整值。
- TIME 和 TIMESTAMP:不显示毫秒。
- TIMETZ 和 TIMESTAMPTZ:不显示毫秒和时区值。
- BINARY、VARBINARY 和 LONG VARBINARY:不支持。显示对象而非值。
更多信息¶
原文来源:https://www.vertica.com/kb/Vertica-Integration-with-Pentaho-Business-Analytics/Content/Partner/Vertica-Integration-with-Pentaho-Business-Analytics.htm