Vertica 集成 IBM SPSS Statistics¶
连接指南¶
关于 Vertica 连接指南¶
Vertica 连接指南提供将第三方合作伙伴产品连接到 Vertica 的基本说明。连接指南基于我们针对特定版本的 Vertica 和合作伙伴产品的测试。
Vertica 和 IBM SPSS Statistics:测试版本¶
本文档基于使用以下版本的测试:
| 软件 | 版本 |
|---|---|
| 合作伙伴产品 | IBM SPSS Statistics 28 |
| 桌面平台 | Windows Server 2016 Standard |
| Vertica 客户端 | Vertica ODBC 11.0.0-0 |
| Vertica 服务器 | Vertica Analytic Database 11.0.0-0 |
IBM SPSS Statistics 概述¶
IBM SPSS Statistics 是一个强大的统计工具,用于从数据中获得洞察。它还提供计算和机器学习能力。它具有用户友好的界面,允许您快速计算大型复杂数据集。其高级统计程序确保高精度,帮助您做出更明智的决策。
安装 IBM SPSS Statistics¶
要下载和安装 IBM SPSS Statistics,请参考 Downloading IBM SPSS Statistics 28.0。
安装 Vertica 客户端驱动¶
IBM SPSS Statistics 使用 Vertica ODBC 驱动连接到您的 Vertica 数据库。
- 访问 Vertica Client Drivers 页面。
- 下载与 Vertica 服务器版本兼容的 ODBC Vertica 客户端包。
注意:有关客户端和服务器兼容性的详细信息,请参阅 Vertica 文档中的 Client Driver and Server Version Compatibility。
- 双击安装程序并按照提示操作。当提示选择一个或多个驱动时,仅选择 ODBC。
- 按照 Installing the Client Drivers and Tools on Windows 中的安装说明操作。
- 按照 Creating an ODBC Data Source Name (DSN) 中的描述创建 ODBC DSN。
连接 IBM SPSS Statistics 到 Vertica¶
- 打开 IBM SPSS Statistics。
- 点击 Login with IBM ID。使用您在安装工具时创建的 IBM ID。
- 输入您注册时使用的电子邮件地址,点击 Continue(继续)。
- 输入密码并点击 Log in(登录)。
- 选择 New Dataset(新数据集),点击 Open(打开)。
- 点击 File > Import Data > Database > New Query(文件 > 导入数据 > 数据库 > 新建查询)以建立到 Vertica 数据库的连接。
- 选择您在创建 DSN 时创建的 ODBC 数据源,并选择所需的表类型。点击 Next(下一步)。
- 从可用表列表中选择表,点击箭头将选中的表列移动到 Retrieve Fields(检索字段)列表。点击 Next。
- 要限制从数据库表中获取的记录数,您可以根据 Fields 列表中的列使用 Criteria(条件)列表中的不同选项。点击 Next。
- 将显示列数据类型。在 Result Variable Name(结果变量名称)列表中,您可以双击列以更改其名称,该名称将显示在结果集中。点击 Next。
- Database Wizard(数据库向导)将显示将执行以获取所需数据的查询。您可以根据需要编辑查询。选择 Retrieve the data I have selected(检索我选择的数据),点击 Finish(完成)。
- 结果集将显示在 IBM SPSS Statistics 中。
故障排查¶
字符串数据在显示时被截断¶
问题:当数据大小超过默认限制(255 字节,相当于 128 个字符)时,IBM SPSS Statistics 会显示以下字符串数据截断错误:
[Vertica][ODBC] (10160) String data right truncation: String data is too big for the output data buffer and has been truncated.
解决方案:要解决此错误,请重新导入数据库表,并将可变宽度字符串字段的 Width 值从 255 更改为小于或等于 32767 的值(这是该工具支持的最大字节数)。

已知限制¶
- CHAR、VARCHAR 和 LONG VARCHAR:最多支持 16383 个字符。
- INTEGER 和 DOUBLE:最多支持 15 位数字,超出后值被四舍五入。
- DECIMAL:最多支持 15 位数字,超出后值被四舍五入。
- INTERVALSECOND、INTERVALMONTH、BINARY、VARBINARY、LONG VARBINARY 和 UUID:不支持。
- DATE:支持的最小日期为 1800-01-01。
- TIME 和 TIMESTAMP:不支持毫秒。
- TIMETZ 和 TIMESTAMP TZ:不支持毫秒和时区偏移。
更多信息¶
原文来源:https://www.vertica.com/kb/IBM_SPSS_Statistics_CG/Content/Partner/IBM_SPSS_Statistics_CG.htm