跳转至

Vertica 集成 IBM SPSS Statistics

连接指南

关于 Vertica 连接指南

Vertica 连接指南提供将第三方合作伙伴产品连接到 Vertica 的基本说明。连接指南基于我们针对特定版本的 Vertica 和合作伙伴产品的测试。

Vertica 和 IBM SPSS Statistics:测试版本

本文档基于使用以下版本的测试:

软件 版本
合作伙伴产品 IBM SPSS Statistics 28
桌面平台 Windows Server 2016 Standard
Vertica 客户端 Vertica ODBC 11.0.0-0
Vertica 服务器 Vertica Analytic Database 11.0.0-0

IBM SPSS Statistics 概述

IBM SPSS Statistics 是一个强大的统计工具,用于从数据中获得洞察。它还提供计算和机器学习能力。它具有用户友好的界面,允许您快速计算大型复杂数据集。其高级统计程序确保高精度,帮助您做出更明智的决策。

安装 IBM SPSS Statistics

要下载和安装 IBM SPSS Statistics,请参考 Downloading IBM SPSS Statistics 28.0

安装 Vertica 客户端驱动

IBM SPSS Statistics 使用 Vertica ODBC 驱动连接到您的 Vertica 数据库。

  1. 访问 Vertica Client Drivers 页面。
  2. 下载与 Vertica 服务器版本兼容的 ODBC Vertica 客户端包。

    注意:有关客户端和服务器兼容性的详细信息,请参阅 Vertica 文档中的 Client Driver and Server Version Compatibility

  3. 双击安装程序并按照提示操作。当提示选择一个或多个驱动时,仅选择 ODBC。
  4. 按照 Installing the Client Drivers and Tools on Windows 中的安装说明操作。
  5. 按照 Creating an ODBC Data Source Name (DSN) 中的描述创建 ODBC DSN。

连接 IBM SPSS Statistics 到 Vertica

  1. 打开 IBM SPSS Statistics。
  2. 点击 Login with IBM ID。使用您在安装工具时创建的 IBM ID。
  3. 输入您注册时使用的电子邮件地址,点击 Continue(继续)。
  4. 输入密码并点击 Log in(登录)。
  5. 选择 New Dataset(新数据集),点击 Open(打开)。
  6. 点击 File > Import Data > Database > New Query(文件 > 导入数据 > 数据库 > 新建查询)以建立到 Vertica 数据库的连接。
  7. 选择您在创建 DSN 时创建的 ODBC 数据源,并选择所需的表类型。点击 Next(下一步)。
  8. 从可用表列表中选择表,点击箭头将选中的表列移动到 Retrieve Fields(检索字段)列表。点击 Next
  9. 要限制从数据库表中获取的记录数,您可以根据 Fields 列表中的列使用 Criteria(条件)列表中的不同选项。点击 Next
  10. 将显示列数据类型。在 Result Variable Name(结果变量名称)列表中,您可以双击列以更改其名称,该名称将显示在结果集中。点击 Next
  11. Database Wizard(数据库向导)将显示将执行以获取所需数据的查询。您可以根据需要编辑查询。选择 Retrieve the data I have selected(检索我选择的数据),点击 Finish(完成)。
  12. 结果集将显示在 IBM SPSS Statistics 中。

故障排查

字符串数据在显示时被截断

问题:当数据大小超过默认限制(255 字节,相当于 128 个字符)时,IBM SPSS Statistics 会显示以下字符串数据截断错误:

[Vertica][ODBC] (10160) String data right truncation: String data is too big for the output data buffer and has been truncated.

解决方案:要解决此错误,请重新导入数据库表,并将可变宽度字符串字段的 Width 值从 255 更改为小于或等于 32767 的值(这是该工具支持的最大字节数)。

截图

已知限制

  • CHAR、VARCHAR 和 LONG VARCHAR:最多支持 16383 个字符。
  • INTEGER 和 DOUBLE:最多支持 15 位数字,超出后值被四舍五入。
  • DECIMAL:最多支持 15 位数字,超出后值被四舍五入。
  • INTERVALSECOND、INTERVALMONTH、BINARY、VARBINARY、LONG VARBINARY 和 UUID:不支持。
  • DATE:支持的最小日期为 1800-01-01。
  • TIME 和 TIMESTAMP:不支持毫秒。
  • TIMETZ 和 TIMESTAMP TZ:不支持毫秒和时区偏移。

更多信息


原文来源:https://www.vertica.com/kb/IBM_SPSS_Statistics_CG/Content/Partner/IBM_SPSS_Statistics_CG.htm