跳转至

Vertica 集成 Alation:连接指南

适用于 Vertica 7.x

关于 Vertica 文档

Vertica 连接文档提供关于设置从第三方供应商软件到 Vertica 的连接的基本信息。这些文档基于一个特定版本的 Vertica 和一个版本的第三方软件提供指导。其他版本的第三方产品可能可以与 Vertica 配合使用,但可能尚未经过测试。

概述

与 Vertica 数据库集成后,Alation 的数据可访问性平台提供协作分析、有效数据治理、数据搜索和发现以及数据优化方面的解决方案。

数据分析师可以使用优化的查询工具更快地发现数据和编写查询。该工具包括 SmartSuggest(基于查询模式建议表)、表采样和数据文档的语义搜索等功能。

数据仓库管理员可以审查其 Vertica 实例中的数据使用情况,以进行数据优化、使用分析和审计,并增强安全性。

数据分析师可以通过自动化的数据治理跟踪文档进度并识别数据使用情况,从而提高分析人员的工作效率和合规性。

所有员工都可以通过语义数据搜索和发现所有表和查询,加速获得洞察的时间。

本文档帮助您了解如何利用 Alation 获得对数据使用情况的洞察。

Alation 使用与 Vertica 的连接自动创建数据字典,计算哪些数据库对象被用户执行的查询最频繁使用,并提供协作知识共享和查询编写环境。

本文档假设读者熟悉 Alation 和 Vertica。

本文档基于 Alation 2.08 与 Vertica 7.x 的测试结果。

开始之前

在将 Alation 连接到 Vertica 之前,必须安装 Alation 软件。Alation 随附了 Vertica 6.1.3 JDBC 驱动程序,因此无需下载。安装 Alation 后,即可在 Sign In 页面登录并创建到 Vertica 数据库的连接。

将 Alation 连接到 Vertica

  1. 点击 Add Data Source 创建新连接
  2. 从 Select a Database Type 下拉列表中选择 Vertica
  3. 在 Register a new database 窗口中,输入主机名或 IP 地址以及 Vertica 数据库名称和标题。Alation 使用数据库标题作为到 Vertica 的连接名称
  4. 点击 Add 将 Vertica 数据库注册到 Alation
  5. 注册数据库后,选择 Metadata Extraction 选项卡。输入 Vertica 凭据并点击 Save
  6. 点击 Fetch from DB Now 导入数据库的元数据。Alation 提交一个提取 Vertica 所有模式详细信息的作业。在 Metadata Extraction 选项卡上监控作业状态直到完成
  7. 提取元数据后,Alation 会对每个数据库对象进行分析。默认情况下,分析会跳过所有视图。如果希望 Alation 分析视图,在 Per-Object Parameters 选项卡中取消勾选 Skip Views
  8. 选择 Data Profiling 选项卡,点击 Launch Job Now 开始分析数据库
  9. 在 Data Profiling 选项卡上监控数据分析作业。分析完成后,Alation 显示 Vertica 数据库对象的元数据

使用 Alation 计算数据库对象流行度

Alation 将数据库对象的"流行度"定义为某些模式、表和列在用户运行的查询中被使用的频率。Alation 将流行度计算为用户查询访问给定模式、表或列的次数。

提取 Vertica 数据库元数据到 Alation 后,Popularity 字段最初为空。

要使 Alation 能够计算流行度,需要首先保存用户查询的信息。

存储查询信息

在 Vertica 数据库中创建一个表,该表包含来自两个系统表的信息:DC_REQUEST_ISSUED 和 QUERY_REQUESTS。

=> DROP TABLE alation_qrylog_table;
=> SELECT * INTO alation_qrylog_table
FROM (
  SELECT ri.session_id, ri.user_name, qr.start_timestamp, qr.end_timestamp, 
         qr.request_duration_ms, ri.request_id, ri.request
  FROM v_internal.dc_requests_issued ri
  JOIN v_monitor.query_requests qr
    ON ri.transaction_id = qr.transaction_id 
   AND ri.request_id = qr.request_id 
   AND ri.session_id = qr.session_id
  WHERE date(start_timestamp) > ?
) AS alation_querylog;

-- alation user is a non-admin user
=> GRANT SELECT ON alation_qrylog_table TO alation_user;

配置查询日志摄入

在 Query Log Ingestion 选项卡上,配置 Alation 从 Vertica 检索以下信息:

  • 指定存储查询信息的数据表(上述示例中的 alation_qrylog_table)
  • 指定是手动摄入查询,还是按日、按周或按月调度查询日志摄入

建议在 Vertica 数据库不处于高负载时安排查询日志摄入。

完成后,Alation 在模式、表和列级别显示流行度。这有助于识别最常使用和最不常使用的数据库对象。

例如,Alation 可以显示:

  • 用户查询对 public 模式的访问频率高于其他模式
  • 查询对 product_dimension 表的访问频率高于其他表
  • 在 product_dimension 表中,最常访问的列是:department_description、fat_content、product_price

更多信息

有关 Alation 如何与 Vertica 配合使用的更多信息,请访问 www.alation.com。


原文来源:https://www.vertica.com/kb/HP-Vertica-Integration-with-Alation-Connection-Guide/Content/Partner/HP-Vertica-Integration-with-Alation-Connection-Guide.htm