用于数据可视化和分析的开源 BI 工具元数据库

用于数据可视化和分析的开源 BI 工具元数据库

源节点: 3085489

介绍

您是一位热衷于探索新工具的数据专业人士吗?尝试 Metabase,一个开源的 商业智能 (BI) 工具 用于从大型数据集创建交互式仪表板。在当今数据驱动的世界中,Metabase 等 BI 平台对于提取见解和促进明智决策至关重要。在本为数据专业人员量身定制的指南中探索 Metabase 的强大功能。

学习目标

  • 了解元数据库的必要术语和概念
  • 使用该工具分析数据、创建视觉效果和交互式仪表板
  • 重点介绍 Metabase 开源版及其关键组件的显着功能
  • 解释元数据库管理活动,包括用户和组管理

这篇文章是作为 数据科学博客马拉松。

目录

Metabase 是一种商业智能工具,可以托管在云端或本地。它有开源版和企业版。利用Metabase BI,用户可以高效地连接到各种数据库、分析数据并快速构建和部署仪表板。开源版本提供了一系列功能,包括与 15 个以上 DBMS 的连接、用户和组管理、交互式仪表板、警报、仪表板订阅以及对 CRUD 操作的支持。本文阐述了 Metabase BI 工具的关键概念和有用功能。

本指南重点讨论 Metabase,它提供开源 (AGPL) 和企业级许可证,特别强调其在 Windows 环境中的应用程序。最新版本 V0.48(截至 23 年 11 月)作为 Java 存档文件 (Jar) 分发,需要 Java XNUMX 或更高版本作为运行最新元数据库版本的先决条件。本文深入介绍了安装过程,并重点介绍了 Metabase 开源版本的主要功能。

第一步:下载Metabase.Jar

从 Metabase GitHub 存储库下载 Metabase 开源版本。获取最新版本的Metabase.Jar 相关信息.

第二步:启动配置数据库

放置下载好的 元数据库.jar 文件放在一个文件夹中,只需双击 Jar 文件即可启动 Metabase。 

Or

使用命令提示符运行 Metbase.Jar。导航到 Metabase.Jar 所在的目录并运行“Java -jar Metabase.Jar”

示例: 考虑到 Metabase.jar 文件存在于文件夹“C:UsersTools”中。相同的命令如下:

C:UsersTools> Java -jar Metabase.Jar

您可以在元数据库启动时观察它的日志。

等待几分钟并登录 http://localhost:3000/ 使用任何流行的网络浏览器的 url 

请注意: 默认情况下,Metabase 使用 H2 嵌入式数据库作为应用程序数据库。对于生产,请使用三个数据库(MySql、PostgreSQL 或 MariaDB)之一配置 Metabase。

第一次时,配置数据库会提示初始设置选项 (语言首选项、用户 ID 和密码设置以及数据源设置)。设置完成后,您可以看到Metabase的主屏幕。

  • 左窗格 – 显示可用的集合(文件夹)和示例数据源
  • 右上 – 用于创建问题和仪表板的设置和选项“新建”
元数据库用户界面

元数据库的特点

元数据库的特点

集合、问题和仪表板

购物 Metabase 中是存储问题、模型和仪表板的位置。 Collections相当于文件夹,可以在其中创建子文件夹。

每个用户的个人收藏

Metabase 中的每个用户都会有一个特定的个人收藏,用户可以在其中存储他们的问题、模型和仪表板。其他用户无法访问个人收藏中存储的内容。

项目征集  

单个 Metabase 实例可以为多个项目提供服务。每个项目的内容都可以存储在专用集合中,仅特定项目用户可以访问。

可以通过选项创建新集合 新品>>收藏

元数据库:创建新集合
元数据库:创建新集合

注: 元数据库管理员拥有查看、修改和存档每个集合(包括用户个人集合)中的内容的完全权限。

有疑问吗?

Metabase 中的术语“问题”是指单个视觉元素。它可以是条形图、折线图、地图或元数据库中支持的 17 种图表中的任何一种。您可以通过以下方式创建问题:

  • 使用可视化查询生成器
  • 自定义 SQL 查询

使用可视化查询生成器

在右上角,单击选项“新建”>>“问题”,然后选择您要探索的数据源

使用可视化查询生成器

可视化查询生成器支持连接、创建新列、过滤、摘要、分组依据、排序和行限制操作。您可以在每次操作后预览结果。

备注 :后端的元数据库将为每个问题构建SQL。

 自定义 SQL 查询

如果摘要编辑器中的选项不满足您的要求,您可以根据业务需要编辑问题并修改 SQL。此过程称为“SQL 问题”,其中用户提供的 SQL 被转换为问题。您可以通过选择“新建”>>“SQL 查询”来创建新的 SQL 问题。

自定义 SQL 查询 |元数据库

创建问题后,将其保存到集合中并将其添加到仪表板。

卖家专用后台 

仪表板是一个页面,它将多个问题与公共业务上下文分组。

仪表板|元数据库

仪表板的组成部分

  • 标签:仪表板可以有一个或多个通过公共过滤器连接的选项卡 
  • 有疑问吗?:仪表板中的单独视觉元素 
  • 筛选:过滤器可以控制加载到每个问题中的数据(例如:按国家/地区过滤)
  • 文本/标题:能够添加描述、来自 URL 的图像。支持 Markdown
  • 点击行为:控制仪表板交互性的相关选项 
  • 仪表板中的其他选项:数据刷新、邮件订阅、下载数据并导出为PDF

过滤器和点击行为

交互式仪表板

在仪表板选项卡中排列必要的问题,并通过配置过滤器和单击行为来添加交互性。

交互式仪表板 |元数据库

仪表板中的过滤器

将一个或多个过滤器添加到仪表板。配置仪表板中的每个过滤器以控制一个或多个问题。添加过滤器后,将其映射到仪表板上的每个问题。在后端,Metabase 在 SQL 中添加 WHERE 子句。

仪表板中的过滤器

将过滤器映射到问题的步骤

  1. 单击右上角的过滤器图标并选择相关的过滤器类型。
  2. 所选过滤器类型将添加到仪表板标题中。
  3. 单击各个过滤器中的设置按钮。显示仪表板的视觉布局,其中包含每个问题中的可用列的列表。
  4. 将问题中的相关列映射到步骤 1 中选择的过滤器。
  5. 映射列的不同值将在“过滤器”选项卡中可见。

点击行为

“点击行为”是指在查看仪表板时选择/点击视觉的一部分或片段时执行的操作。 

示例: 单击行为可以配置为选择条形图中的条形段,单击世界地图中的区域。可以在每个问题中进行配置。当仪表板处于编辑模式时,您可以在每个问题的右上角访问此选项。

点击行为

点击行为操作

  1. 向下钻取以查看图表中单击部分或段的数据记录
  2. 导航到另一个仪表板、导航到问题并使用 URL 导航到外部网站
  3. 更新任何可用的仪表板过滤器。这允许在仪表板中实现交叉过滤。通过有效设置点击行为,可以使仪表板对用户来说具有交互性和直观性。

仪表板部署和其他有用的功能

创建仪表板并将其存储在集合中后,任何具有“查看”权限的用户都可以访问它。仪表板或问题可以通过其 URL 直接访问。

元数据库的其他显着功能 

  1. 使用模型中的操作在表中执行 CRUD 操作。
  2. 为每个仪表板配置自动刷新。
  3. 在问题中配置警报。
  4. 从问题中下载 .CSV、.JSON 或 .XLSX 格式的结果数据。
  5. 下载 .PNG 格式的问题和 .PDF 文件格式的仪表板。
  6. 通过电子邮件或 Slack 订阅仪表板。

默认情况下,管理员权限适用于最初设置元数据库的用户。默认管理员可以进一步添加其他元数据库用户,并在必要时为他们提供管理员角色。可以通过单击右上角的“齿轮图标”从“管理设置”访问元数据库管理选项。

配置数据源

元数据库管理员有权在管理设置中的“数据库”选项下配置新的数据源

配置数据源:

用户和组管理

以下是可以在“人员”选项下的管理设置中执行的可能操作:

  1. 查看所有活动配置数据库用户的列表和停用用户的列表。
  2. 添加用户并将其映射到现有配置数据库组。
  3. 从组中删除用户或停用用户并重新激活用户。
  4. 创建新组、管理现有组(在组中添加或删除用户)。
  5. 查看或编辑用户详细信息并重置用户密码。

注: 可以将用户映射到一个或多个配置数据库组

权限管理

“人员”选项用于管理用户及其组,而管理设置下的“权限”选项用于管理集合、组和数据库之间的权限 

收集许可 

在子选项“集合”下。以下是组可以映射到集合的不同权限级别

  • 策展: 具有 Curate 权限的组的用户可以添加、编辑、查看、归档集合中的任何内容并创建子集合,并且可以将内容移出或移至集合。
  • 看法: 具有查看权限的组只能查看集合的内容,无法添加或修改内容。
  • 无法访问: 无法查看集合本身,也无法访问其中的任何项目。

数据许可

将组映射到数据库的各种权限级别包括:

  1. 无限制: 组中的用户可以使用查询生成器从数据库中的任何表创建问题。
  2. 粒状: 使用查询生成器只能访问数据库中的特定表。管理员有权为每个表配置该权限。
  3. 无自助服务: 组中的用户无法使用图形查询生成器,也无法查看数据。
  4. 本机查询编辑: 当与不受限制的权限一起启用时,可以使用本机 SQL 创建问题。

其他元数据库管理活动包括

  1. 检查最新更新并从嵌入式 H2 数据库迁移。
  2. 使用 Google 或 LDAP 配置电子邮件、Slack 和身份验证设置。
  3. 配置数据库以进行 CSV 上传。
  4. 各个列的数据类型映射和格式设置。
  5. 用于启用元数据库嵌入和公共共享的其他高级设置。

结论

Metabase 的简单性和直观的 UI 使其成为数据专业人员易于使用的 BI 工具。 Metabase 的开源版本包含商业智能工具的所有基本功能,并且每个主要版本中都添加了新功能。组织可以首先尝试并适应 Metabase 的开源版本。随着需求和用户群的增长,可以轻松切换到 Metabase 提供的任何企业版本。本文旨在提供概述并重点介绍 Metabase 的关键组件。未来的文章将深入探讨 Metabase 的其他有趣且有用的功能。

关键要点

  1. Metabase 是一种开源 BI 工具,为数据专业人员提供交互式仪表板。
  2. 了解元数据库术语、分析数据、创建视觉效果并探索管理活动。
  3. 使用 Java 11+ 在 Windows 上安装 Metabase,具有用户友好的 UI 和基本功能。
  4. 创建具有过滤器、点击行为和交互式功能的仪表板,以进行富有洞察力的数据探索。
  5. 管理员管理用户、权限和配置,使 Metabase 具有适应性和用户友好性。

常见问题

Q1。 我可以免费使用元数据库吗?

答:是的,Metabase 提供免费开源版本,具有用于数据分析和仪表板创建的基本商业智能功能。

Q2。 Metabase 是 BI 工具吗?

答:当然,Metabase 是一种商业智能 (BI) 工具,旨在连接数据库、分析数据和构建交互式仪表板。

Q3。 Metabase 是开源的吗?

答:是的,Metabase 是开源的,用户可以免费访问其 BI 功能、用户和组管理以及交互式仪表板功能。

Q4。 Metabase 是数据可视化工具吗?

答:事实上,Metabase 是一种数据可视化工具,允许用户创建图表和图形等视觉效果,以从数据集中获取见解。

本文中显示的媒体不属于 Analytics Vidhya 所有,其使用由作者自行决定。

时间戳记:

更多来自 分析维迪亚