Siêu dữ liệu công cụ BI mã nguồn mở để phân tích và trực quan hóa dữ liệu

Siêu dữ liệu công cụ BI mã nguồn mở để phân tích và trực quan hóa dữ liệu

Nút nguồn: 3085489

Giới thiệu

Bạn có phải là chuyên gia dữ liệu đam mê khám phá các công cụ mới không? Hãy thử Metabase, một nguồn mở Công cụ Business Intelligence (BI) để tạo bảng thông tin tương tác từ các tập dữ liệu lớn. Trong thế giới dựa trên dữ liệu ngày nay, các nền tảng BI như Metabase rất cần thiết để thu thập thông tin chi tiết và tạo điều kiện cho việc ra quyết định sáng suốt. Khám phá sức mạnh của Metabase trong hướng dẫn này được thiết kế riêng cho các chuyên gia dữ liệu.

Mục tiêu học tập

  • Hiểu các thuật ngữ và khái niệm cần thiết về Metabase
  • Sử dụng công cụ Phân tích dữ liệu, Tạo hình ảnh & Bảng điều khiển tương tác
  • Làm nổi bật các tính năng đáng chú ý của phiên bản Nguồn mở Metabase và thành phần chính của nó
  • Giải thích các hoạt động quản trị Metabase bao gồm quản lý người dùng và nhóm

Bài báo này đã được xuất bản như một phần của Blogathon Khoa học Dữ liệu.

Mục lục

Metabase, một công cụ kinh doanh thông minh, có thể được lưu trữ trên đám mây hoặc tại chỗ. Nó có phiên bản mã nguồn mở và Enterprise. Bằng cách sử dụng Metabase BI, người dùng có thể kết nối hiệu quả với nhiều cơ sở dữ liệu khác nhau, phân tích dữ liệu cũng như nhanh chóng xây dựng và triển khai trang tổng quan. Phiên bản nguồn mở cung cấp nhiều tính năng, bao gồm khả năng kết nối với hơn 15 DBMS, quản lý người dùng và nhóm, bảng thông tin tương tác, cảnh báo, đăng ký bảng thông tin và hỗ trợ các hoạt động CRUD. Bài viết này làm sáng tỏ các khái niệm chính và các tính năng hữu ích của công cụ Metabase BI.

Hướng dẫn này tập trung thảo luận về Metabase, cung cấp cả giấy phép Nguồn mở (AGPL) và Cấp doanh nghiệp, đặc biệt nhấn mạnh vào ứng dụng của nó trong môi trường Windows. Phiên bản mới nhất, V0.48 (kể từ ngày 23 tháng 11), phân phối dưới dạng tệp Lưu trữ Java (Jar), ​​yêu cầu Java XNUMX trở lên làm điều kiện tiên quyết để chạy các phiên bản Metabase mới nhất. Bài viết cung cấp thông tin chi tiết về quá trình cài đặt và nêu bật các tính năng chính của phiên bản nguồn mở của Metabase.

Bước I: Tải xuống Metabase.Jar

Tải xuống phiên bản mã nguồn mở Metabase từ kho lưu trữ Metabase GitHub. Lấy phiên bản mới nhất của Metabase.Jar tại đây.

Bước II: Khởi động Metabase

Đặt phần đã tải xuống Metabase.Jar trong một thư mục và chỉ cần nhấp đúp vào tệp Jar để Metabase khởi động. 

Or

Sử dụng dấu nhắc lệnh để chạy Metbase.Jar. Điều hướng đến thư mục chứa Metabase.Jar và chạy “Java -jar Metabase.Jar”

Ví dụ: Xem xét tệp Metabase.jar có trong thư mục “C:UsersTools”. Lệnh tương tự ở bên dưới:

C:UsersTools> Java -jar Metabase.Jar

Bạn có thể xem nhật ký Metabase khi nó khởi động.

Đợi vài phút và đăng nhập http://localhost:3000/ url bằng bất kỳ trình duyệt web phổ biến nào 

Lưu ý: Theo mặc định, Metabase sử dụng Cơ sở dữ liệu nhúng H2 làm DB ứng dụng. Để sản xuất, hãy định cấu hình Metabase bằng một trong ba cơ sở dữ liệu (MySql, PostgreSQL hoặc MariaDB).

Tùy chọn nhắc nhở Metabase lần đầu tiên cho thiết lập ban đầu (Tùy chọn ngôn ngữ, thiết lập ID người dùng và mật khẩu và thiết lập DataSource). Sau khi Thiết lập hoàn tất, bạn có thể thấy Màn hình chính của Metabase.

  • Ngăn bên trái – Hiển thị Bộ sưu tập có sẵn (thư mục) và Nguồn dữ liệu mẫu
  • Trên cùng bên phải – Cài đặt và tùy chọn “Mới” để tạo Câu hỏi và Bảng điều khiển
Giao diện người dùng siêu dữ liệu

Tính năng của Metabase

Tính năng của Metabase

Bộ sưu tập, câu hỏi và bảng điều khiển

Bộ sưu tập trong Metabase là nơi lưu trữ Câu hỏi, Mô hình & Bảng điều khiển. Bộ sưu tập tương đương với thư mục, bạn có thể tạo các thư mục con trong đó.

Bộ sưu tập cá nhân cho mọi người dùng

Mỗi Người dùng trong Metabase sẽ có Bộ sưu tập cá nhân cụ thể nơi người dùng có thể lưu trữ Câu hỏi, Mô hình & Trang tổng quan của họ. Người dùng khác không thể truy cập nội dung được lưu trữ trong Bộ sưu tập cá nhân.

Bộ sưu tập cho dự án  

Một phiên bản Metabase có thể phục vụ nhiều dự án. Nội dung của mỗi dự án có thể được lưu trữ trong một bộ sưu tập chuyên dụng, chỉ những người dùng dự án cụ thể mới có thể truy cập được.

Bộ sưu tập mới có thể được tạo từ tùy chọn Mới >> Bộ sưu tập

Metabase: Tạo bộ sưu tập mới
Metabase: Tạo bộ sưu tập mới

Chú thích : Quản trị viên Metabase có toàn quyền Xem, Sửa đổi và Lưu trữ nội dung trong mọi bộ sưu tập, bao gồm cả bộ sưu tập cá nhân của người dùng.

Câu hỏi

Thuật ngữ “Câu hỏi” trong Metabase đề cập đến một yếu tố Hình ảnh Cá nhân. Nó có thể là Biểu đồ thanh hoặc Biểu đồ đường hoặc Biểu đồ bản đồ hoặc bất kỳ biểu đồ nào trong số 17 Biểu đồ được hỗ trợ trong Metabase. Bạn có thể tạo câu hỏi theo những cách sau:

  • Sử dụng Trình tạo truy vấn trực quan
  • Truy vấn SQL tùy chỉnh

Sử dụng Trình tạo truy vấn trực quan

Ở trên cùng bên phải, nhấp vào tùy chọn “Mới” >> “Câu hỏi”, Sau đó chọn Nguồn dữ liệu bạn muốn khám phá

Sử dụng Trình tạo truy vấn trực quan

Trình tạo truy vấn trực quan hỗ trợ các thao tác Tham gia, tạo cột mới, Lọc, Tóm tắt, Nhóm theo, Sắp xếp và Giới hạn hàng. Bạn có thể xem trước kết quả sau mỗi thao tác.

Chú thích : Metabase ở phần phụ trợ sẽ đóng khung SQL cho mọi câu hỏi.

 Truy vấn SQL tùy chỉnh

Nếu các tùy chọn trong trình soạn thảo Tóm tắt không đáp ứng yêu cầu của bạn, bạn có thể chỉnh sửa câu hỏi và sửa đổi SQL theo nhu cầu kinh doanh. Quá trình này được gọi là “Câu hỏi SQL”, trong đó SQL do người dùng cung cấp được chuyển đổi thành câu hỏi. Bạn có thể tạo Câu hỏi SQL mới bằng cách chọn “Mới” >> “Truy vấn SQL”.

Truy vấn SQL tùy chỉnh | Siêu dữ liệu

Sau khi bạn tạo câu hỏi, hãy lưu câu hỏi đó vào bộ sưu tập và thêm nó vào trang tổng quan.

Bảng Điều Khiển (Dashboard) 

Trang tổng quan là một trang nhóm nhiều câu hỏi với bối cảnh kinh doanh chung.

Trang tổng quan | Siêu dữ liệu

Các thành phần của Bảng điều khiển

  • Các Nhãn (Tabs): Bảng điều khiển có thể có một hoặc nhiều tab được kết nối bằng Bộ lọc chung 
  • Câu hỏi: Phần tử trực quan riêng lẻ trong Bảng điều khiển 
  • Bộ lọc: Bộ lọc có thể kiểm soát Dữ liệu được tải vào Mỗi Câu hỏi (Ví dụ: Lọc theo Quốc gia)
  • Văn bản/Tiêu đề: Khả năng thêm Mô tả, Hình ảnh từ URL. Hỗ trợ Markdown
  • Hành vi nhấp chuột: Các tùy chọn được đề cập kiểm soát tính tương tác của Trang tổng quan 
  • Các tùy chọn khác trong Bảng điều khiển: Làm mới dữ liệu, Đăng ký email, Tải xuống dữ liệu và xuất sang PDF

Bộ lọc và hành vi nhấp chuột

Bảng điều khiển tương tác

Sắp xếp các câu hỏi cần thiết trong Tab Trang tổng quan và thêm tính tương tác bằng cách định cấu hình bộ lọc và hành vi nhấp chuột.

Bảng điều khiển tương tác | Siêu dữ liệu

Bộ lọc trong Trang tổng quan

Thêm một hoặc nhiều bộ lọc vào trang tổng quan. Định cấu hình từng bộ lọc trong trang tổng quan để kiểm soát một hoặc nhiều câu hỏi. Sau khi thêm bộ lọc, hãy ánh xạ bộ lọc đó tới từng câu hỏi trên trang tổng quan. Trong phần phụ trợ, Metabase thêm mệnh đề WHERE trong SQL.

Bộ lọc trong Trang tổng quan

Các bước để ánh xạ bộ lọc tới câu hỏi

  1. Nhấp vào biểu tượng Bộ lọc ở trên cùng bên phải và chọn loại bộ lọc phù hợp.
  2. Loại bộ lọc đã chọn sẽ được thêm vào tiêu đề trang tổng quan.
  3. Nhấp vào nút cài đặt trong bộ lọc riêng lẻ. Bố cục trực quan của trang tổng quan được hiển thị cùng với danh sách các cột có sẵn trong mỗi câu hỏi.
  4. Ánh xạ cột có liên quan trong câu hỏi tới bộ lọc đã chọn từ bước 1.
  5. Các giá trị riêng biệt của cột được ánh xạ sẽ hiển thị trong tab Bộ lọc.

Hành vi nhấp chuột

“Hành vi nhấp chuột” đề cập đến một thao tác được thực hiện khi một phần hoặc phân đoạn Hình ảnh được chọn/nhấp vào trong khi Xem Trang tổng quan. 

Ví dụ: Nhấp vào Hành vi có thể được định cấu hình để Chọn phân đoạn thanh trong Biểu đồ thanh, Nhấp vào Khu vực trên Bản đồ Thế giới. Nó có thể được cấu hình trong mỗi câu hỏi. Bạn có thể truy cập tùy chọn này ở góc trên cùng bên phải của mọi câu hỏi khi bảng điều khiển ở chế độ chỉnh sửa.

Hành vi nhấp chuột

Bấm vào hành vi hoạt động

  1. Xem chi tiết để xem bản ghi dữ liệu cho phần hoặc phân đoạn được nhấp vào trong biểu đồ
  2. Điều hướng đến Trang tổng quan khác, Điều hướng đến Câu hỏi & Điều hướng đến trang web bên ngoài bằng URL
  3. Cập nhật bất kỳ Bộ lọc trang tổng quan nào có sẵn . Điều này cho phép triển khai lọc chéo trong Trang tổng quan. Bằng cách thiết lập hiệu quả Hành vi nhấp chuột, Trang tổng quan có thể được tạo tính tương tác & trực quan cho người dùng.

Triển khai bảng điều khiển và các tính năng hữu ích khác

Sau khi bạn tạo và lưu trữ trang tổng quan trong bộ sưu tập, bất kỳ người dùng nào có quyền “Xem” đều có thể truy cập trang tổng quan đó. Trang tổng quan hoặc câu hỏi có thể được truy cập trực tiếp qua URL của nó.

Các tính năng đáng chú ý khác của Metabase 

  1. Thực hiện các thao tác CRUD trong bảng bằng các hành động trong mô hình.
  2. Định cấu hình tự động làm mới cho mọi bảng điều khiển.
  3. Cấu hình cảnh báo trong câu hỏi.
  4. Tải xuống dữ liệu kết quả dưới dạng .CSV, .JSON hoặc .XLSX từ một câu hỏi.
  5. Tải xuống câu hỏi dưới dạng .PNG và trang tổng quan dưới dạng tệp .PDF.
  6. Đăng ký bảng điều khiển qua email hoặc Slack.

Theo mặc định, quyền Quản trị viên được áp dụng cho người dùng thiết lập Metabase ban đầu. Quản trị viên mặc định có thể thêm những người dùng Metabase khác và cung cấp cho họ Vai trò quản trị viên nếu cần. Có thể truy cập tùy chọn Quản trị viên Metabase từ “Cài đặt quản trị viên” bằng cách nhấp vào “Biểu tượng bánh răng” ở trên cùng bên phải.

Định cấu hình nguồn dữ liệu

Quản trị viên Metabase có quyền định cấu hình Nguồn dữ liệu mới trong tùy chọn “Cơ sở dữ liệu” trong Cài đặt quản trị viên

Cấu hình nguồn dữ liệu:

Quản lý người dùng và nhóm

Dưới đây là các thao tác có thể thực hiện được trong Cài đặt quản trị trong tùy chọn “Mọi người”:

  1. Xem danh sách tất cả người dùng Metabase đang hoạt động và Danh sách người dùng bị hủy kích hoạt.
  2. Thêm người dùng và ánh xạ họ vào Nhóm Metabase hiện có.
  3. Xóa người dùng khỏi nhóm hoặc Vô hiệu hóa người dùng & Kích hoạt lại người dùng.
  4. Tạo nhóm mới, quản lý nhóm hiện có (Thêm hoặc xóa người dùng khỏi nhóm).
  5. Xem hoặc chỉnh sửa chi tiết người dùng và đặt lại mật khẩu cho người dùng.

Chú thích : Một người dùng có thể được ánh xạ tới một hoặc nhiều Nhóm Metabase

Quản lý quyền

Trong khi tùy chọn “Mọi người” dùng để quản lý người dùng và Nhóm của họ, thì tùy chọn “Quyền” trong cài đặt Quản trị viên dùng để quản lý quyền giữa Bộ sưu tập, Nhóm & Cơ sở dữ liệu 

Quyền thu thập 

Trong tùy chọn phụ “Bộ sưu tập”. Dưới đây là các cấp Quyền khác nhau mà một Nhóm có thể được ánh xạ vào bộ sưu tập

  • Lựa chọn : Người dùng của Nhóm có quyền Quản lý có thể thêm, chỉnh sửa, Xem, lưu trữ bất kỳ nội dung nào trong bộ sưu tập và tạo bộ sưu tập phụ, đồng thời có thể di chuyển nội dung từ hoặc đến bộ sưu tập.
  • Lượt xem: Nhóm có quyền Xem chỉ có thể Xem nội dung của bộ sưu tập, không thể thêm hoặc sửa đổi nội dung.
  • Không truy cập : Không thể xem chính bộ sưu tập và không thể truy cập bất kỳ mục nào trong đó.

Quyền dữ liệu

Các mức cấp phép khác nhau để ánh xạ một nhóm tới cơ sở dữ liệu bao gồm:

  1. không giới hạn: Người dùng trong nhóm có thể sử dụng trình tạo truy vấn để tạo câu hỏi từ bất kỳ bảng nào trong cơ sở dữ liệu.
  2. Dạng hạt: Chỉ có thể truy cập các bảng cụ thể trong cơ sở dữ liệu bằng trình tạo truy vấn. Quản trị viên có quyền định cấu hình quyền này cho mỗi bảng.
  3. Không tự phục vụ: Người dùng trong nhóm không thể sử dụng trình tạo truy vấn đồ họa và không thể xem dữ liệu.
  4. Chỉnh sửa truy vấn gốc: Khi được bật cùng với quyền không hạn chế, các câu hỏi có thể được tạo bằng SQL gốc.

Các hoạt động quản trị Metabase khác bao gồm

  1. Kiểm tra các bản cập nhật mới nhất và di chuyển từ cơ sở dữ liệu H2 được nhúng.
  2. Định cấu hình thiết lập Email, Slack và xác thực bằng Google hoặc LDAP.
  3. Định cấu hình Cơ sở dữ liệu để tải lên CSV.
  4. Ánh xạ và định dạng kiểu dữ liệu cho các cột riêng lẻ.
  5. Cài đặt nâng cao khác để bật tính năng nhúng Metabase và chia sẻ công khai.

Kết luận

Tính đơn giản và giao diện người dùng trực quan của Metabase khiến nó trở thành công cụ BI dễ dàng thích ứng cho các chuyên gia dữ liệu. Phiên bản mã nguồn mở của Metabase bao gồm tất cả các chức năng thiết yếu của một công cụ kinh doanh thông minh, với các tính năng mới được thêm vào trong mỗi bản phát hành chính. Ban đầu, các tổ chức có thể thử và thích ứng với phiên bản nguồn mở của Metabase. Khi nhu cầu và cơ sở người dùng tăng lên, bạn có thể dễ dàng chuyển đổi sang bất kỳ phiên bản doanh nghiệp nào mà Metabase cung cấp. Bài viết này nhằm mục đích cung cấp cái nhìn tổng quan và nêu bật các thành phần chính của Metabase. Các bài viết tiếp theo sẽ đi sâu vào các tính năng thú vị và hữu ích khác của Metabase.

Những con đường chính

  1. Metabase là một công cụ BI nguồn mở hỗ trợ các bảng thông tin tương tác dành cho các chuyên gia dữ liệu.
  2. Hiểu các thuật ngữ Metabase, phân tích dữ liệu, tạo hình ảnh và khám phá các hoạt động của quản trị viên.
  3. Cài đặt Metabase trên Windows với Java 11+, có giao diện người dùng thân thiện với người dùng và các chức năng thiết yếu.
  4. Tạo trang tổng quan với các bộ lọc, hành vi nhấp chuột và các tính năng tương tác để khám phá dữ liệu chuyên sâu.
  5. Quản trị viên quản lý người dùng, quyền và cấu hình, giúp Metabase có khả năng thích ứng và thân thiện với người dùng.

Những câu hỏi thường gặp

Q1. Tôi có thể sử dụng Metabase miễn phí không?

Đáp: Có, Metabase cung cấp phiên bản nguồn mở và miễn phí với các tính năng kinh doanh thông minh cần thiết để phân tích dữ liệu và tạo bảng thông tin.

Q2. Metabase có phải là công cụ BI không?

Đáp. Hoàn toàn có thể, Metabase là một công cụ Business Intelligence (BI) được thiết kế để kết nối với cơ sở dữ liệu, phân tích dữ liệu và xây dựng bảng thông tin tương tác.

Q3. Metabase có phải là nguồn mở không?

Đáp. Có, Metabase là nguồn mở, cung cấp cho người dùng quyền truy cập miễn phí vào các chức năng BI, quản lý người dùng và nhóm cũng như các tính năng bảng điều khiển tương tác.

Q4. Metabase có phải là công cụ trực quan hóa dữ liệu không?

Đáp. Thật vậy, Metabase đóng vai trò như một công cụ trực quan hóa dữ liệu, cho phép người dùng tạo các hình ảnh trực quan như biểu đồ và đồ thị để hiểu rõ hơn về tập dữ liệu của họ.

Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định riêng của Tác giả.

Dấu thời gian:

Thêm từ Phân tích Vidhya