Trong hướng dẫn này, chúng ta sẽ xem cách tải dữ liệu vào cơ sở dữ liệu SQL Server bằng Python và API. Sau đó, chúng tôi sẽ trình bày cách tạo báo cáo Power BI đơn giản bằng cách sử dụng dữ liệu đã nhập này
Dung dịchTrong hướng dẫn từng bước này, bạn sẽ được cung cấp quyền truy cập vào API mà bất kỳ ai cũng có thể sử dụng, điều này sẽ đảm bảo rằng bạn có thể làm theo hướng dẫn này
điều kiện tiên quyết
- Máy chủ SQL
- điện BI
- Visual Studio
Tiêu thụ dữ liệu API
Đối với hướng dẫn này, bạn sẽ sử dụng dữ liệu điểm cuối API mô phỏng do JSONPlaceholder cung cấp. Chúng tôi sẽ sử dụng Python để tìm nạp dữ liệu và tải nó vào cơ sở dữ liệu SQL Server
JSONPlaceholder đi kèm với bộ 6 tài nguyên phổ biến như hình bên dưới. Đây là những điểm cuối bạn có thể sử dụng, đối với hướng dẫn này, chúng tôi sẽ sử dụng điểm cuối "người dùng"
/posts100 bài đăng/bình luận500 bình luận/album100 album/ảnh5000 ảnh/todos200 todos/users10 người dùngMở Visual Studio nhấn File > Open Folder như hình bên dưới
Tìm đích thư mục bạn muốn hoặc nhấp chuột phải vào khoảng trống để tạo thư mục mới như hình bên dưới
Đặt tên cho thư mục và nhấn Select Folder như hình bên dưới
Khi thư mục của bạn được mở, hãy thêm tệp mới vào dự án/thư mục của bạn bằng cách nhấp vào biểu tượng tệp mới như hình bên dưới
Đặt tên cho tệp API-DATA_Users. py, đảm bảo tên tệp có. py để cho biết đó là tệp Python
Mở cửa sổ terminal bằng cách nhấp vào Terminal > New Terminal
Trước khi bắt đầu viết mã, chúng ta cần thêm một vài mô-đun Python sẽ được sử dụng, mô-đun Yêu cầu và mô-đun Pandas
Trong cửa sổ terminal, nhập mã bên dưới và chạy
pip install requests
Đầu ra phải như hình dưới đây
Trong cửa sổ terminal, nhập mã bên dưới và chạy
pip install pandas
Đầu ra phải như hình dưới đây
Sau đó, chúng tôi sẽ sử dụng các mô-đun yêu cầu và gấu trúc trong API-DATA_Users. py tập tin như hình dưới đây. Ghi chú. bộ mã đầy đủ ở cuối bài viết này
Đây là giao diện của mã để sử dụng thông tin "người dùng" từ API
Sau đó, chúng tôi lưu mã bằng CTRL + S và chạy mã bằng cách nhấp vào biểu tượng chạy ở trên cùng bên phải của Visual Studio
Bạn sẽ thấy đầu ra của quá trình thực thi trong thiết bị đầu cuối của mình
Tuy nhiên, việc sử dụng API thành công, hãy lưu ý rằng dữ liệu không được trình bày thẳng như bạn muốn, có một cấu trúc JSON lồng nhau. Rất khó và đôi khi không thể làm việc với dữ liệu ở trạng thái này, vì vậy chúng tôi phải chia nhỏ nó. Để làm điều này, chúng tôi thêm mã bên dưới vào tập lệnh
Đây là đầu ra. Đầu ra bây giờ trông tốt hơn nhiều
Tạo cơ sở dữ liệu SQL
Một trong những lý do tốt nhất để sử dụng SQL làm cơ sở dữ liệu là nó cho phép bạn tạo quyền truy cập truy vấn trực tiếp dưới dạng nguồn dữ liệu Power BI, truy vấn trực tiếp cho phép bạn lên lịch làm mới dữ liệu tự động cho báo cáo của mình. Theo các liên kết này nếu bạn cần cài đặt SQL Server hoặc SQL Server Management Studio
Để bắt đầu, mở SQL Server Management Studio và kết nối với máy chủ và nhấp chuột phải vào Cơ sở dữ liệu và chọn Cơ sở dữ liệu mới để tạo cơ sở dữ liệu mới
Nhập tên cơ sở dữ liệu và bấm OK để tạo cơ sở dữ liệu. Chúng ta sẽ đặt tên cơ sở dữ liệu là MSSQLTIPS_DB
Nếu bạn làm mới Cơ sở dữ liệu trong SSMS, bạn sẽ thấy cơ sở dữ liệu mới
Để tạo một bảng mới, bấm chuột phải vào Bảng và chọn Mới > Bảng
Tạo một cột có tên là id và bỏ chọn hộp Allow Nulls [1]. Nhấp vào biểu tượng Lưu [2] và điều này sẽ nhắc bạn chọn tên bảng [3], nhập "Người dùng" và nhấp vào OK [4] để lưu bảng mới
Tuyệt quá. Bạn đã hoàn tất việc thiết lập cơ sở dữ liệu. Ghi chú. bạn chỉ cần tạo một cột vì khung dữ liệu của Python được thiết lập dưới dạng bảng và các cột còn lại sẽ được thêm tự động từ khung dữ liệu. Điều này có thể giúp bạn tiết kiệm rất nhiều thời gian khi làm việc với các bộ dữ liệu lớn
Ghi vào cơ sở dữ liệu SQL bằng Python
Mở Visual Studio và tạo tệp kết nối có tên conxn. py và chỉ định thuộc tính nguồn dữ liệu của bạn
Trong cửa sổ terminal, chúng ta cần cài đặt thêm một số thư viện Python
Trong cửa sổ terminal, nhập mã bên dưới và chạy
pip install pyodbc
Trong cửa sổ terminal, nhập mã bên dưới và chạy
pip install sqlalchemy
Sau đó, chúng tôi sử dụng chúng trong tệp kết nối như được hiển thị bên dưới cùng với thông tin chuỗi kết nối để kết nối với SQL Server
Trong API-DATA_Users. py, chúng ta cần thêm một tham chiếu đến mã này như sau
Để ghi dữ liệu API vào cơ sở dữ liệu, chúng ta cần thêm đoạn mã sau vào cuối API-DATA_Users. tập tin py
Kết nối SQL với Power BI
Trong phần cuối cùng này, chúng ta sẽ tạo một báo cáo Power BI đơn giản cho dữ liệu này bằng kết nối truy vấn trực tiếp
Mở nguồn BI. Nhấp vào Nhận dữ liệu và chọn Máy chủ SQL
Bạn sẽ thấy lời nhắc, nhập Máy chủ, Cơ sở dữ liệu và chọn chế độ DirectQuery cho Kết nối dữ liệu
Trên cửa sổ hộp thoại tiếp theo, nhấp vào Kết nối để tiếp tục. Theo mặc định, Power BI sẽ cung cấp tất cả các bảng trong nguồn dữ liệu của bạn dưới dạng các mô hình mà bạn sẽ thấy trong bước tiếp theo
Power BI tự động liệt kê các bảng có sẵn từ nguồn dữ liệu. Chọn hộp kiểm bên cạnh bảng bạn muốn và nhấp vào Tải để tải dữ liệu SQL của bạn lên Power BI
Nhấp vào Áp dụng thay đổi để tiếp tục
Các cột từ bảng sẽ hiển thị trong ngăn Trường. Bây giờ để trực quan hóa dữ liệu, hãy thêm một Hình ảnh hóa bảng đơn giản vào báo cáo
Một hình ảnh bảng trống sẽ xuất hiện trên trang
Đánh dấu vào các ô bên cạnh mỗi cột bạn muốn đưa vào hình ảnh báo cáo
Tóm lược
Xin chúc mừng. Giờ đây, bạn có thể sử dụng dữ liệu API, tạo cơ sở dữ liệu SQL, ghi dữ liệu vào cơ sở dữ liệu bằng Python và sử dụng cơ sở dữ liệu SQL làm nguồn dữ liệu DirectQuery cho Power BI. Hy vọng rằng điều này cung cấp cho bạn một ý tưởng về cách làm điều này cho dự án của bạn