Python có đầy đủ các thư viện phong phú, các gói hữu ích và các chức năng sẵn sàng sử dụng để tự động hóa, hỗ trợ rất nhiều cho quá trình thử nghiệm. Python cho phép bạn chọn những gì tốt nhất cho dự án của bạn
Trong bài viết này, chúng tôi sẽ triển khai các thư viện Python và dữ liệu excel để tự động hóa. Nó sẽ giúp chúng ta hiểu rõ hơn về Python và Excel
Mục lục
điều kiện tiên quyết
Để làm theo hướng dẫn này, bạn sẽ cần phải có;
- Kiến thức cơ bản về ngôn ngữ lập trình Python
- Biết làm việc với thư viện Python
- Kiến thức về MS Excel
Tổng quan
Hiểu biết sơ lược về Python và MS excel sẽ giúp chúng ta định hướng trong quy trình tự động hóa. Chúng tôi sẽ đi sâu vào lịch sử của họ, họ hình thành như thế nào và tại sao chúng tôi chọn họ cho dự án của mình
Tổng quan về Python
Python là một ngôn ngữ lập trình được sắp xếp theo đối tượng, thông minh với nhiều thành phần sử dụng bộ hòa giải để xử lý các đoạn mã. Vì nó hoạt động theo yêu cầu ngắn gọn, nó rất có thể được sử dụng để thực hiện một cách tiếp cận khung về cơ bản cho tất cả các hệ điều hành đang hoạt động
Trong trường hợp bạn chưa cài đặt Python, đây là hướng dẫn về cách cài đặt Python và kiểm tra nó trong hệ điều hành của bạn
Tại sao chúng ta thích Python hơn các ngôn ngữ lập trình khác
- Đây là ngôn ngữ lập trình mã nguồn mở và miễn phí - bạn có thể tải xuống Python và cài đặt miễn phí từ trang web này
- Python là một ngôn ngữ dễ sử dụng - những người mới bắt đầu có ít kiến thức về lập trình có thể dễ dàng học và hiểu cú pháp Python
- Nó cũng hỗ trợ lập trình nằm trong đối tượng cho phép khách hàng soạn mã có thể giải mã và có thể sử dụng lại
Tổng quan về MS Excel
Microsoft Excel là một thiết bị sổ kế toán do Microsoft tạo ra vào năm 1987 cho Windows, MacOS, Android và iOS. Nó đã trở nên phổ biến trong suốt những năm qua nhờ sự dễ dàng trong việc chỉ đạo các hoạt động 'CRUD' khi bắt đầu thông tin
Nó cũng hỗ trợ nhiều công thức trong khi truy xuất dữ liệu từ tệp MS Excel
Phân tích tập dữ liệu Excel
Trong phần này, chúng tôi sẽ phân tích bộ dữ liệu mà tôi đã chuẩn bị trong Excel. Bạn có thể tải xuống dữ liệu từ [tại đây] [https. //github. com/taves-hub/Automating-excel-sheet-in-python/blob/main/Python/exam-results-list-excel-table. xlsx]
Tập dữ liệu đã có trong tiện ích mở rộng .csv
, mà chúng tôi cần thay đổi thành “. xlsx` để chúng tôi có thể tự động hóa. Chúng tôi sẽ sử dụng dữ liệu ở trên để tạo dữ liệu bên dưới
Lập kế hoạch các bảng tổng hợp bằng Pandas
Chúng tôi sẽ cần nhập các thư viện Python sau vào không gian làm việc của mình để tạo bảng tổng hợp
import pandas as pd
import Openpyxl
from Openpyxl import load_workbook
from Openpyxl.sytles import Font
from openpyxl.chart import BarChart, Reference
import string
Thư viện ‘Pandas’ được sử dụng để phân tích các tệp Excel và tạo các bảng tổng hợp trong Excel. Mô-đun 'Openpyxl' của Python nhằm thực hiện các phép tính Excel và tạo biểu đồ và bảng tính
Trong trường hợp bạn chưa cài đặt thư viện Openpyxl
, hãy chạy lệnh bên dưới trong dấu nhắc lệnh để thêm nó vào không gian làm việc của bạn
pip install pandas
Trang tính Excel của chúng tôi phải ở cùng vị trí với tập lệnh Python của chúng tôi. Hàm Load_workbook
, được nhập từ thư viện Openpyxl, sẽ được sử dụng để thiết kế báo cáo của chúng tôi
Bạn có thể tìm hiểu thêm về thư viện Python tại đây
Xem dữ liệu Excel
Để đọc tệp excel của chúng tôi, chúng tôi sẽ sử dụng hàm
pip install pandas
0 như được minh họa trong đoạn mã bên dưới # excel file
excel_file = pd.read_excel['student_results.xlsx']
# columns names in the file
excel_file[['Student Name' , 'course' , 'Date' , 'points']]
Các kết quả sau sẽ được hiển thị sau khi chạy đoạn mã trên
bảng tổng hợp
Để tạo bảng tổng hợp của chúng tôi, chúng tôi sẽ sử dụng hàm
pip install pandas
1 để hiển thị student_results. Để tổng hợp tổng số điểm mà sinh viên của các khóa học khác nhau đạt được, chúng tôi sẽ chạy đoạn mã bên dướireport_table = excel_file..pivot_table[index='Student Number', columns='Course' , values='points' , aggfun='sum'].round[0]
Báo cáo sẽ như hình bên dưới
Hàm
pip install pandas
2 pivot_table ở trên dùng để tính tổng điểm trong các cột được nhóm theo khóa học. Hàm pip install pandas
3 dành cho trả về nullHàm
pip install pandas
4 sẽ được sử dụng để xuất tệp excel của chúng tôi. Bên trong ngoặc, chúng tôi sẽ chỉ định tên của tệp Excel đầu ra [report_2021. xlsx]. Theo sau nó là tên trang tính mà chúng ta sẽ tạo [báo cáo] và ô của bảng tổng hợp [5]Đoạn mã dưới đây sẽ gửi bảng báo cáo đến một tệp Excel
report_table.to_excel['report_2021.xlsx' , sheet_name='Report' , startrow=5]
Tạo báo cáo bằng thư viện Openpyxl
Trong phần này, chúng ta sẽ sử dụng hàm
pip install pandas
5 sẽ được sử dụng để truy cập sổ làm việc và sử dụng hàm pip install pandas
6 của nó để lưu sổ làm việc. Việc tải và lưu sổ làm việc sẽ được thực hiện mỗi khi chúng tôi sửa đổi sổ làm việc và nó sẽ được thực hiện một lầnChúng tôi được yêu cầu xác định các cột và hàng hoạt động tối đa và tối thiểu để đảm bảo rằng ngay cả khi chúng tôi thêm nhiều dữ liệu hơn vào trang tính Excel, mã sẽ tiếp tục hoạt động
Mã bên dưới minh họa các hàng và cột tối đa và tối thiểu
Minimum Columns: 4
Maximum Columns: 15
Minimum Rows: 1
Maximum Rows: 5
Điều này được xác minh bằng tệp
pip install pandas
7 ban đầu mà chúng tôi đã xuất được hiển thị bên dướiTự động hóa báo cáo bằng Python
Sau khi thiết kế báo cáo của chúng tôi, phần tiếp theo và quan trọng nhất là tự động hóa nó. Trong phần này, chúng tôi sẽ soạn tất cả mã bằng cách sử dụng một chức năng để đơn giản hóa việc tự động hóa báo cáo của chúng tôi
Đặt mã dưới cùng một chức năng đảm bảo rằng lần tới khi chúng tôi được yêu cầu tự động hóa báo cáo, chúng tôi sẽ chỉ phải chỉ định tên tệp và chạy mã. Đây là mã hoàn chỉnh của chúng tôi
Bạn có thể áp dụng hàm
pip install pandas
8 nếu bạn chỉ xử lý các điểm dữ liệu đơn lẻ. Trong trường hợp nhiều dữ liệu, các tiêu chí vẫn giữ nguyênChúng ta cần áp dụng từng chức năng một để có được các báo cáo cần thiết. Ví dụ: nếu chúng tôi cần tạo hai báo cáo, chúng tôi sẽ sử dụng đoạn mã bên dưới
automate_excel['student_results1.xlsx']
automate_excel['student_results2.xlsx']
Lập kế hoạch tập lệnh Python
Tại thời điểm này, chúng tôi đã hoàn thành tất cả các mã. Tiếp theo, chúng ta cần sử dụng bộ lập lịch tác vụ để
pip install pandas
9 tập lệnh Python vào các thời điểm khác nhau dựa trên nhu cầu dữ liệu. Dữ liệu có thể cần được gửi hàng ngày, hàng tuần hoặc thậm chí hàng thángNhư vậy là chúng ta đã tự động hóa thành công file excel của mình một cách đơn giản và dễ hiểu
Phần kết luận
Bài viết này cung cấp cho người đọc một hướng dẫn đơn giản và trực tiếp về cách tự động hóa các tệp excel bằng Python với các bước rõ ràng và đơn giản. Bạn có thể chia sẻ kinh nghiệm thiết lập tự động hóa với excel trong Python trong phần bình luận bên dưới