Bạn có thể tự động hóa Excel bằng Python không?

Python có đầy đủ các thư viện phong phú, các gói hữu ích và các chức năng sẵn sàng sử dụng để tự động hóa, hỗ trợ rất nhiều cho quá trình thử nghiệm. Python cho phép bạn chọn những gì tốt nhất cho dự án của bạn

Trong bài viết này, chúng tôi sẽ triển khai các thư viện Python và dữ liệu excel để tự động hóa. Nó sẽ giúp chúng ta hiểu rõ hơn về Python và Excel

Mục lục

điều kiện tiên quyết

Để làm theo hướng dẫn này, bạn sẽ cần phải có;

  • Kiến thức cơ bản về ngôn ngữ lập trình Python
  • Biết làm việc với thư viện Python
  • Kiến thức về MS Excel

Tổng quan

Hiểu biết sơ lược về Python và MS excel sẽ giúp chúng ta định hướng trong quy trình tự động hóa. Chúng tôi sẽ đi sâu vào lịch sử của họ, họ hình thành như thế nào và tại sao chúng tôi chọn họ cho dự án của mình

Tổng quan về Python

Python là một ngôn ngữ lập trình được sắp xếp theo đối tượng, thông minh với nhiều thành phần sử dụng bộ hòa giải để xử lý các đoạn mã. Vì nó hoạt động theo yêu cầu ngắn gọn, nó rất có thể được sử dụng để thực hiện một cách tiếp cận khung về cơ bản cho tất cả các hệ điều hành đang hoạt động

Trong trường hợp bạn chưa cài đặt Python, đây là hướng dẫn về cách cài đặt Python và kiểm tra nó trong hệ điều hành của bạn

Tại sao chúng ta thích Python hơn các ngôn ngữ lập trình khác

  • Đây là ngôn ngữ lập trình mã nguồn mở và miễn phí - bạn có thể tải xuống Python và cài đặt miễn phí từ trang web này
  • Python là một ngôn ngữ dễ sử dụng - những người mới bắt đầu có ít kiến ​​thức về lập trình có thể dễ dàng học và hiểu cú pháp Python
  • Nó cũng hỗ trợ lập trình nằm trong đối tượng cho phép khách hàng soạn mã có thể giải mã và có thể sử dụng lại

Tổng quan về MS Excel

Microsoft Excel là một thiết bị sổ kế toán do Microsoft tạo ra vào năm 1987 cho Windows, MacOS, Android và iOS. Nó đã trở nên phổ biến trong suốt những năm qua nhờ sự dễ dàng trong việc chỉ đạo các hoạt động 'CRUD' khi bắt đầu thông tin

Nó cũng hỗ trợ nhiều công thức trong khi truy xuất dữ liệu từ tệp MS Excel

Phân tích tập dữ liệu Excel

Trong phần này, chúng tôi sẽ phân tích bộ dữ liệu mà tôi đã chuẩn bị trong Excel. Bạn có thể tải xuống dữ liệu từ [tại đây] [https. //github. com/taves-hub/Automating-excel-sheet-in-python/blob/main/Python/exam-results-list-excel-table. xlsx]

Tập dữ liệu đã có trong tiện ích mở rộng .csv, mà chúng tôi cần thay đổi thành “. xlsx` để chúng tôi có thể tự động hóa. Chúng tôi sẽ sử dụng dữ liệu ở trên để tạo dữ liệu bên dưới

Lập kế hoạch các bảng tổng hợp bằng Pandas

Chúng tôi sẽ cần nhập các thư viện Python sau vào không gian làm việc của mình để tạo bảng tổng hợp

import pandas as pd
import Openpyxl
from Openpyxl import load_workbook
from Openpyxl.sytles import Font
from openpyxl.chart import BarChart, Reference
import string

Thư viện ‘Pandas’ được sử dụng để phân tích các tệp Excel và tạo các bảng tổng hợp trong Excel. Mô-đun 'Openpyxl' của Python nhằm thực hiện các phép tính Excel và tạo biểu đồ và bảng tính

Trong trường hợp bạn chưa cài đặt thư viện Openpyxl, hãy chạy lệnh bên dưới trong dấu nhắc lệnh để thêm nó vào không gian làm việc của bạn

pip install pandas 

Trang tính Excel của chúng tôi phải ở cùng vị trí với tập lệnh Python của chúng tôi. Hàm Load_workbook, được nhập từ thư viện Openpyxl, sẽ được sử dụng để thiết kế báo cáo của chúng tôi

Bạn có thể tìm hiểu thêm về thư viện Python tại đây

Xem dữ liệu Excel

Để đọc tệp excel của chúng tôi, chúng tôi sẽ sử dụng hàm

pip install pandas 
0 như được minh họa trong đoạn mã bên dưới

    # excel file
excel_file = pd.read_excel['student_results.xlsx']
    # columns names in the file
excel_file[['Student Name' , 'course' , 'Date' , 'points']]

Các kết quả sau sẽ được hiển thị sau khi chạy đoạn mã trên

bảng tổng hợp

Để tạo bảng tổng hợp của chúng tôi, chúng tôi sẽ sử dụng hàm

pip install pandas 
1 để hiển thị student_results. Để tổng hợp tổng số điểm mà sinh viên của các khóa học khác nhau đạt được, chúng tôi sẽ chạy đoạn mã bên dưới

report_table = excel_file..pivot_table[index='Student Number', columns='Course' , values='points' , aggfun='sum'].round[0]

Báo cáo sẽ như hình bên dưới

Hàm

pip install pandas 
2 pivot_table ở trên dùng để tính tổng điểm trong các cột được nhóm theo khóa học. Hàm
pip install pandas 
3 dành cho trả về null

Hàm

pip install pandas 
4 sẽ được sử dụng để xuất tệp excel của chúng tôi. Bên trong ngoặc, chúng tôi sẽ chỉ định tên của tệp Excel đầu ra [report_2021. xlsx]. Theo sau nó là tên trang tính mà chúng ta sẽ tạo [báo cáo] và ô của bảng tổng hợp [5]

Đoạn mã dưới đây sẽ gửi bảng báo cáo đến một tệp Excel

report_table.to_excel['report_2021.xlsx' , sheet_name='Report' , startrow=5]

Tạo báo cáo bằng thư viện Openpyxl

Trong phần này, chúng ta sẽ sử dụng hàm

pip install pandas 
5 sẽ được sử dụng để truy cập sổ làm việc và sử dụng hàm
pip install pandas 
6 của nó để lưu sổ làm việc. Việc tải và lưu sổ làm việc sẽ được thực hiện mỗi khi chúng tôi sửa đổi sổ làm việc và nó sẽ được thực hiện một lần

Chúng tôi được yêu cầu xác định các cột và hàng hoạt động tối đa và tối thiểu để đảm bảo rằng ngay cả khi chúng tôi thêm nhiều dữ liệu hơn vào trang tính Excel, mã sẽ tiếp tục hoạt động

Mã bên dưới minh họa các hàng và cột tối đa và tối thiểu

Minimum Columns: 4
Maximum Columns: 15
Minimum Rows: 1
Maximum Rows: 5

Điều này được xác minh bằng tệp

pip install pandas 
7 ban đầu mà chúng tôi đã xuất được hiển thị bên dưới

Tự động hóa báo cáo bằng Python

Sau khi thiết kế báo cáo của chúng tôi, phần tiếp theo và quan trọng nhất là tự động hóa nó. Trong phần này, chúng tôi sẽ soạn tất cả mã bằng cách sử dụng một chức năng để đơn giản hóa việc tự động hóa báo cáo của chúng tôi

Đặt mã dưới cùng một chức năng đảm bảo rằng lần tới khi chúng tôi được yêu cầu tự động hóa báo cáo, chúng tôi sẽ chỉ phải chỉ định tên tệp và chạy mã. Đây là mã hoàn chỉnh của chúng tôi

Bạn có thể áp dụng hàm

pip install pandas 
8 nếu bạn chỉ xử lý các điểm dữ liệu đơn lẻ. Trong trường hợp nhiều dữ liệu, các tiêu chí vẫn giữ nguyên

Chúng ta cần áp dụng từng chức năng một để có được các báo cáo cần thiết. Ví dụ: nếu chúng tôi cần tạo hai báo cáo, chúng tôi sẽ sử dụng đoạn mã bên dưới

automate_excel['student_results1.xlsx']
automate_excel['student_results2.xlsx']

Lập kế hoạch tập lệnh Python

Tại thời điểm này, chúng tôi đã hoàn thành tất cả các mã. Tiếp theo, chúng ta cần sử dụng bộ lập lịch tác vụ để

pip install pandas 
9 tập lệnh Python vào các thời điểm khác nhau dựa trên nhu cầu dữ liệu. Dữ liệu có thể cần được gửi hàng ngày, hàng tuần hoặc thậm chí hàng tháng

Như vậy là chúng ta đã tự động hóa thành công file excel của mình một cách đơn giản và dễ hiểu

Phần kết luận

Bài viết này cung cấp cho người đọc một hướng dẫn đơn giản và trực tiếp về cách tự động hóa các tệp excel bằng Python với các bước rõ ràng và đơn giản. Bạn có thể chia sẻ kinh nghiệm thiết lập tự động hóa với excel trong Python trong phần bình luận bên dưới

Python có thể được sử dụng để tự động hóa Excel không?

Một mô-đun Python có tên Openpyxl được sử dụng để đọc hoặc ghi vào tệp Excel . Để phân tích dữ liệu, sao chép dữ liệu, khai thác dữ liệu, tạo biểu đồ, biểu định kiểu, thêm công thức và các tác vụ khác, các nhà khoa học dữ liệu sử dụng Openpyxl.

Python có hoạt động tốt với Excel không?

Các nhà phát triển Python đã triển khai các cách để đọc, viết và thao tác với tài liệu Excel . Khóa học Lập trình Python do người hướng dẫn là một cách hay để có kinh nghiệm thực hành sử dụng excel trong Python.

Bạn có thể sử dụng Python trong Excel thay vì VBA không?

Viết công cụ Excel bằng Python thay vì VBA và gọi mã của bạn trực tiếp từ bên trong Excel, e. g. thông qua một nút trên trang tính. Điều này cũng hoạt động tốt cho các ứng dụng web tạo mẫu [Windows & Mac].

Chủ Đề