Cũng giống như tất cả các loại tệp khác, bạn cũng có thể sử dụng thư viện Pandas để đọc và ghi các tệp Excel bằng Python. Trong hướng dẫn ngắn này, chúng ta sẽ thảo luận về cách đọc và ghi các tệp Excel qua
$ pip install pandas
3sNgoài cách đọc và viết đơn giản, chúng ta cũng sẽ học cách viết nhiều
$ pip install pandas
3 vào một tệp Excel, cách đọc các hàng và cột cụ thể từ một bảng tính cũng như cách đặt tên cho một trang tính và nhiều trang tính trong một tệp trước khi thực hiện bất kỳ điều gìNếu bạn muốn tìm hiểu thêm về các loại tệp khác, chúng tôi sẽ hỗ trợ bạn
Đọc và ghi tệp Excel bằng Python với Pandas
Đương nhiên, để sử dụng Pandas, trước tiên chúng ta phải cài đặt nó. Phương pháp dễ nhất để cài đặt nó là thông qua
$ pip install pandas
5Nếu bạn đang chạy Windows
$ python pip install pandas
Nếu bạn đang sử dụng Linux hoặc MacOS
$ pip install pandas
Lưu ý rằng bạn có thể gặp lỗi
$ pip install pandas
6 hoặc $ pip install pandas
7 khi chạy mã trong bài viết này. Ví dụModuleNotFoundError: No module named 'openpyxl'
Nếu đây là trường hợp, thì bạn sẽ cần cài đặt [các] mô-đun bị thiếu
________số 8Viết tệp Excel bằng Pandas
Chúng tôi sẽ lưu trữ thông tin mà chúng tôi muốn ghi vào tệp Excel trong một
$ pip install pandas
3. Sử dụng chức năng $ pip install pandas
9 tích hợp, chúng tôi có thể trích xuất thông tin này thành tệp ExcelTrước tiên, hãy nhập mô-đun Pandas
$ pip install pandas
1Bây giờ, hãy sử dụng một từ điển để điền vào một
$ pip install pandas
3$ pip install pandas
3Các khóa trong từ điển của chúng tôi sẽ đóng vai trò là tên cột. Tương tự, các giá trị trở thành các hàng chứa thông tin
Bây giờ, chúng ta có thể sử dụng hàm
$ pip install pandas
9 để ghi nội dung vào tệp. Đối số duy nhất là đường dẫn tệp$ pip install pandas
5Đây là tệp Excel đã được tạo
Xin lưu ý rằng chúng tôi không sử dụng bất kỳ tham số nào trong ví dụ của chúng tôi. Do đó, trang tính trong tệp vẫn giữ nguyên tên mặc định - "Trang tính 1". Như các bạn thấy file Excel của chúng ta có thêm một cột chứa số. Những con số này là chỉ số cho mỗi hàng, đến trực tiếp từ Pandas
$ pip install pandas
3Chúng tôi có thể thay đổi tên của trang tính của mình bằng cách thêm tham số
ModuleNotFoundError: No module named 'openpyxl'
3 vào lệnh gọi $ pip install pandas
9 của chúng tôi$ pip install pandas
9Tương tự, thêm tham số
ModuleNotFoundError: No module named 'openpyxl'
5 và đặt nó thành ModuleNotFoundError: No module named 'openpyxl'
6 sẽ xóa cột chỉ mục khỏi đầu ra$ pip install pandas
2Bây giờ, tệp Excel trông như thế này
Viết nhiều khung dữ liệu vào một tệp Excel
Cũng có thể ghi nhiều khung dữ liệu vào một tệp Excel. Nếu muốn, bạn cũng có thể đặt một trang tính khác cho mỗi khung dữ liệu
$ pip install pandas
3Hãy xem hướng dẫn thực hành, thực tế của chúng tôi để học Git, với các phương pháp hay nhất, tiêu chuẩn được ngành chấp nhận và bao gồm bảng gian lận. Dừng các lệnh Git trên Google và thực sự tìm hiểu nó
Ở đây, chúng tôi đã tạo 3 khung dữ liệu khác nhau chứa nhiều tên nhân viên khác nhau và mức lương của họ dưới dạng dữ liệu. Mỗi khung dữ liệu này được phổ biến bởi từ điển tương ứng của nó
Chúng ta đã kết hợp ba giá trị này trong biến
ModuleNotFoundError: No module named 'openpyxl'
7, trong đó mỗi khóa là tên trang tính và mỗi giá trị là đối tượng $ pip install pandas
3Cuối cùng, chúng ta đã sử dụng công cụ
ModuleNotFoundError: No module named 'openpyxl'
9 để tạo một đối tượng $ pip install openpyxl xlsxwriter xlrd
0. Đối tượng này được chuyển đến lệnh gọi hàm $ pip install pandas
9Trước khi chúng tôi viết bất cứ điều gì, chúng tôi lặp qua các khóa của
$ pip install openpyxl xlsxwriter xlrd
2 và đối với mỗi khóa, hãy viết nội dung vào tên trang tính tương ứngĐây là tập tin được tạo
Bạn có thể thấy rằng tệp Excel có ba trang tính khác nhau có tên là
$ pip install openpyxl xlsxwriter xlrd
3, $ pip install openpyxl xlsxwriter xlrd
4 và $ pip install openpyxl xlsxwriter xlrd
5. Mỗi trang tính này chứa tên của nhân viên và mức lương của họ theo ngày trong ba khung dữ liệu khác nhau trong mã của chúng tôiTham số engine trong hàm
$ pip install pandas
9 được sử dụng để chỉ định mô-đun cơ bản nào được thư viện Pandas sử dụng để tạo tệp Excel. Trong trường hợp của chúng tôi, mô-đun ModuleNotFoundError: No module named 'openpyxl'
9 được sử dụng làm công cụ cho lớp $ pip install openpyxl xlsxwriter xlrd
8. Các động cơ khác nhau có thể được chỉ định tùy thuộc vào các tính năng tương ứng của chúngTùy thuộc vào các mô-đun Python được cài đặt trên hệ thống của bạn, các tùy chọn khác cho thuộc tính động cơ là.
$ pip install openpyxl xlsxwriter xlrd
9 [đối với $ pip install pandas
10 và $ pip install pandas
11] và $ pip install pandas
12 [đối với $ pip install pandas
13]Thông tin chi tiết về cách sử dụng mô-đun
ModuleNotFoundError: No module named 'openpyxl'
9 với thư viện Pandas có tại tài liệu chính thứcCuối cùng nhưng không kém phần quan trọng, trong đoạn mã trên, chúng ta phải lưu tệp một cách rõ ràng bằng cách sử dụng
$ pip install pandas
15, nếu không tệp sẽ không được lưu trên đĩaĐọc tệp Excel với Pandas
Ngược lại với việc ghi các đối tượng
$ pip install pandas
3 vào tệp Excel, chúng ta có thể làm ngược lại bằng cách đọc tệp Excel thành các $ pip install pandas
3. Đóng gói nội dung của tệp Excel vào một $ pip install pandas
3 dễ dàng như gọi hàm $ pip install pandas
19$ pip install pandas
0Đối với ví dụ này, chúng tôi đang đọc tệp Excel này
Ở đây, đối số bắt buộc duy nhất là đường dẫn đến tệp Excel. Nội dung được đọc và đóng gói vào một
$ pip install pandas
3, sau đó chúng ta có thể xem trước thông qua chức năng $ pip install pandas
31Ghi chú. Sử dụng phương pháp này, mặc dù đơn giản nhất, sẽ chỉ đọc trang đầu tiên
Hãy xem đầu ra của hàm
$ pip install pandas
31Theo mặc định, gấu trúc gán nhãn hàng hoặc chỉ mục số cho
$ pip install pandas
3 khi chúng tôi sử dụng hàm $ pip install pandas
19Chúng ta có thể ghi đè chỉ mục mặc định bằng cách chuyển một trong các cột trong tệp Excel dưới dạng tham số
$ pip install pandas
35$ pip install pandas
1Chạy mã này sẽ dẫn đến
Trong ví dụ trên, chúng tôi đã thay thế chỉ mục mặc định bằng cột "Grade" từ tệp Excel. Tuy nhiên, bạn chỉ nên ghi đè chỉ mục mặc định nếu bạn có một cột chứa các giá trị có thể dùng làm chỉ mục tốt hơn
Đọc các cột cụ thể từ tệp Excel
Việc đọc toàn bộ tệp rất hữu ích, mặc dù trong nhiều trường hợp, bạn thực sự muốn truy cập một phần tử nhất định. Ví dụ: bạn có thể muốn đọc giá trị của phần tử và gán giá trị đó cho một trường của đối tượng
Một lần nữa, điều này được thực hiện bằng cách sử dụng hàm
$ pip install pandas
19, tuy nhiên, chúng ta sẽ chuyển tham số $ pip install pandas
37. Ví dụ: chúng ta có thể giới hạn chức năng chỉ đọc một số cột nhất định. Hãy thêm tham số để chúng ta đọc các cột tương ứng với các giá trị "Tên sinh viên", "Điểm" và "Điểm đạt được"Chúng tôi làm điều này bằng cách chỉ định chỉ mục số của mỗi cột
$ pip install pandas
2Chạy mã này sẽ mang lại
Như bạn có thể thấy, chúng tôi chỉ truy xuất các cột được chỉ định trong danh sách
$ pip install pandas
38Phần kết luận
Chúng tôi đã đề cập đến một số cách sử dụng chung của các hàm
$ pip install pandas
19 và $ pip install pandas
9 của thư viện Pandas. Với chúng, chúng tôi đã đọc các tệp Excel hiện có và ghi dữ liệu của riêng chúng tôi vào chúngSử dụng các tham số khác nhau, chúng tôi có thể thay đổi hành vi của các chức năng này, cho phép chúng tôi xây dựng các tệp tùy chỉnh, thay vì chỉ kết xuất mọi thứ từ một
$ pip install pandas
3