Python Docx là một thư viện python để tạo và sửa đổi các tài liệu Microsoft Word. Nó cung cấp nhiều thao tác để tạo tài liệu mới và các thao tác từ khác như làm việc với văn bản, hình ảnh, hình dạng, bảng và nhiều tính năng tài liệu khác. Tài liệu mới có thể được tạo và các tài liệu hiện có cũng có thể được sửa đổi bằng python docx. Để bắt đầu, trước tiên hãy cài đặt python docx trên hệ thống của bạn bằng cách sử dụng pip hoặc nguồn
# using pip
pip install python-docx
# using easy_install
easy_install python-docx
# or build from source
tar xvzf python-docx-{version}.tar.gz
cd python-docx-{version}
python setup.py install
Bây giờ chúng ta có thể làm việc cơ bản với python docx để tạo tài liệu word
Bắt đầu
Đầu tiên, chúng ta có thể tạo một tài liệu trống nơi chúng ta có thể viết bất kỳ văn bản hoặc dữ liệu nào khác
# import docx document
from docx import Document
# initialize a document
document = Document[]
Hoặc nếu có một số tài liệu hiện có, nó cũng có thể được mở bằng cách sử dụng
# import docx document
from docx import Document
# initialize a document
document = Document[]
3 trong python docx bằng cách cung cấp đường dẫn của tài liệudocument = Document[doc_path]
Tiếp theo, chúng tôi làm việc với các hàm docx của python để thêm dữ liệu vào tài liệu
Làm việc với văn bản
Python-Docx cung cấp các tùy chọn khác nhau như đoạn văn, tiêu đề và các tùy chọn khác cho văn bản đơn giản
Tiêu đề là các đoạn có kích thước và kiểu văn bản khác nhau dựa trên cấp độ của nó được xác định trong khi tạo tiêu đề. Cấp độ tiêu đề nằm trong khoảng từ 0-9 dựa trên kích thước văn bản trong đó 0 là tiêu đề phông chữ lớn nhất. Dưới đây là một số ví dụ về tiêu đề
# title heading
document.add_heading["This is a level 1 heading", 0]
# Add other heading levels
document.add_heading["This is a level 2 heading", 2]
document.add_heading["This is a level 3 heading", 3]
document.add_heading["This is a level 5 heading", 5]
document.add_heading["This is a level 7 heading", 7]
document.add_heading["This is a level 9 heading", 9]
Đoạn văn có các thuộc tính khác nhau tùy thuộc vào vị trí của nó và nó phân chia nội dung tương ứng với các dòng của nó. Đoạn văn có các tùy chọn căn chỉnh và kiểu khác nhau để tạo tài liệu với các vị trí và kiểu văn bản được chỉ định
paragraph = document.add_paragraph["TensorFlow is a free and open-source software library for machine learning and artificial intelligence."]
Các đoạn văn có thể được cập nhật/sửa đổi với văn bản mới hoặc các tùy chọn căn chỉnh
# add more text
paragraph.add_run[" It can be used across a range of tasks for "]
# add text with styles
paragraph.add_run['training model '].bold = True # added text with bold
paragraph.add_run['and inference.'].italic = True # added italic text
Các đoạn văn có thể có các kiểu khác như dấu ngoặc kép và các kiểu khác
document.add_paragraph['Intense quote', style='I have no special talent']
Căn chỉnh đoạn văn
Căn chỉnh đoạn văn như căn chỉnh ngang, thụt đầu dòng và các tính năng khác như khoảng cách dòng cũng có thể được áp dụng cho đoạn văn. Trước tiên hãy làm việc với căn ngang
________số 8_______Thụt lề là khoảng cách nằm ngang giữa đoạn văn và các cạnh vùng chứa của nó. Trong python-docx, chúng tôi có thể chỉ định chi tiết bằng Inch để chúng tôi nhập chức năng và có thể thụt lề theo hướng
from docx.shared import Inches
paragraph_r = document.add_paragraph['This is some random paragraph for testing indentation on both [left and right] side of paragraph.']
# only first line indent
paragraph.paragraph_format.first_line_indent = Inches[0.5]
# paragraph indent
paragraph_r.paragraph_format.left_indent = Inches[0.5] # apply 0.5 inch left indentation
paragraph_r.paragraph_format.right_indent = Inches[1] # apply 1 inch right indentation
Khoảng cách dòng cũng là một phần của định dạng đoạn văn và rất dễ sử dụng
from docx.shared import Pt
paragraph.paragraph_format.line_spacing = Pt[18]
Làm việc với phông chữ
Các kiểu phông chữ khác nhau như màu sắc, họ phông chữ và các sửa đổi khác cũng có thể được áp dụng. Ở đây chúng tôi tạo một đoạn văn và thay đổi kích thước phông chữ và họ phông chữ của nó
# import docx document
from docx import Document
# initialize a document
document = Document[]
0Chúng tôi cũng có thể áp dụng màu sắc và các thuộc tính khác như đậm, nghiêng, gạch chân, v.v.
# import docx document
from docx import Document
# initialize a document
document = Document[]
1Đây là đầu ra cho tất cả mã chúng tôi đã viết cho các đoạn văn
Bây giờ chúng ta có thể xuất tài liệu và ghi nó vào thư mục
# import docx document
from docx import Document
# initialize a document
document = Document[]
2Có rất nhiều tính năng khác của python docx như làm việc với danh sách và danh sách lồng nhau, hình ảnh, bảng, đầu trang và chân trang và các thao tác khác. Đối với điều này, bạn có thể kiểm tra các bài đăng khác sẽ sớm được xuất bản hoặc kiểm tra tài liệu chính thức về python-docx