Chuyển đổi văn bản sang HTML Python
PyTextile là một trình chuyển đổi văn bản sang HTML rất dễ sử dụng Show
Bạn có thể kiểm tra phần trình diễn mã Dệt may sau đây, mã này có thể chuyển đổi mã này _This_ is a *test.* * One * Two * Three Link to "Slashdot":http://slashdot.org/ để này
Link to Slashdot Sử dụng PyTextileTrước tiên, hãy tải xuống PyTextile mới nhất Gỡ bỏ nó và nhập thư mục dệt may. Bắt đầu trình thông dịch python Kiểu 1 import textile 2 3 s = """ 4 _This_ is a *test.* 5 6 * One 7 * Two 8 * Three 9 10 Link to "Slashdot":http://slashdot.org/ 11 """ 12 13 html = textile.textile( s ) 14 15 print html Bạn sẽ thấy HTML tuyệt đẹp ở mặt bên kia, sẵn sàng để đưa vào trang web Tùy chọnPyTextile có 3 đối số tùy chọn def textile(self, text, rel=None, head_offset=0, html_type='xhtml', sanitize=False): Xem thêmreStructuredText dưới dạng định dạng đánh dấu để chuyển đổi văn bản sang HTML (chưa có. ) Để chuyển đổi nó sang docx, chúng tôi cài đặt python-docx (pip install python-docx) và sau đó chúng tôi nhập mô-đun này Dòng cuối cùng của phần cài đặt phải giống như thế này (phiên bản có thể khác) Đã cài đặt thành công python-docx-0. 8. 10 Bây giờ, chúng ta có thể nhập lớp Tài liệu từ docx (đó là cách chúng ta gọi mô-đun khi chúng ta nhập nó) 1 từ docx nhập Tài liệu Sau đó, chúng tôi tạo một thể hiện của lớp Tài liệu sẽ tạo một tệp docx hoàn toàn mới (từ) 1 doc = Tài liệu() Bây giờ chúng ta có thể làm nhiều thứ với tài liệu Hãy tải văn bản từ văn bản. txt và đặt nó vào tài liệu dưới dạng một đoạn văn 1 2 với mở(input_txt, 'r', encoding='utf-8') as file: doc. add_paragraph(tệp. đọc()) Tất cả những gì chúng ta phải làm bây giờ là lưu tệp với tên do chúng ta chọn (textdoc. docx trong ví dụ bên dưới) 1 doc. lưu("textdoc. docx") Đây là toàn bộ mã 1 2 3 4 5 6 7 từ docx nhập Tài liệu
doc = Tài liệu() với mở("văn bản. txt", 'r', mã hóa='utf-8') as file: doc. add_paragraph(tệp. đọc()) doc. lưu("văn bản. docx") os. tệp bắt đầu("văn bản. docx") Đây là đầu ra chữ Chuyển văn bản sang pdf với wkthtmltopdfLàm cái này
Bây giờ, chúng tôi có thể chuyển đổi tệp docx thành pdf từ word… nhưng chúng tôi muốn chuyển nó bằng Python, tất nhiên, chúng tôi không muốn mở Word… lãng phí quá nhiều thời gian Từ TXT=> sang HTML=> sang PDFĐơn giản như chuyển văn bản thành html rồi html thành pdf. Đối với tôi đây là cách tốt nhất. Tôi đã quen với các thẻ html và rất đơn giản để mọi người học chúng. Trang html có thể được hiển thị dễ dàng và sau đó được chuyển đổi thành pdf. Trong ví dụ này, chúng tôi sẽ sử dụng https. //wkhtmltopdf. org/ và mô-đun pdfkit cho Python We will simply read the txt file, transforming the \n new line characters into the html tag Video về cách thêm biến môi trường cho wkhtmltopdf. người cũhttps. //lập trình trăn. thay thế. org/wp-content/uploads/2019/09/output8-1. mp4 Code chuyển txt sang pdf (thông qua html và pdfkit)1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 # từ txt sang html # cài đặt wkthtml nhập os nhập pdfkit
với mở("văn bản. txt") dưới dạng tệp. với mở ("văn bản. html", "w") như output: tệp = tệp. đọc() tệp = tệp. thay thế("\n", " đầu ra. ghi(tệp)
#os. startfile("văn bản. txt") #os. startfile("văn bản. html") pdfkit. từ_tệp("văn bản. html", "đầu ra. pdf")
os. tệp khởi động("đầu ra. pdf") Chuyển đổi từ url với pdfkit. from_urlBạn cũng có thể chuyển đổi html sang pdf từ url, điều này rất thuận tiện ngay cả khi bạn có thể thực hiện việc đó từ Chrome bằng cách chọn in một trang html từ trình duyệt và sau đó chọn lưu nó dưới dạng pdf, vì với mã này, bạn không cần phải . Tiết kiệm thời gian Bạn có thể chuyển đổi một. TXT sang HTML?Để chuyển đổi tài liệu TXT sang HTML, chỉ cần kéo và thả tệp TXT vào trường tải lên dữ liệu, chỉ định các tùy chọn chuyển đổi, nhấp vào nút 'Chuyển đổi' và nhận kết quả của bạn . .
Làm cách nào để biến Python thành HTML?Sử dụng thẻ . Sau đó, bạn có thể chuyển trực tiếp tệp Python. Nó sẽ tạo một widget. |