Chuyển đổi văn bản sang HTML Python

PyTextile là một trình chuyển đổi văn bản sang HTML rất dễ sử dụng

Bạn có thể kiểm tra phần trình diễn mã Dệt may sau đây, mã này có thể chuyển đổi mã này

_This_ is a *test.*

* One
* Two
* Three

Link to "Slashdot":http://slashdot.org/

để này

        

This is a test.

  • One
  • Two
  • Three

Link to Slashdot

Sử dụng PyTextile

Trước tiên, hãy tải xuống PyTextile mới nhất

Gỡ bỏ nó và nhập thư mục dệt may. Bắt đầu trình thông dịch python

Kiểu

   1 import textile
   2 
   3 s = """
   4 _This_ is a *test.*
   5 
   6 * One
   7 * Two
   8 * Three
   9 
  10 Link to "Slashdot":http://slashdot.org/
  11 """
  12 
  13 html = textile.textile( s )
  14 
  15 print html

Bạn sẽ thấy HTML tuyệt đẹp ở mặt bên kia, sẵn sàng để đưa vào trang web

Tùy chọn

PyTextile có 3 đối số tùy chọn

def textile(self, text, rel=None, head_offset=0, html_type='xhtml', sanitize=False):

Xem thêm

reStructuredText dưới dạng định dạng đánh dấu để chuyển đổi văn bản sang HTML

(chưa có. )

Để chuyển đổi nó sang docx, chúng tôi cài đặt python-docx (pip install python-docx) và sau đó chúng tôi nhập mô-đun này

Chuyển đổi văn bản sang HTML Python
Chuyển đổi văn bản sang HTML Python

Dòng cuối cùng của phần cài đặt phải giống như thế này (phiên bản có thể khác)

Đã cài đặt thành công python-docx-0. 8. 10

Bây giờ, chúng ta có thể nhập lớp Tài liệu từ docx (đó là cách chúng ta gọi mô-đun khi chúng ta nhập nó)

1

từ docx nhập Tài liệu

Sau đó, chúng tôi tạo một thể hiện của lớp Tài liệu sẽ tạo một tệp docx hoàn toàn mới (từ)

1

doc = Tài liệu()

Bây giờ chúng ta có thể làm nhiều thứ với tài liệu

Hãy tải văn bản từ văn bản. txt và đặt nó vào tài liệu dưới dạng một đoạn văn

1

2

với mở(input_txt, 'r', encoding='utf-8') as file:

    doc. add_paragraph(tệp. đọc())

Tất cả những gì chúng ta phải làm bây giờ là lưu tệp với tên do chúng ta chọn (textdoc. docx trong ví dụ bên dưới)

1

doc. lưu("textdoc. docx")

Đây là toàn bộ mã

1

2

3

4

5

6

7

từ docx nhập Tài liệu

 

doc = Tài liệu()

với mở("văn bản. txt", 'r', mã hóa='utf-8') as file:

    doc. add_paragraph(tệp. đọc())

doc. lưu("văn bản. docx")

os. tệp bắt đầu("văn bản. docx")

Đây là đầu ra

chữ

Chuyển đổi văn bản sang HTML Python
Chuyển đổi văn bản sang HTML Python

Chuyển văn bản sang pdf với wkthtmltopdf

Làm cái này

  • pip cài đặt pdfkit
  • cài đặt https. //wkthtmltopdf. tổ chức/
  • thêm đường dẫn đến wkhtmltopdf. exe vào các biến môi trường
  • khởi động lại máy tính
  • sử dụng mã dưới đây

Bây giờ, chúng tôi có thể chuyển đổi tệp docx thành pdf từ word… nhưng chúng tôi muốn chuyển nó bằng Python, tất nhiên, chúng tôi không muốn mở Word… lãng phí quá nhiều thời gian

Từ TXT=> sang HTML=> sang PDF

Đơn giản như chuyển văn bản thành html rồi html thành pdf. Đối với tôi đây là cách tốt nhất. Tôi đã quen với các thẻ html và rất đơn giản để mọi người học chúng. Trang html có thể được hiển thị dễ dàng và sau đó được chuyển đổi thành pdf. Trong ví dụ này, chúng tôi sẽ sử dụng https. //wkhtmltopdf. org/ và mô-đun pdfkit cho Python

We will simply read the txt file, transforming the \n new line characters into the html tag
and nothing else to make it simple.

Video về cách thêm biến môi trường cho wkhtmltopdf. người cũ

https. //lập trình trăn. thay thế. org/wp-content/uploads/2019/09/output8-1. mp4

Code chuyển txt sang pdf (thông qua html và pdfkit)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

# từ txt sang html

# cài đặt wkthtml

nhập os

nhập pdfkit

 

với mở("văn bản. txt") dưới dạng tệp.

với mở ("văn bản. html", "w") như output:

tệp = tệp. đọc()

tệp = tệp. thay thế("\n", "
"
)

đầu ra. ghi(tệp)

 

#os. startfile("văn bản. txt")

#os. startfile("văn bản. html")

pdfkit. từ_tệp("văn bản. html", "đầu ra. pdf")

 

os. tệp khởi động("đầu ra. pdf")

Chuyển đổi từ url với pdfkit. from_url

Bạn cũng có thể chuyển đổi html sang pdf từ url, điều này rất thuận tiện ngay cả khi bạn có thể thực hiện việc đó từ Chrome bằng cách chọn in một trang html từ trình duyệt và sau đó chọn lưu nó dưới dạng pdf, vì với mã này, bạn không cần phải . Tiết kiệm thời gian

Bạn có thể chuyển đổi một. TXT sang HTML?

Để chuyển đổi tài liệu TXT sang HTML, chỉ cần kéo và thả tệp TXT vào trường tải lên dữ liệu, chỉ định các tùy chọn chuyển đổi, nhấp vào nút 'Chuyển đổi' và nhận kết quả của bạn . .

Làm cách nào để biến Python thành HTML?

Sử dụng thẻ . Sau đó, bạn có thể chuyển trực tiếp tệp Python. Nó sẽ tạo một widget.