Python kiểm tra xem trang web có hoạt động không

Trong bài viết này, chúng ta sẽ thảo luận về cách tạo tập lệnh python để theo dõi các thay đổi của trang web. Bạn có thể viết mã một chương trình để theo dõi một trang web và nó sẽ thông báo cho bạn nếu có bất kỳ thay đổi nào. Chương trình này có nhiều tình huống hữu ích, chẳng hạn nếu trang web của trường bạn cập nhật điều gì đó thì bạn sẽ biết về nó.  

Tiếp cận

Chúng ta sẽ làm theo các bước sau để viết chương trình này

  1. Đọc URL bạn muốn theo dõi
  2. Băm toàn bộ trang web
  3. Đợi một số giây được chỉ định
  4. Nếu có bất kỳ thay đổi nào so với lần băm trước, hãy thông báo cho tôi nếu không hãy đợi và thực hiện lại lần nữa

Yêu cầu thư viện

Thư viện chúng tôi sẽ sử dụng là

  • thời gian. Để đợi trong một khoảng thời gian xác định
  • hashlib. Để băm nội dung của toàn bộ trang web
  • urllib. Để thực hiện get request và load nội dung của website

Thực hiện

Python3




Yeah !  found
7

Yeah !  found
8
Yeah !  found
9

Yeah !  found
8
Yeah !  found
1

Yeah !  found
2
Yeah !  found
3
Yeah !  found
8
Yeah !  found
5

 

Yeah !  found
6

Yeah !  found
80
Yeah !  found
81
Yeah !  found
82
Yeah !  found
83
Yeah !  found
84

Yeah !  found
85
Yeah !  found
86
Yeah !  found
81
Yeah !  found
88
Yeah !  found
89
Yeah !  found
90
Yeah !  found
91
Yeah !  found
92

 

Yeah !  found
93

Yeah !  found
94

Yeah !  found
95
Yeah !  found
81
Yeah !  found
97

 

Yeah !  found
98

________ 399 ________ 381 ________ 381

Yeah !  found
82
Yeah !  found
83
Yeah !  found
84
Yeah !  found
85

Yeah !  found
86______387
Yeah !  found
85

Yeah !  found
89
Yeah !  found
10____390

_______412____413____390

Yeah !  found
15
Yeah !  found
16

Yeah !  found
15
Yeah !  found
95
Yeah !  found
81
Yeah !  found
97

 

Yeah !  found
15
Yeah !  found
22

Yeah !  found
15
Yeah !  found
99____381
Yeah !  found
81

 

Yeah !  found
15
Yeah !  found
28

_______415____386____431

Yeah !  found
85

 

Yeah !  found
15
Yeah !  found
34

Yeah !  found
15
Yeah !  found
95
Yeah !  found
81
Yeah !  found
97

 

Yeah !  found
15
Yeah !  found
80

________ 415

Yeah !  found
82 _______ 381 _______ 381

 

Yeah !  found
15
Yeah !  found
86

Yeah !  found
15
Yeah !  found
88
Yeah !  found
82
Yeah !  found
81
Yeah !  found
81
Yeah !  found
52

Yeah !  found
53
Yeah !  found
54

 

Yeah !  found
15
Yeah !  found
56

Yeah !  found
15
Yeah !  found
58
Yeah !  found
90

Yeah !  found
53
Yeah !  found
61

_______453____382____383____465

Yeah !  found
85

 

Yeah !  found
53
Yeah !  found
68

Yeah !  found
53
Yeah !  found
95
Yeah !  found
81
Yeah !  found
97

 

_______453____422

Yeah !  found
53
Yeah !  found
99____381
Yeah !  found
81

 

_______453____428

_______453____386____431

Yeah !  found
85

Yeah !  found
53
Yeah !  found
54

 

_______412____3818

________ 412 ________ 3820 ________ 3821

Yeah !  found
15
Yeah !  found
82____383
Yeah !  found
825
Yeah !  found
85

đầu ra

đầu ra

Ghi chú. thời gian. sleep[] mất vài giây làm tham số. Bạn có thể thay đổi thông báo thay vì in trạng thái trên thiết bị đầu cuối, bạn có thể viết chương trình để nhận email

Trong bài viết này, chúng ta sẽ viết một đoạn script Python để kiểm tra xem trang đã cho có được tìm thấy trên máy chủ hay không. Chúng ta sẽ thấy các phương pháp khác nhau để làm điều tương tự

Phương pháp 1. Sử dụng Urllib

Urllib là gói cho phép bạn truy cập trang web bằng chương trình

Cài đặt

pip install urllib

Tiếp cận

  • Nhập mô-đun
  • Chuyển URL trong urllib. request[] đọc URL
  • Bây giờ hãy kiểm tra với urllib. lỗi chứa các ngoại lệ được đưa ra bởi urllib. yêu cầu

Thực hiện

Python3




Yeah !  found
64

Yeah !  found
2
Yeah !  found
3
Yeah !  found
8
Yeah !  found
68

Yeah !  found
2
Yeah !  found
0
Yeah !  found
8
Yeah !  found
2

 

Yeah !  found
3

Yeah !  found
4
Yeah !  found
5

Yeah !  found
6
Yeah !  found
7
Yeah !  found
8
Yeah !  found
9
Yeah !  found
00
Yeah !  found
01

Yeah !  found
6

Yeah !  found
03

Yeah !  found
04

Yeah !  found
05

Yeah !  found
06
Yeah !  found
07

Yeah !  found
6
Yeah !  found
09____200
Yeah !  found
01
Yeah !  found
02

Yeah !  found
6

Yeah !  found
06
Yeah !  found
05

Yeah !  found
6
Yeah !  found
09____200
Yeah !  found
09
Yeah !  found
02

 

Yeah !  found
641
Yeah !  found
5

Yeah !  found
6
Yeah !  found
09____200
Yeah !  found
646
Yeah !  found
01

đầu ra

Yeah !  found

Phương pháp 2. Sử dụng yêu cầu

Yêu cầu cho phép bạn gửi HTTP/1. 1 yêu cầu cực kỳ dễ dàng. Mô-đun này cũng không tích hợp sẵn với Python. Để cài đặt loại này, lệnh dưới đây trong thiết bị đầu cuối

Làm cách nào để nhận trạng thái URL trong Python?

Thiết lập Trình kiểm tra mã trạng thái url .
Sao chép tất cả các URL của bạn vào url. csv. Đặt nó vào cùng thư mục với tập lệnh python của bạn
Chạy tập lệnh và đợi
Nhìn vào kết quả trong urls_withStatusCode. csv. Đối với mỗi URL, một cột bổ sung có mã trạng thái http đã được thêm vào

Làm cách nào để tạo một trang web bằng Python?

Hướng dẫn từng bước để tạo trang web bằng Python .
Bước 1. Nắm vững về HTML và CSS. .
Bước 2. Nắm vững kiến ​​thức cơ bản về JavaScript. .
Bước 3. Làm chủ mô hình đối tượng tài liệu. .
Bước 4. Phát triển phụ trợ với Python. .
Bước 5. Chọn khung và cơ sở dữ liệu của bạn

Chủ Đề