Thông tin được tìm nạp bằng yêu cầu JSONP, yêu cầu này chứa văn bản quảng cáo và liên kết đến hình ảnh quảng cáo. Tệp JSON và hình ảnh được tìm nạp từ buysellads. com hoặc buysellads. net
Nếu bạn có bất kỳ câu hỏi hoặc thắc mắc nào, xin vui lòng gửi email
Một trong những điều tốt đẹp về urllib. parse [và tương đương với Python 2 của nó] là nó sẽ xử lý các URL một phần cũng như các URL đầy đủ. Điều này thuận tiện vì có nhiều tình huống khác nhau trong ngữ cảnh máy chủ web nơi bạn có thể nhận được một phần URL hoặc URL đầy đủ và bạn muốn giải mã cả hai để trích xuất các mẩu thông tin khác nhau [chủ yếu là đường dẫn, vì đó là tất cả . Tuy nhiên, URL là những thứ phức tạp khi bạn nhìn trộm; . Nó phức tạp lắm. Một trình phân tích cú pháp URL thích hợp cần xử lý toàn bộ sự phức tạp đó và điều đó có nghĩa là nó che giấu một bất ngờ về cách các URL tương đối sẽ được diễn giải
Ví dụ: giả sử bạn đang phân tích cú pháp một REQUEST_URI
của Apache để trích xuất đường dẫn của yêu cầu. Bạn phải thực sự phân tích cú pháp URI của yêu cầu để có được điều này, bởi vì những người hài hước có thể gửi cho bạn các URL đầy đủ trong các yêu cầu HTTP GET
, mà Apache sẽ chuyển cho bạn. Bây giờ, giả sử ai đó vô tình tạo một URL cho trang web của bạn trông giống như 'https. //thí dụ. org//your/page/url' [với hai dấu gạch chéo sau máy chủ thay vì một] và truy cập nó, đồng thời bạn cố gắng giải mã kết quả của những gì Apache sẽ đưa cho bạn
>>> urllib.parse.urlparse["//your/page/url"] ParseResult[scheme='', netloc='your', path='/page/url', params='', query='', fragment='']
Vấn đề ở đây là '//ahost. org/some/path' là hoàn toàn hợp pháp, vì vậy đó là những gì urllib. parse sẽ tạo ra khi bạn cung cấp cho nó thứ gì đó trông giống như vậy, nghĩa là thứ gì đó bắt đầu bằng '//'. Bởi vì chúng tôi biết nó đến từ đâu, bạn và tôi biết rằng đây là một URL tương đối có thêm / ở phía trước, nhưng không thể đưa ra giả định đó và không có cách nào để hạn chế tính tổng quát tuân thủ tiêu chuẩn của nó
Nếu đây là một vấn đề đối với bạn [cũng như đối với tôi gần đây], có lẽ điều tốt nhất bạn có thể làm là kiểm tra '//' ở đầu trước khi bạn gọi urlparse[] và biến nó thành '/' [một cách đơn giản . Làm bất cứ điều gì phức tạp hơn có cảm giác như nó quá gần với việc cố gắng thực sự hiểu các URL, đó là công việc mà chúng tôi muốn giao cho urlparse[] vì nó phức tạp
Tái bút. Bởi vì tôi vừa mới kiểm tra nó, nên kết quả của việc cung cấp urlparse[] một URL tương đối bắt đầu bằng ba dấu gạch chéo trở lên là nó được hiểu là URL tương đối, không phải URL tương đối của giao thức. path
của kết quả sẽ bị loại bỏ các dấu gạch chéo ở đầu
❮ Mô-đun Yêu cầu
Thí dụ
Gửi yêu cầu tới một trang web và trả về mã trạng thái
yêu cầu nhập khẩu
x = yêu cầu. nhận ['https. //w3schools. com']
in[x. status_code]
Định nghĩa và cách sử dụng
Phương thức get[]
gửi yêu cầu GET đến url đã chỉ định
cú pháp
yêu cầu. get[url, params={key. giá trị}, đối số]
args có nghĩa là không hoặc nhiều đối số được đặt tên trong bảng tham số bên dưới. Thí dụ
yêu cầu. nhận [url, thời gian chờ = 2. 50]
Giá trị tham số
Tham sốMô tảurlDùng thửBắt buộc. Url của requestparamsDùng thửTùy chọn. Một từ điển, danh sách các bộ dữ liệu hoặc byte để gửi dưới dạng chuỗi truy vấnDefault
None
allow_redirectsTry itOptional. Boolean để bật/tắt chuyển hướngMặc định
True
[cho phép chuyển hướng]authDùng thửTùy chọn. Một bộ để kích hoạt xác thực HTTP nhất địnhMặc định
None
chứng chỉDùng thửTùy chọn. Một Chuỗi hoặc Tuple chỉ định tệp hoặc khóa chứng chỉMặc định
None
cookieDùng thửTùy chọn. Từ điển cookie để gửi đến url đã chỉ địnhTiêu đề
None
mặc địnhDùng thửTùy chọn. Một từ điển các tiêu đề HTTP để gửi đến url đã chỉ địnhMặc định
None
proxyDùng thửTùy chọn. Một từ điển của giao thức cho url proxyMặc định
None
luồngDùng thửTùy chọn. Một dấu hiệu Boolean nếu phản hồi nên được tải xuống ngay lập tức [Sai] hoặc phát trực tuyến [Đúng]Thời gian chờ mặc định
False
Dùng thửTùy chọn. Một số hoặc một bộ, cho biết cần đợi bao nhiêu giây để máy khách tạo kết nối và/hoặc gửi phản hồiMặc định
None
có nghĩa là yêu cầu sẽ tiếp tục cho đến khi kết nối bị đóngxác minhHãy thửDùng thửTùy chọn. Chỉ báo Boolean hoặc Chuỗi để xác minh chứng chỉ TLS của máy chủ hay không
Mặc định
True
Giá trị trả về
Phương thức get[] trả về một yêu cầu. đối tượng phản hồi
❮ Mô-đun Yêu cầu
Nếu bạn cần loại trừ một phần của đường dẫn khỏi kết quả, hãy sử dụng các phương thức str.rsplit[]
hoặc str.split[]
Phương thức trả về một danh sách các từ trong chuỗi bằng cách sử dụng dấu phân cách được cung cấp làm chuỗi phân cách