Python cung cấp một số cách để tải xuống tệp từ internet. Điều này có thể được thực hiện qua HTTP bằng gói urllib hoặc thư viện yêu cầu. Hướng dẫn này sẽ thảo luận cách sử dụng các thư viện này để tải xuống tệp từ URL bằng Python
Thư viện yêu cầu
Thư viện yêu cầu là một trong những thư viện phổ biến nhất trong Python. Yêu cầu cho phép bạn gửi HTTP/1. 1 yêu cầu mà không cần thêm chuỗi truy vấn vào URL của bạn theo cách thủ công hoặc mã hóa biểu mẫu dữ liệu POST của bạn
Với thư viện yêu cầu, bạn có thể thực hiện rất nhiều chức năng bao gồm
- thêm dữ liệu biểu mẫu
- thêm nhiều tập tin
- truy cập dữ liệu phản hồi của Python
Yêu cầu
Điều đầu tiên bạn cần làm là cài đặt thư viện và nó đơn giản như
1
pip install requests
Để kiểm tra xem quá trình cài đặt có thành công hay không, bạn có thể thực hiện một kiểm tra rất dễ dàng trong trình thông dịch Python của mình bằng cách nhập
1
import requests
Nếu cài đặt thành công sẽ không có lỗi
Yêu cầu HTTP bao gồm
- ĐƯỢC
- BƯU KIỆN
- ĐẶT
- XÓA BỎ
- TÙY CHỌN
- ĐẦU
Thực hiện một yêu cầu NHẬN
Thực hiện các yêu cầu rất dễ dàng, như minh họa dưới đây
1
import requests
2
req = requests.get[“https://www.google.com”]
Lệnh trên sẽ lấy trang web google và lưu trữ thông tin trong biến
154. Sau đó, chúng tôi cũng có thể tiếp tục nhận các thuộc tính khác
Chẳng hạn, để biết việc tìm nạp trang web Google có thành công hay không, chúng tôi sẽ truy vấn
155
1
import requests
2
pip install requests
1pip install requests
2pip install requests
3pip install requests
4pip install requests
5pip install requests
6pip install requests
7pip install requests
8pip install requests
9
Điều gì sẽ xảy ra nếu chúng ta muốn tìm ra loại mã hóa của trang web Google?
1
11_______6_______
13
Bạn cũng có thể muốn biết nội dung của phản hồi
1
15
Đây chỉ là nội dung rút gọn của phản hồi
1
17_______6_______
19
pip install requests
2_______3_______1pip install requests
4import requests3_______1_______6
import requests5
pip install requests
8import requests7
import requests8
import requests9
Thực hiện yêu cầu POST
Nói một cách đơn giản, một yêu cầu POST được sử dụng để tạo hoặc cập nhật dữ liệu. Điều này đặc biệt được sử dụng trong việc gửi các hình thức
Giả sử bạn có một biểu mẫu đăng ký lấy địa chỉ email và mật khẩu làm dữ liệu đầu vào. Khi bấm vào nút gửi đăng ký, yêu cầu đăng bài sẽ như hình bên dưới
1
11_______6_______
13
pip install requests
215
Thực hiện yêu cầu PUT
Yêu cầu PUT tương tự như yêu cầu POST. Nó được sử dụng để cập nhật dữ liệu. Chẳng hạn, API bên dưới cho biết cách thực hiện yêu cầu PUT
1
17_______6_______
19
pip install requests
2_______3_______1
Thực hiện một yêu cầu XÓA
Một yêu cầu XÓA, như tên gợi ý, được sử dụng để xóa dữ liệu. Dưới đây là một ví dụ về yêu cầu XÓA
1
import requests3_______6_______
import requests5
pip install requests
2import requests7
Gói urllib
urllib là gói thu thập một số mô-đun để làm việc với URL
- để mở và đọc URL
- chứa các ngoại lệ được đưa ra bởi
- để phân tích cú pháp URL
- để phân tích cú pháp tệp
1
61
156 cung cấp một giao diện rất đơn giản, ở dạng hàm
163, có khả năng tìm nạp URL bằng nhiều giao thức khác nhau. Nó cũng cung cấp giao diện phức tạp hơn một chút để xử lý xác thực cơ bản, cookie, proxy, v.v.
Cách tìm nạp URL bằng urllib
Cách đơn giản nhất để sử dụng
156 như sau
1
import requests9
2
21
pip install requests
2_______6_______3Nếu bạn muốn truy xuất tài nguyên internet và lưu trữ nó, bạn có thể thực hiện thông qua chức năng
1
import requests9
2
27
pip install requests
2_______6_______9
Tải xuống hình ảnh bằng Python
Trong ví dụ này, chúng tôi muốn tải xuống hình ảnh mẫu này bằng cả thư viện yêu cầu và mô-đun urllib
1
req = requests.get[“https://www.google.com”]1
2
req = requests.get[“https://www.google.com”]3
pip install requests
2req = requests.get[“https://www.google.com”]5
pip install requests
4import requests9
pip install requests
6req = requests.get[“https://www.google.com”]9
pip install requests
811
import requests8
13
14
15
16
import requests
18
19
import requests0
import requests1
import requests2
import requests3
import requests4
import requests5
import requests6
import requests7
Tải xuống tệp PDF bằng Python
Trong ví dụ này, chúng tôi sẽ tải xuống bản PDF về các xu hướng của Google
1
import requests9
2
req = requests.get[“https://www.google.com”]3
pip install requests
2pip install requests
03pip install requests
4import requests9
pip install requests
6req = requests.get[“https://www.google.com”]9
pip install requests
8pip install requests
09import requests8
13
14
15
16
import requests
18
pip install requests
17import requests0
import requests1
import requests2
import requests3
import requests4
pip install requests
23import requests6
import requests7
Tải xuống tệp Zip bằng Python
Trong ví dụ này, chúng tôi sẽ tải xuống nội dung của kho lưu trữ GitHub và lưu trữ tệp cục bộ
1
pip install requests
272
13
pip install requests
215
pip install requests
4import requests
pip install requests
6pip install requests
17pip install requests
8import requests1
import requests8
import requests3
14
pip install requests
4116
import requests7
18
req = requests.get[“https://www.google.com”]3
import requests0
pip install requests
47import requests2
import requests9
import requests4
req = requests.get[“https://www.google.com”]9
import requests6
pip install requests
53
Tải xuống video bằng Python
Trong ví dụ này, chúng tôi muốn tải xuống một video bài giảng
1
pip install requests
552
pip install requests
57pip install requests
2pip install requests
413
pip install requests
615
pip install requests
8import requests
import requests8
14
pip install requests
6716
18
pip install requests
17import requests0
import requests1
import requests2
import requests3
import requests4
pip install requests
76import requests6
import requests7
pip install requests
79pip install requests
80pip install requests
81req = requests.get[“https://www.google.com”]3
pip install requests
83pip install requests
47pip install requests
85pip install requests
86pip install requests
87pip install requests
67pip install requests
89pip install requests
90pip install requests
91pip install requests
92pip install requests
93Tải xuống tệp CSV bằng Python
Bạn cũng có thể sử dụng thư viện yêu cầu và urllib để tải xuống tệp CSV và xử lý phản hồi bằng mô-đun csv. Hãy sử dụng một số dữ liệu địa chỉ CSV mẫu
1
import requests
2
pip install requests
97pip install requests
2pip install requests
4100
pip install requests
6102
pip install requests
8104
import requests8
14
107
16
109
18
111
import requests0
import requests2
114
import requests4
116
import requests6
118
pip install requests
79120
pip install requests
81pip install requests
83123
pip install requests
85pip install requests
87126
pip install requests
89pip install requests
90import requests9
pip install requests
92131
132
133
134
135
pip install requests
97137
138
139
140
141
142
143
144
145
146
147
148
149________0__
Phần kết luận
Hướng dẫn này đã bao gồm các phương pháp được sử dụng phổ biến nhất để tải xuống tệp cũng như các định dạng tệp phổ biến nhất. Mặc dù bạn sẽ viết ít mã hơn khi sử dụng mô-đun urllib, nhưng mô-đun yêu cầu được ưu tiên hơn do tính đơn giản, phổ biến và nhiều tính năng bổ sung của nó, bao gồm