Hướng dẫn session post python - phiên bài đăng python

Hướng dẫn session post python - phiên bài đăng python

Đã đăng vào thg 5 9, 6:40 SA 1 phút đọc 1 phút đọc

Thư viện yêu cầu (Requests library) là một mặt rất quan trọng của Python để tạo ra những yêu cầu HTTP tới một đường dẫn (URL) cụ thể nào đó. Bài viết này nhằm hướng dẫn tạo yêu cầu POST tới một đường dẫn cụ thể, bằng cách sử dụng phương thức requests.post()

Đầu tiên, cùng tìm hiểu POST là gì

POST là một phương thức yêu cầu được hỗ trợ bởi giao thức HTTP khi sử dụng Web. Thông thường, phương thức post sẽ đưa ra yêu cầu để máy chủ web (web server) chấp nhận thông tin được gửi trong nội dung tin nhắn yêu cầu (request message), mà đa phần là để lưu trữ nó. Nội dung này sẽ được sử dụng khi upload file hoặc submit một web form nào đó.

Cách tạo POST trên Python

Sử dụng hàm có sẵn để gọi post() theo cú pháp sau:

requests.post(url, params={key: value}, args)

Ví dụ:

import requests

# Making a POST request
r = requests.post('https://httpbin.org / post', data ={'key':'value'})

# check status code for response received
# success code - 200
print(r)

# print content of request
print(r.json())

lưu thành file request.py và bắt đầu chạy. Kết quả sẽ ra như bên dưới:

Hướng dẫn session post python - phiên bài đăng python

  1. Lợi ích của phương thức POST Bảo mật hơn phương thức GET, vì thông tin người dùng nhập vào sẽ không hiển thị trong log trên server. Lượng dữ liệu truyền đi bởi phương thức POST sẽ lớn hơn

  2. Hạn chế của phương thức POST Lịch sử của POST không được lưu trên cache hoặc lịch sử duyệt web

All rights reserved

Vietnamese (Tiếng Việt) translation by Dai Phong (you can also view the original English article) Dai Phong (you can also view the original English article)

Requests là một mô-đun Python mà bạn có thể sử dụng để gửi tất cả các loại yêu cầu HTTP. Đây là một thư viện dễ sử dụng với nhiều tính năng khác nhau, từ việc truyền các tham số trong URL cho đến gửi các header tùy biến và Xác minh SSL. Trong hướng dẫn này, bạn sẽ được học cách sử dụng thư viện requests để gửi các yêu cầu HTTP đơn giản bằng Python.

Bạn có thể sử dụng Requests với Python phiên bản 2.6-2.7 và 3.3-3.6. Trước khi tiếp tục, bạn nên biết rằng Requests là một mô-đun bên ngoài, do đó bạn sẽ phải cài đặt nó trước khi chạy thử các ví dụ trong hướng dẫn này. Bạn có thể cài đặt nó bằng cách chạy lệnh sau đây trong terminal:

pip install requests

Một khi bạn đã cài đặt mô-đun, bạn có thể kiểm tra nó đã được cài đặt thành công hay chưa bằng cách import nó bằng lệnh này:

import requests

Nếu cài đặt thành công, bạn sẽ không thấy bất kỳ thông báo lỗi nào.

Tạo một Yêu cầu GET

Rất dễ để gửi một yêu cầu HTTP bằng Requests. Bạn bắt đầu bằng cách import module và sau đó thực hiện yêu cầu. Dưới đây là một ví dụ:

import requests
req = requests.get('https://tutsplus.com/')

Tất cả các thông tin về yêu cầu của chúng ta bây giờ được lưu trữ trong một đối tượng Response được gọi là

pip install requests
3. Ví dụ: bạn có thể lấy mã hóa của trang web bằng thuộc tính
pip install requests
4. Bạn cũng có thể lấy mã trạng thái của yêu cầu bằng thuộc tính
pip install requests
5.

req.encoding     # returns 'utf-8'
req.status_code  # returns 200

Bạn có thể truy cập các cookie mà máy chủ đã gửi lại bằng

pip install requests
6. Tương tự, bạn có thể nhận các header phản hồi bằng
pip install requests
7. Thuộc tính
pip install requests
7 trả về một dictionary chứa các header phản hồi không phân biệt chữ hoa chữ thường. Điều này có nghĩa là
pip install requests
9,
import requests
0 và
import requests
1 tất cả sẽ trả về giá trị của header phản hồi
import requests
2.

Bạn có thể kiểm tra xem phản hồi có phải là một redirect HTTP đúng ngữ pháp mà có thể đã được xử lý tự động bằng thuộc tính

import requests
3. Nó sẽ trả về
import requests
4 hay
import requests
5 dựa trên phản hồi. Bạn cũng có thể lấy được thời gian trôi qua giữa gửi yêu cầu và nhận lại phản hồi bằng thuộc tính
import requests
6.

URL mà bạn truyền cho hàm

import requests
7 có thể khác với URL sau cùng của phản hồi vì nhiều lý do, kể cả redirect. Để xem URL phản hồi sau cùng, bạn có thể sử dụng thuộc tính
import requests
8.

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'

Nhận tất cả các thông tin này về trang web mà bạn đang truy cập là điều rất tốt, nhưng có thể bạn muốn truy cập vào nội dung thật sự. Nếu nội dung mà bạn đang truy cập là văn bản, bạn có thể sử dụng thuộc tính

import requests
9 để truy xuất nó. Nội dung sau đó được phân tích thành unicode. Bạn có thể truyền vào mã hoá để giải mã văn bản bằng thuộc tính
pip install requests
4.

Trong trường hợp phản hồi không phải là văn bản, bạn có thể truy cập chúng dưới dạng nhị phân bằng

import requests
req = requests.get('https://tutsplus.com/')
1. Mô-đun này sẽ tự động giải mã
import requests
req = requests.get('https://tutsplus.com/')
2 và
import requests
req = requests.get('https://tutsplus.com/')
3. Điều này có thể hữu ích khi bạn đang xử lý các tập tin media. Tương tự, bạn có thể truy cập nội dung đã được mã hóa dạng json của phản hồi, nếu có, hãy sử dụng
import requests
req = requests.get('https://tutsplus.com/')
4.

Bạn cũng có thể lấy được phản hồi gốc từ máy chủ bằng

import requests
req = requests.get('https://tutsplus.com/')
5. Hãy nhớ rằng bạn sẽ phải truyền vào
import requests
req = requests.get('https://tutsplus.com/')
6 trong yêu cầu để có được phản hồi gốc.

Một số tập tin mà bạn tải xuống từ Internet sử dụng mô-đun Requests có thể có một kích thước rất lớn. Trong những trường hợp như vậy, không nên tải toàn bộ phản hồi hoặc tập tin vào bộ nhớ cùng một lúc. Bạn có thể tải xuống từng phần hoặc khối của một tập tin bằng phương thức

import requests
req = requests.get('https://tutsplus.com/')
7.

Phương thức này lặp qua dữ liệu phản hồi bằng số byte

import requests
req = requests.get('https://tutsplus.com/')
8 tại một thời điểm. Khi
import requests
req = requests.get('https://tutsplus.com/')
6 được thiết lập trong yêu cầu, phương thức này sẽ tránh đọc toàn bộ tập tin vào bộ nhớ cùng một lúc cho các phản hồi lớn. Tham số
import requests
req = requests.get('https://tutsplus.com/')
8 có thể là một số nguyên hoặc
req.encoding     # returns 'utf-8'
req.status_code  # returns 200
1. Khi thiết lập một giá trị số nguyên,
import requests
req = requests.get('https://tutsplus.com/')
8 xác định số byte cần đọc vào bộ nhớ.

Khi

import requests
req = requests.get('https://tutsplus.com/')
8 được thiết lập thành
req.encoding     # returns 'utf-8'
req.status_code  # returns 200
1 và
req.encoding     # returns 'utf-8'
req.status_code  # returns 200
5 được thiết lập thành
import requests
4, thì dữ liệu sẽ được đọc khi nó đến trong bất kỳ khối kích thước nào nhận được. Khi
import requests
req = requests.get('https://tutsplus.com/')
8 được thiết lập thành
req.encoding     # returns 'utf-8'
req.status_code  # returns 200
1 và
req.encoding     # returns 'utf-8'
req.status_code  # returns 200
5 được thiết lập thành
import requests
5, tất cả các dữ liệu sẽ được trả về như một khối đơn.

Hãy tải hình ảnh khu rừng trên Pixabay bằng mô-đun Requests. Đây là hình ảnh thực tế:

Hướng dẫn session post python - phiên bài đăng python
Hướng dẫn session post python - phiên bài đăng python
Hướng dẫn session post python - phiên bài đăng python

Đây là code mà bạn cần:

import requests
req = requests.get('path/to/forest.jpg', stream=True)
req.raise_for_status()
with open('Forest.jpg', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        print('Received a Chunk')
        fd.write(chunk)

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
1 là URL hình ảnh thực tế; bạn có thể thiết lập URL của bất kỳ hình ảnh nào khác vào đây để tải về cái khác. Tập tin hình ảnh đó có kích thước 185kb và bạn đã thiết lập
import requests
req = requests.get('https://tutsplus.com/')
8 thành 50.000 byte. Điều này có nghĩa là thông điệp "Received a Chunk" sẽ được in bốn lần trong terminal. Kích thước của khối cuối cùng sẽ chỉ là 39350 byte bởi vì phần còn lại của tập tin nhận được sau ba lần lặp đầu tiên là 39350 byte.

Requests cũng cho phép bạn truyền các tham số trong một URL. Điều này có thể hữu ích khi bạn đang tìm kiếm trang web để lấy một số kết quả như hình ảnh hoặc bài hướng dẫn cụ thể. Bạn có thể cung cấp các chuỗi truy vấn này như là một dictionary bằng từ khóa

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
3 trong yêu cầu GET. Dưới đây là một ví dụ:

import requests

query = {'q': 'Forest', 'order': 'popular', 'min_width': '800', 'min_height': '600'}
req = requests.get('https://pixabay.com/en/photos/', params=query)

req.url
# returns 'https://pixabay.com/en/photos/?order=popular&min_height=600&q=Forest&min_width=800'

Tạo một Yêu cầu POST

Tạo một yêu cầu POST cũng tương tự như yêu cầu GET. Bạn chỉ cần sử dụng hàm

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
4 thay cho
import requests
7. Việc này có thể hữu ích khi bạn tự động submit các form. Ví dụ, đoạn code sau sẽ tải toàn bộ trang Wikipedia về Công nghệ Nano và lưu nó trên máy tính của bạn.

import requests
req = requests.post('https://en.wikipedia.org/w/index.php', data = {'search':'Nanotechnology'})
req.raise_for_status()
with open('Nanotechnology.html', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        fd.write(chunk)

Như đã đề cập ở trên, bạn có thể truy cập các cookie và header mà máy chủ gửi lại cho bạn bằng

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
6 và
pip install requests
7. Requests cũng cho phép bạn gửi các cookie và header tùy biến của riêng bạn cùng với một yêu cầu. Điều này có thể hữu ích khi bạn muốn, giả sử thiết lập một user agent tùy biến cho yêu cầu của bạn.

Để thêm các header HTTP vào yêu cầu, bạn chỉ cần truyền chúng trong một

import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
8 vào tham số
import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
9. Tương tự, bạn cũng có thể gửi cookie của riêng bạn đến một máy chủ bằng cách sử dụng
import requests
req = requests.get('http://www.tutsplus.com/')

req.encoding      # returns 'utf-8'
req.status_code   # returns 200
req.elapsed       # returns datetime.timedelta(0, 1, 666890)
req.url           # returns 'https://tutsplus.com/'

req.history      
# returns [, ]

req.headers['Content-Type']
# returns 'text/html; charset=utf-8'
8 truyền vào tham số
import requests
req = requests.get('path/to/forest.jpg', stream=True)
req.raise_for_status()
with open('Forest.jpg', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        print('Received a Chunk')
        fd.write(chunk)
1.

import requests

url = 'http://some-domain.com/set/cookies/headers'

headers = {'user-agent': 'your-own-user-agent/0.0.1'}
cookies = {'visit-month': 'February'}

req = requests.get(url, headers=headers, cookies=cookies)

Cookie cũng có thể được truyền thông qua trong một Cookie Jar. Chúng cung cấp một giao diện đầy đủ hơn để cho phép bạn sử dụng các cookie đó trên nhiều đường dẫn. Dưới đây là một ví dụ:

pip install requests
0

Các Đối tượng Session

Đôi khi cần phải giữ nguyên các tham số nhất định trên nhiều yêu cầu. Đối tượng Session xử lý chính xác điều đó. Ví dụ, nó sẽ giữ dữ liệu cookie trên tất cả các yêu cầu được thực hiện bằng cùng một session. Đối tượng Session sử dụng connection-pooling của urllib3. Điều này có nghĩa là kết nối TCP bên dưới sẽ được sử dụng lại cho tất cả các yêu cầu được thực hiện đến cùng một máy chủ. Điều này có thể gia tăng đáng kể hiệu suất. Bạn cũng có thể sử dụng các phương thức của đối tượng Requests với đối tượng Session.

Dưới đây là ví dụ về nhiều yêu cầu được gửi bằng cách sử dụng và không sử dụng session:

pip install requests
1

Như bạn thấy, cookie session có một giá trị khác nhau trong yêu cầu thứ nhất và thứ hai, nhưng nó có cùng giá trị khi chúng ta sử dụng đối tượng Session. Bạn sẽ nhận được một giá trị khác khi thử code này, nhưng cũng tương tự, cookie cho các yêu cầu được thực hiện bằng cách sử dụng đối tượng Session sẽ có cùng giá trị.

Session cũng hữu ích khi bạn muốn gửi dữ liệu tương tự trên tất cả các yêu cầu. Ví dụ, nếu bạn quyết định gửi một cookie hoặc một header user-agent với tất cả các yêu cầu đến một tên miền nhất định, bạn có thể sử dụng các đối tượng Session. Dưới đây là một ví dụ:

pip install requests
2

Như bạn có thể thấy, cookie session

import requests
req = requests.get('path/to/forest.jpg', stream=True)
req.raise_for_status()
with open('Forest.jpg', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        print('Received a Chunk')
        fd.write(chunk)
2 được gửi cùng với cả ba yêu cầu. Tuy nhiên, cookie
import requests
req = requests.get('path/to/forest.jpg', stream=True)
req.raise_for_status()
with open('Forest.jpg', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        print('Received a Chunk')
        fd.write(chunk)
3 chỉ được gửi trong yêu cầu thứ hai. Còn chưa đề cập đến cookie
import requests
req = requests.get('path/to/forest.jpg', stream=True)
req.raise_for_status()
with open('Forest.jpg', 'wb') as fd:
    for chunk in req.iter_content(chunk_size=50000):
        print('Received a Chunk')
        fd.write(chunk)
4 trong yêu cầu thứ ba. Điều này xác nhận thực tế rằng cookie hoặc tập dữ liệu khác trên các yêu cầu riêng lẻ sẽ không được gửi cùng với các yêu cầu session khác.

Phần tóm tắt

Các khái niệm được thảo luận trong hướng dẫn này sẽ giúp bạn tạo các yêu cầu đến máy chủ cơ bản bằng cách truyền header, cookie hoặc chuỗi truy vấn cụ thể. Điều này sẽ rất tiện dụng khi bạn đang cố gắng thu thập thông tin từ một số trang web. Giờ đây, bạn sẽ có thể tự động tải các bài nhạc và hình nền từ các trang web khác nhau sau khi bạn đã tìm ra URL mẫu.

Đừng ngần ngại xem thử những gì chúng tôi đang bán và những tài liệu dành cho học tập trên Market, và đừng ngần ngại đặt câu hỏi và cung cấp các phản hồi có giá trị của bạn.

Nếu bạn có bất kỳ câu hỏi nào liên quan đến hướng dẫn này, xin vui lòng cho tôi biết trong phần bình luận nhé.