Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

116

Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm.
Learn more.

Các hoạt động sau đây khi tôi dán nó lên trình duyệt:

http://www.somesite.com/details.pl?urn=2344

Nhưng khi tôi thử đọc URL với Python không có gì xảy ra:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile

Tôi có cần phải mã hóa URL, hoặc có điều gì tôi không thấy không?

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Martin Thoma

Huy hiệu vàng 114K148574 Huy hiệu bạc878 Huy hiệu đồng148 gold badges574 silver badges878 bronze badges

hỏi ngày 28 tháng 2 năm 2013 lúc 14:55Feb 28, 2013 at 14:55

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Đối với người dùng

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
1, để tiết kiệm thời gian, sử dụng mã sau,

from urllib.request import urlopen

link = "https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html"

f = urlopen(link)
myfile = f.read()
print(myfile)

Tôi biết có các chủ đề khác nhau cho lỗi:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
2, nhưng nghĩ rằng điều này có thể tiết kiệm thời gian.

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Asclepius

52.5K16 Huy hiệu vàng153 Huy hiệu bạc134 Huy hiệu đồng16 gold badges153 silver badges134 bronze badges

Đã trả lời ngày 25 tháng 8 năm 2017 lúc 17:38Aug 25, 2017 at 17:38

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

i.n.n.mi.n.n.mi.n.n.m

2.7786 huy hiệu vàng25 Huy hiệu bạc49 Huy hiệu đồng6 gold badges25 silver badges49 bronze badges

2

Không có câu trả lời nào trong số này rất tốt cho Python 3 (được thử nghiệm trên phiên bản mới nhất tại thời điểm của bài đăng này).

Đây là cách bạn làm điều đó...

import urllib.request

try:
   with urllib.request.urlopen('http://www.python.org/') as f:
      print(f.read().decode('utf-8'))
except urllib.error.URLError as e:
   print(e.reason)

Trên đây là cho các nội dung trả về 'UTF-8'. Xóa .decode ('UTF-8') nếu bạn muốn Python "đoán mã hóa thích hợp".

Tài liệu: https://docs.python.org/3/l Library/urllib.request.html#module-urllib.Request

Đã trả lời ngày 24 tháng 5 năm 2019 lúc 14:50May 24, 2019 at 14:50

FreddiefreddieFreddie

7801 Huy hiệu vàng10 Huy hiệu bạc20 Huy hiệu đồng1 gold badge10 silver badges20 bronze badges

1

Một giải pháp với các công việc với Python 2.x và Python 3.x sử dụng thư viện tương thích Python 2 và 3

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
3:

from six.moves.urllib.request import urlopen
link = "http://www.somesite.com/details.pl?urn=2344"
response = urlopen(link)
content = response.read()
print(content)

Đã trả lời ngày 20 tháng 1 năm 2015 lúc 8:17Jan 20, 2015 at 8:17

Martin Thomamartin ThomaMartin Thoma

Huy hiệu vàng 114K148574 Huy hiệu bạc878 Huy hiệu đồng148 gold badges574 silver badges878 bronze badges

hỏi ngày 28 tháng 2 năm 2013 lúc 14:55

from urllib.request import urlopen
response = urlopen('http://google.com/')
html = response.read()
print(html)

Đối với người dùng

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
1, để tiết kiệm thời gian, sử dụng mã sau,Mar 8, 2018 at 9:21

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Tôi biết có các chủ đề khác nhau cho lỗi:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
2, nhưng nghĩ rằng điều này có thể tiết kiệm thời gian.Akash Kinwad

Asclepius1 gold badge7 silver badges21 bronze badges

1

#!/usr/bin/python
# -*- coding: utf-8 -*-
# Works on python 3 and python 2.
# when server knows where the request is coming from.

import sys

if sys.version_info[0] == 3:
    from urllib.request import urlopen
else:
    from urllib import urlopen
with urlopen('https://www.facebook.com/') as \
    url:
    data = url.read()

print data

# When the server does not know where the request is coming from.
# Works on python 3.

import urllib.request

user_agent = \
    'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'

url = 'https://www.facebook.com/'
headers = {'User-Agent': user_agent}

request = urllib.request.Request(url, None, headers)
response = urllib.request.urlopen(request)
data = response.read()
print data

52.5K16 Huy hiệu vàng153 Huy hiệu bạc134 Huy hiệu đồngAug 24, 2019 at 7:14

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Đã trả lời ngày 25 tháng 8 năm 2017 lúc 17:38

import urllib

link = "http://www.somesite.com/details.pl?urn=2344"
f = urllib.urlopen(link)           
myfile = f.readline()  
print myfile

2.7786 huy hiệu vàng25 Huy hiệu bạc49 Huy hiệu đồngFeb 28, 2013 at 14:58

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Không có câu trả lời nào trong số này rất tốt cho Python 3 (được thử nghiệm trên phiên bản mới nhất tại thời điểm của bài đăng này).ATOzTOA

Đây là cách bạn làm điều đó...22 gold badges93 silver badges116 bronze badges

1

Trên đây là cho các nội dung trả về 'UTF-8'. Xóa .decode ('UTF-8') nếu bạn muốn Python "đoán mã hóa thích hợp".

import urllib

def read_text():
      quotes = urllib.urlopen("https://s3.amazonaws.com/udacity-hosted-downloads/ud036/movie_quotes.txt")
      contents_file = quotes.read()
      print contents_file

read_text()

Tài liệu: https://docs.python.org/3/l Library/urllib.request.html#module-urllib.RequestAug 22, 2017 at 11:00

# retrieving data from url
# only for python 3

import urllib.request

def main():
  url = "http://docs.python.org"

# retrieving data from URL
  webUrl = urllib.request.urlopen(url)
  print("Result code: " + str(webUrl.getcode()))

# print data from URL 
  print("Returned data: -----------------")
  data = webUrl.read().decode("utf-8")
  print(data)

if __name__ == "__main__":
  main()

Đã trả lời ngày 24 tháng 5 năm 2019 lúc 14:50Nov 27, 2019 at 7:37

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
0

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

Freddiefreddie

7801 Huy hiệu vàng10 Huy hiệu bạc20 Huy hiệu đồng2 gold badges21 silver badges38 bronze badges

Một giải pháp với các công việc với Python 2.x và Python 3.x sử dụng thư viện tương thích Python 2 và 3

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
3:May 16, 2020 at 7:59

Hướng dẫn how do i read a page in python? - làm cách nào để đọc một trang trong python?

1

Làm cách nào để đọc một trang web trong Python?

Để trích xuất dữ liệu bằng cách sử dụng máy quét web với Python, bạn cần làm theo các bước cơ bản sau:..
Tìm URL mà bạn muốn cạo ..
Kiểm tra trang ..
Tìm dữ liệu bạn muốn trích xuất ..
Viết mã ..
Chạy mã và trích xuất dữ liệu ..
Lưu trữ dữ liệu theo định dạng cần thiết ..

Làm cách nào để đọc nội dung của một URL trong Python?

Tìm nạp URL..
Nhập Urllib.Request với Urllib.lời yêu cầu.URLOPEN ('http://python.org/') dưới dạng phản hồi: html = phản hồi.....
Nhập khẩu độ nhập khẩu Tempfile Nhập khẩu Urllib.Request với Urllib.lời yêu cầu.URLOPEN ('http://python.org/') làm phản hồi: với tempfile.....
Nhập urllib.Request req = urllib.lời yêu cầu..

Python có thể đọc HTML không?

Khoa học dữ liệu thực tế Sử dụng Python bằng thư viện này, chúng tôi có thể tìm kiếm các giá trị của thẻ HTML và nhận dữ liệu cụ thể như tiêu đề của trang và danh sách các tiêu đề trong trang.Using this library, we can search for the values of html tags and get specific data like title of the page and the list of headers in the page.

Làm thế nào để bạn đọc dữ liệu trong Python?

Các bước để đọc một tệp văn bản trong Python..
Đầu tiên, hãy mở một tệp văn bản để đọc bằng cách sử dụng hàm Open () ..
Thứ hai, đọc văn bản từ tệp văn bản bằng cách sử dụng tệp read (), readline () hoặc readlines () của đối tượng tệp ..
Thứ ba, đóng tệp bằng phương thức đóng tệp () ..