-1
Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm.
Learn more.
Tôi đã lưu trữ một số tệp HTML và đổi tên chúng. Có một số cách có thể tôi có thể trích xuất URL của tệp HTML trong Python.
Chỉnh sửa: Tôi muốn tìm URL của tệp .html chứ không phải các liên kết có trong đó. Tôi đang tìm kiếm một cách tiếp cận tổng quát vì tôi có nhiều tập tin.
Khi được hỏi ngày 19 tháng 5 năm 2015 lúc 9:08May 19, 2015 at 9:08
Suppliers
sẽ mở rộng sang URL đầy đủ "//www.acme.com/support/suppliers.html", trong khi URL tương đối trong đánh dấu sau cho hình ảnh
sẽ mở rộng sang URL đầy đủ "//www.acme.com/icons/logo.gif".
5.1.3 URL trong HTML
Trong HTML, các URL đóng một vai trò trong các tình huống này:
- Liên kết với một tài liệu hoặc tài nguyên khác, [xem các phần tử A và liên kết].
- Liên kết với một bảng hoặc tập lệnh kiểu bên ngoài [xem các phần tử liên kết và tập lệnh].
- Hình ảnh, đối tượng và Ứng dụng để đưa vào một trang, [xem IMG, đối tượng, applet và các phần tử nhập].
- Bản đồ hình ảnh [xem các yếu tố bản đồ và khu vực].
- đệ trình biểu mẫu [xem biểu mẫu].
- Khung [xem khung và các phần tử iframe].
- Trích dẫn một tham chiếu bên ngoài [xem Q, Blockquote, Ins và Del Elements].
- đề cập đến các quy ước siêu dữ liệu mô tả một tài liệu [xem phần tử đầu].
Các tác nhân người dùng nên tính toán URL cơ sở để giải quyết các URL tương đối theo [RFC1808]. Sau đây là một bản tóm tắt về cách [RFC1808] áp dụng cho HTML. Các tác nhân người dùng nên tính toán URL cơ sở theo các ưu tiên sau [ưu tiên cao nhất đến thấp nhất]:
- URL cơ sở được đặt bởi phần tử cơ sở.
- URL cơ sở được đưa ra bởi một tiêu đề HTTP [xem [RFC2068]].
- Theo mặc định, URL cơ sở là tài liệu hiện tại.
Ngoài ra, các phần tử đối tượng và applet xác định các thuộc tính được ưu tiên hơn giá trị được đặt bởi phần tử cơ sở. Vui lòng tham khảo các định nghĩa của các yếu tố này để biết thêm thông tin về các vấn đề URL cụ thể cho chúng.
Các thành phần liên kết được chỉ định bởi các tiêu đề HTTP được xử lý chính xác như các thành phần liên kết xuất hiện rõ ràng trong một tài liệu.
URLTO URL & NBSP;
Ngoài các URL HTTP, các tác giả có thể muốn đưa các URL Mailto [xem [RFC1738]] vào tài liệu của họ. URL Mailto khiến email được gửi đến một số địa chỉ email. Chẳng hạn, tác giả có thể tạo một liên kết, khi được kích hoạt, khiến tác nhân người dùng mở chương trình thư với địa chỉ đích trong trường "TO:".
URL Mailto có cú pháp sau:
mailto:email-address
Đại lý người dùng có thể hỗ trợ các tiện ích mở rộng URL Mailto chưa phải là tiêu chuẩn Internet [ví dụ: nối thêm thông tin chủ đề vào URL với cú pháp "? Chủ đề =%của tôi 20Subject" trong đó bất kỳ ký tự không gian nào được thay thế bằng "%20"]. Một số đại lý người dùng cũng hỗ trợ "? CC = địa chỉ email".
trước & nbsp; Tiếp theo & nbsp; nội dung & nbsp; các yếu tố & nbsp; thuộc tính