Jsoup phân tích cú pháp html
|
jsoup là một thư viện mạnh mẽ được sử dụng nhiều trong Android để phân tích các phần HTML thành các đối tượng trong Java Android
Show
Cài đặt thư viện jsoup vào project AndroidCó thể tham khảo nền tảng chủ sở hữu của jsoup trước khi bắt đầu. https. //jsoup. tổ chức/ Create project Android set name is JsoupDemo Để cài đặt thư viện vào dự án vừa tạo, dán dòng dưới đây vào Jsoup.parse(String html)7 trong bản dựng tệp. lớp (Mô-đun. ứng dụng) compile 'org.jsoup:jsoup:1.9.2' Sau đó nhấn Sync Now để Android Studio tự động load thư viện vào project, đến đây xem như cài đặt jsoup thành công thư viện. Create Document from data sourceĐể tạo đối tượng Jsoup.parse(String html)8 bằng jsoup có rất nhiều cách và từ rất nhiều nguồn dữ liệu khác nhau
Cách 1. tạo tài liệu từ chuỗiJsoup.parse(String html) Phương thức Jsoup.parse(String html)9 Trả về 1 đối tượng là Jsoup.parse(String html)8 từ 1 String html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);1 có định dạng HTML đầy đủString html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);cách 2. tạo tài liệu từ 1 phần nội dung________số 8_______Phương thức String html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);2 trả về 1 đối tượng làJsoup.parse(String html)8 từ 1 String html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);1 là 1 phần của HTMLString html = " . "; Document doc = Jsoup.parseBodyFragment(html); Element body = doc.body();Cách 3. tạo tài liệu từ urlJsoup.connect(String url) Phương thức String html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);5 trả về 1 đối tượng làJsoup.parse(String html)8 từ 1 trang web Để tạo Jsoup.parse(String html)8 từ url, Android phải tải nội dung của trang web thông qua mạng. Vì thế, nếu sử dụng cách thứ ba thì không được đặt trong chuỗi giao diện người dùng mà phải tạo chuỗi khác để xử lý ví dụ như AsyncTask, Document doc = Jsoup.connect("https://training.stdio.vn/").get();
String title = doc.title();
Trong phần phân tích dữ liệu từ Jsoup.parse(String html)8, được giới thiệu ở phía dưới cũng sẽ sử dụng cách này Cách 4. tạo tài liệu từ tập tinJsoup.parse(File in, String charsetName, String baseUri) Phương thức String html = " Parses the input HTML into a new Document. "; Document doc = Jsoup.parse(html);9 trả về 1 đối tượng làJsoup.parse(String html)8 từ 1 tập tin (file) File file = new File("/tmp/eitguide.html");
Document doc = Jsoup.parse(file, "UTF-8");
Data split data from DocumentTrong ví dụ thực thi này, sẽ lấy thông tin về các khóa học lập trình trong trang https. //tập huấn. stdio. vn/training bao gồm
package com.example.nguyennghia.jsoupdemo;
import android.os.AsyncTask;
import android.support.v7.app.AppCompatActivity;
import android.os.Bundle;
import android.util.Log;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
import javax.security.auth.login.LoginException;
public class MainActivity extends AppCompatActivity {
private static final String TAG = "MainActivity";
private static final String URL = "https://training.stdio.vn/training";
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
new DownloadTask().execute(URL);
}
static class DownloadTask extends AsyncTask {
@Override
protected Void doInBackground(String.. strings) {
Document document = null;
try {
document = (Document)Jsoup.connect(strings[0]).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
}
}
Vì việc lấy dữ liệu cần sử dụng mạng nên phải cấp quyền sử dụng internet trong tệp AndroidManifest. xml Jsoup.parse(String html)0 Tiến hành xử lý tài liệu trong phương thức Jsoup.parseBodyFragment(String html)1, vào trang chủ https. //tập huấn. stdio. vn/huấn luyện cấu trúc HTML khảo sát Bật công cụ kiểm tra phần tử (inpsector) trên trình duyệt web, nhận thấy các khóa học đều có điểm chung nằm trong thẻ Jsoup.parseBodyFragment(String html)2 có Jsoup.parseBodyFragment(String html)3 là Jsoup.parseBodyFragment(String html)4 Jsoup.parse(String html)1 Rút mã để lấy tất cả những thẻ Jsoup.parseBodyFragment(String html)2 có Jsoup.parseBodyFragment(String html)3 là Jsoup.parseBodyFragment(String html)4. Jsoup.parse(String html)2 Sau đó, lần duyệt qua tất cả các phần tử trong Jsoup.parseBodyFragment(String html)8 để lấy các thông tin cần thiết. Mở thẻ Jsoup.parseBodyFragment(String html)2 có Jsoup.parseBodyFragment(String html)3 là Jsoup.parseBodyFragment(String html)4, thấy nội dung như dưới đây Bài Viết Liên QuanQuảng CáoCó thể bạn quan tâmToplist được quan tâm
#1
Top 7 sự tích hồ gươm - ngữ văn lớp 6 202311 tháng trước
#2
Top 7 gdcd 6 bài 1 kết nối tri thức 202311 tháng trước
#3
Top 7 ý nghĩa của xây dựng gia đình văn hóa 202311 tháng trước
#4
Top 6 mẫu hợp đồng mượn đất làm nhà xưởng 202311 tháng trước
#5
Top 3 tổng tài biến thái tôi yêu anh tập 27 202311 tháng trước
#6
Top 6 kết thực phim mỹ nhân vô lệ 202311 tháng trước
#7
#8
Top 8 đề tài và chủ de của tác phẩm tắt đèn 202311 tháng trước
#9
Top 5 tiểu sử của thầy thích pháp hòa 202311 tháng trướcQuảng cáoXem NhiềuQuảng cáoChúng tôiTrợ giúp
Bản quyền © 2021 Học Tốt Inc.
|
