Hướng dẫn what is an efficient and correct way to find a valid html element? - một cách hiệu quả và chính xác để tìm một phần tử html hợp lệ là gì?

Tôi có một tệp HTML lớn [80 tháng] như:


   ...
   
      
...

Hello

...
...
...
...
...
...
...
...
...
...
...

Tôi không thể sửa đổi tệp HTML này theo cách thủ công, vì vậy điều tốt nhất là nó vẫn chỉ đọc được.

Tôi muốn lưu trữ từng dòng

...
trong một bảng chuỗi để có thể thao tác nó sau. Bên trong div đó, cũng có những yếu tố khác có thể là bất cứ điều gì.

  1. Tôi đã cố gắng sử dụng htmldocument và xmldocument để tải tệp này nhưng tệp lớn đến mức tôi nhận được ngoại lệ bộ nhớ ngoài
  2. Tôi đã cố gắng sử dụng Regex để có được tất cả các yếu tố đó trong bảng nhưng tôi không thể quản lý nó.

Biểu thức chính quy mà tôi đã sử dụng là:

Regex.Matches[myHtml, "
[\\p{L}\\s]*\\,*[\\p{L}\\s]*

Bài Viết Liên Quan

Chủ Đề