Làm cách nào để giải mã mã HTML trong JavaScript?

Các tập lệnh này nhằm giải thích cách "ẩn" HTML và/hoặc javascript khỏi những người khác xem mã nguồn trang của bạn. Nó không phải là hoàn hảo, nhưng nó làm cho việc đọc và hiểu mã nguồn trở nên khó khăn hơn. Do bản chất của cách thức hoạt động của các tập lệnh này, phần giải thích có vẻ phức tạp và dài dòng, nhưng hãy kiên nhẫn và nó sẽ có ý nghĩa khi bạn có một chút kinh nghiệm với chúng. Bạn không thực sự cần phải biết thông tin chi tiết về các tập lệnh này, nhưng nó sẽ giúp bạn hiểu cách thức và lý do chúng hoạt động. Vì vậy, hãy ngồi xuống và tôi sẽ cố gắng hết sức để làm cho điều này có vẻ không phức tạp nhất có thể

Thoát / Unescape

Phần đầu tiên của trang này giải thích cách "thoát" bất kỳ văn bản, HTML hoặc Javascript nào để khiến người dùng thông thường không thể đọc được. Mã thoát URL là các giá trị thập lục phân hai ký tự [8 bit] đứng trước dấu %. Điều này được sử dụng chủ yếu trong các URL của trình duyệt hoặc để sử dụng khi tạo cookie cho các ký tự không hoạt động, thường là do chúng là các ký tự dành riêng [như khoảng trắng và các ký tự tương tự]

Ví dụ: nếu bạn có tên tệp HTML của trang một, thì mã URL đã thoát sẽ giống như trang%20one. %20 là giá trị thoát cho một khoảng trắng. Thông thường, bạn sẽ chỉ thoát khỏi các ký tự đặc biệt [thường là bất kỳ ký tự nào khác ngoài a-z, A-Z và 0-9], nhưng tập lệnh bên dưới thực sự thoát khỏi tất cả văn bản chỉ bằng cách thay thế tất cả các ký tự bằng các ký tự tương đương đã thoát của chúng. Vì vậy, nếu bạn hoàn toàn thoát khỏi trang một, nó sẽ giống như. %70%61%67%65%20%6F%6E%65. Bây giờ, không có văn bản nào có thể giải mã dễ dàng mặc dù phần lớn nó được tạo thành từ các ký tự bình thường

Vì trình duyệt vốn có thể xử lý các mã thoát, nên điều này có thể được sử dụng khá dễ dàng mà không cần phải thêm bất kỳ tập lệnh nào để giải mã chúng. Vì vậy, nếu bạn muốn trình duyệt ghi văn bản đã thoát đó vào trang, bạn có thể làm điều gì đó như

Tất cả những gì tôi đang làm ở đây là đặt chuỗi đã thoát vào một tập hợp dấu ngoặc kép [quan trọng. ], gói nó bên trong phương thức unescape[] tích hợp, rồi gói nó trong một tài liệu. viết phương pháp. Điều này có vẻ hơi vô giá trị, nhưng bạn có thể ẩn địa chỉ email theo cách này để ngăn trình thu thập dữ liệu web lấy địa chỉ email của bạn từ trang web của bạn để sử dụng trong các email spam hàng loạt, nhưng vẫn cho phép khách truy cập đọc nó. Tất nhiên, trừ khi bạn thực sự thích nhận được những lời gạ gẫm Viagra. . ]

Chẳng hạn, địa chỉ e-mail không trả lời Script Asylum được thoát hoàn toàn sẽ trông như thế này đối với trình thu thập dữ liệu web

nhưng sẽ trông như thế này với khách truy cập

noreply@scriptasylum. com

Hai hộp văn bản bên dưới sẽ cho phép bạn thoát hoàn toàn và bỏ thoát bất kỳ văn bản nào bạn muốn. Chỉ cần nhập bất kỳ văn bản/HTML/JavaScript nào bạn muốn vào hộp bên trái và nhấp vào nút -> để thoát hoàn toàn. Tương tự như vậy, nhấp vào nút [mã hóa]

  1. Đầu tiên, tất cả các văn bản được thoát
  2. Sau đó, tập lệnh tìm các giá trị Unicode cho từng ký tự trong chuỗi
  3. Sau đó, tập lệnh thêm bất kỳ giá trị hộp thả xuống Code Key nào vào giá trị Unicode của mỗi ký tự
  4. Sau đó, tập lệnh lấy các ký tự dựa trên các giá trị Unicode đã thay đổi
  5. Giá trị Khóa mã cũng được nhúng trong văn bản đã giải mã để tập lệnh biết cách giải mã lại chuỗi đúng cách
  6. Cuối cùng, nó thoát kết quả một lần nữa để xóa bất kỳ ký tự đặc biệt nào. Bây giờ, kết quả đầu ra trông hoàn toàn xa lạ đối với những người không thể hủy dịch chuyển các giá trị Unicode trong đầu họ. . ]
Bước giải mã

Chủ Đề