Hướng dẫn what does it mean to escape html? - thoát html có nghĩa là gì?

Escapes nhân vật là một cách viết một nhân vật trong đánh dấu chỉ sử dụng các điểm mã ASCII. Chúng rất hữu ích nếu bạn không thể gõ nhân vật thực tế hoặc đôi khi nếu bạn muốn hiển thị rõ ràng các ký tự vô hình.

Bài viết này đề cập đến câu hỏi: Làm thế nào tôi có thể sử dụng Escapes nhân vật trong đánh dấu và CSS, và khi nào tôi nên sử dụng hoặc không sử dụng chúng?

Câu trả lời nhanh

Trong HTML, bạn có thể thoát khỏi dấu hiệu Euro € theo những cách sau. in the following ways.

Định dạngTên
&#________ 2;Tham khảo ký tự số thập lục phân
tham chiếu ký tự số thập phân
tham chiếu ký tự được đặt tên

Trong cú pháp CSS, bạn sẽ sử dụng một trong những điều sau đây.

Định dạngTên
&#________ 2;Tham khảo ký tự số thập lục phân
tham chiếu ký tự số thập phân

tham chiếu ký tự được đặt tên

Trong cú pháp CSS, bạn sẽ sử dụng một trong những điều sau đây.

Nhân vật trốn thoát trong đánh dấu

Bạn có thể sử dụng một lối thoát ký tự để biểu thị bất kỳ ký tự Unicode nào trong HTML, XHTML hoặc XML chỉ bằng các ký tự ASCII.

Tài liệu tham khảo ký tự số (NCR) và tham chiếu ký tự được đặt tên là các loại thoát ký tự được sử dụng trong đánh dấu. Ví dụ, sau đây là các cách khác nhau để biểu thị không gian không phá vỡ ký tự U+00A0.U+00A0 NO-BREAK SPACE.

. bắt đầu một dòng trong quá trình bọc văn bản.)NO-BREAK SPACE character looks like a space but prevents a line wrap between the characters on either side. In French it is commonly used with punctuation such as colons and exclamation marks, which are preceded by a space but should not appear at the beginning of a line during text wrap.)

 A Tham khảo ký tự số thập lục phân. Tất cả các tài liệu tham khảo ký tự số bắt đầu bằng &# và kết thúc bằng ;. x chỉ ra rằng những gì tiếp theo là một số thập lục phân đại diện cho giá trị điểm mã của ký tự Unicode. Số Hex không nhạy cảm với trường hợp.

Vive la France !

 A Tham chiếu ký tự số thập phân. Điều này sử dụng một số thập phân để thể hiện cùng một điểm mã Unicode.

Vive la France !

...
0

Một tham chiếu ký tự được đặt tên. Đây là một loại lối thoát rất khác nhau. Tài liệu tham khảo ký tự được đặt tên được định nghĩa trong định nghĩa ngôn ngữ đánh dấu. Điều này có nghĩa là, ví dụ, đối với HTML, chỉ có một phạm vi ký tự cụ thể (được xác định bởi đặc tả HTML) có thể được biểu diễn dưới dạng tham chiếu ký tự được đặt tên (và chỉ bao gồm một tập hợp con nhỏ của phạm vi Unicode).

Lưu ý rằng tên là trường hợp nhạy cảm: trong HTML,

...
1 đại diện cho chữ in hoa á, trong khi
...
2 đại diện cho chữ thường Á.Á, whereas
...
2 represents the lowercase á.

...
3

Số điểm mã

Một điểm đáng chú ý đặc biệt là các giá trị của các tài liệu tham khảo ký tự số (chẳng hạn như

...
4 hoặc
...
5 cho dấu Euro €) được hiểu là ký tự Unicode - bất kể bạn sử dụng gì cho tài liệu của mình.) are interpreted as Unicode characters – no matter what encoding you use for your document.

Ví dụ: số điểm mã của dấu hiệu Euro trong mã Windows Trang 1252 là 80. Đây là một lỗi phổ biến đối với những người làm việc trên nội dung trong mã hóa đó để thể hiện dấu hiệu Euro bằng

...
6. HTML này thực sự sẽ tạo ra một ký tự điều khiển, vì lối thoát sẽ được mở rộng dưới dạng ký tự ở vị trí 80 trong tiết mục Unicode. (Trên thực tế, các trình duyệt có xu hướng âm thầm sửa lỗi cụ thể đó. Xem các trang kiểm tra.)

Nguyên mẫu - Phương thức Escapehtml () Phương thức này chuyển đổi các ký tự đặc biệt HTML thành các tương đương thực thể của chúng.

CSS trốn thoát

CSS đại diện cho các ký tự thoát ra theo một cách khác. Escapes bắt đầu với một dấu gạch chéo ngược theo số thập lục phân đại diện cho giá trị điểm mã unicode thập phân của nhân vật.émotion.

Nếu có một ký tự sau đây không có trong phạm vi A F F, A F F hoặc 0 ,9, đó là tất cả những gì bạn cần. Ví dụ sau đại diện cho từ Émotion.édition so that the d is not assumed to be part of the escape.

...
7

Mặt khác, nếu nhân vật tiếp theo là một ký tự có thể được sử dụng trong các số thập lục phân, thì sẽ không rõ sự kết thúc của số ở đâu. Trong những trường hợp này có hai lựa chọn. Đầu tiên là sử dụng một không gian sau khi trốn thoát. Không gian này là một phần của cú pháp Escape, và không ở lại sau khi nhân vật thoát được phân tích cú pháp. Ví dụ sau đây cho thấy làm thế nào bạn có thể đại diện cho từ Édition để D không được coi là một phần của lối thoát.édition.

...
8

Ngoài ra, bạn có thể sử dụng số thập lục phân 6 chữ số, có hoặc không có khoảng trống. Đây là một cách thay thế để viết édition.

Sử dụng Escapes với số nhận dạng CSS

Định danh trong CSS, chẳng hạn như tên lớp trong bộ chọn CSS, có thể bắt đầu bằng-_ A-Z hoặc A-Z hoặc ký tự không phải ASCII, nhưng không thể bắt đầu với bất kỳ ký tự ASCII nào khác. Tuy nhiên, các ký tự thoát khỏi bất kỳ loại nào cũng có thể xuất hiện ở bất kỳ vị trí nào.

Điều này có nghĩa là bạn không thể bắt đầu một định danh có chữ số ASCII 0-9 (mặc dù bạn có thể sử dụng các chữ số sau ký tự đầu tiên). Vì vậy, nếu tên lớp bạn muốn đề cập đến sẽ bắt đầu với một chữ số, bạn sẽ cần phải thoát khỏi nó.

Ví dụ: để chọn một phần tử trong HTML với tên lớp "123", bạn sẽ viết như sau.

...
9

Lưu ý việc sử dụng không gian để tách phần thoát của tên lớp khỏi phần còn lại, để rõ ràng nơi cuối của lối thoát. Nếu bạn đã viết x20AC0, điều này sẽ đại diện cho ㄣ [U+3123 Bopomofo Letter en]. .U+3123 BOPOMOFO LETTER EN]. (You could also have written x20AC1, since the CSS escape ends after the 6th character past the backslash.)

Cũng không cần phải thoát khỏi phần '23' của định danh, vì các chữ số được cho phép sau vị trí đầu tiên.

Trình tự và dấu gạch chéo ngược

Tất cả các cách sau đây cho thấy các cách hợp lệ để thoát một chuỗi các nhân vật, chẳng hạn như các nhân vật trong chuỗi chữ tượng hình Ai Cập, có nghĩa là 'giọng nói'.

Hướng dẫn what does it mean to escape html? - thoát html có nghĩa là gì?
, meaning 'voice'.

x20AC2

x20AC3

x20AC4

x20AC5

Backslash cũng có thể được sử dụng trong CSS trước ký tự cú pháp để ngăn chặn nó được đọc như một phần của mã. Để biết thêm thông tin về Escapes CSS, hãy xem Mô -đun CSS Cú pháp.

Khi không sử dụng Escapes

Hầu như luôn luôn được sử dụng một mã hóa cho phép bạn đại diện cho các ký tự ở dạng bình thường của chúng, thay vì sử dụng tham chiếu ký tự được đặt tên hoặc tham chiếu ký tự số.

Sử dụng Escapes có thể gây khó khăn cho việc đọc và duy trì mã nguồn, và cũng có thể tăng đáng kể kích thước tệp.

Nhiều nhà phát triển nói tiếng Anh có kỳ vọng rằng các ngôn ngữ khác chỉ sử dụng các ký tự không phải là ASCII, nhưng điều này là sai.

Lấy ví dụ đoạn văn sau đây trong Séc.

Jako efektivnější se nám Jeví pořádání tzv. Triển lãm đường bộ Prostřednictvím našich Autorizovaných đại lý ů v čechách a na moravě, které proběhnou v průběhu září a října.

Nếu bạn yêu cầu tham chiếu ký tự số cho tất cả các ký tự không phải ASCII, đoạn văn sẽ trở nên không thể đọc được, khó duy trì và lâu hơn nhiều. Tất nhiên, nó sẽ tệ hơn nhiều đối với một ngôn ngữ không sử dụng các ký tự Latin.

JAKO EFEKTIVN ĕ J š í se n á M JEV í PO ř á D á N í tzv. Đường bộ đường bộ Prost ř ednictv í m Na š V Č prob ě HNOU v PR ů B ě Hu Z á ř í A ř í JNA.

Như chúng tôi đã nói trước đây, sử dụng các ký tự thay vì trốn thoát cho văn bản thông thường.

Sử dụng trong XHTML. Sử dụng các tham chiếu ký tự được đặt tên trong một tài liệu được phân tích cú pháp là XML có thể trở thành vấn đề nếu các thực thể được xác định bên ngoài tài liệu của bạn và các công cụ xử lý XML không đọc các tệp bên ngoài. Trong những trường hợp như vậy, các tài liệu tham khảo thực thể sẽ không được thay thế bằng các ký tự. Vì lý do này, nếu bạn cần sử dụng Escapes, có thể an toàn hơn khi sử dụng các tham chiếu ký tự số hoặc xác định các thực thể ký tự bạn cần bên trong tài liệu. Using named character references in a document that is parsed as XML may become problematic if the entities are defined externally to your document and the tools that process the XML do not read the external files. In such cases the entity references will not be replaced by characters. For this reason, if you need to use escapes, it may be safer to use numeric character references, or define the character entities you need inside the document.

Nếu bạn sử dụng các tham chiếu ký tự được định nghĩa HTML (chẳng hạn như

...
2) để thể hiện các ký tự trong XHTML, bạn nên cẩn thận bất cứ khi nào nội dung của bạn được xử lý bằng cách sử dụng trình phân tích cú pháp XML hoặc các công cụ khác.

Nguyên mẫu - Phương thức Escapehtml () Phương thức này chuyển đổi các ký tự đặc biệt HTML thành các tương đương thực thể của chúng.

Khi trốn thoát có thể hữu ích There are three characters that should always appear in content as escapes, so that they do not interact with the syntax of the markup. These are part of the language for all documents based on HTML and for XML.

  • x20AC7 (

  • x20AC8 (>)

  • x20AC9 (&)

Bạn cũng có thể muốn biểu diễn trình trích dẫn kép (") là  0 và trích dẫn đơn (') là  1. Đây chắc chắn sẽ là trường hợp trong văn bản thuộc tính khi bạn cần sử dụng cùng loại trích dẫn như các thuộc tính giá trị.

Ký tự vô hình hoặc mơ hồ. Một vai trò đặc biệt hữu ích cho Escapes là đại diện cho các nhân vật vô hình hoặc mơ hồ trong việc trình bày. A particularly useful role for escapes is to represent characters that are invisible or ambiguous in presentation.

Một ví dụ sẽ là ký tự unicode U+200F đánh dấu từ phải sang trái. Nhân vật này có thể được sử dụng để làm rõ tính định hướng trong văn bản hai chiều (ví dụ: khi sử dụng các kịch bản tiếng Ả Rập hoặc tiếng Do Thái). Tuy nhiên, nó không có biểu mẫu đồ họa, vì vậy rất khó để thấy những nhân vật này ở đâu trong văn bản và nếu chúng bị mất hoặc bị lãng quên, chúng có thể tạo ra kết quả bất ngờ trong quá trình chỉnh sửa sau. Sử dụng  2 (hoặc tham chiếu ký tự số của nó tương đương  3) thay vào đó giúp cho việc phát hiện các ký tự này rất dễ dàng.U+200F RIGHT-TO-LEFT MARK. This character can be used to clarify directionality in bidirectional text (eg. when using the Arabic or Hebrew scripts). It has no graphic form, however, so it is difficult to see where these characters are in the text, and if they are lost or forgotten they could create unexpected results during later editing. Using  2 (or its numeric character reference equivalent  3) instead makes it very easy to spot these characters.

Một ví dụ về một ký tự mơ hồ là không gian không phá vỡ U+00A0. Loại không gian này ngăn chặn sự phá vỡ dòng, nhưng nó trông giống như bất kỳ không gian nào khác khi được sử dụng như một nhân vật. Sử dụng

...
0 (hoặc  ) cho thấy khá rõ các không gian như vậy xuất hiện trong văn bản.U+00A0 NO-BREAK SPACE. This type of space prevents line breaking, but it looks just like any other space when used as a character. Using
...
0 (or  ) makes it quite clear where such spaces appear in the text.

Vấn đề đầu vào. Nếu công cụ chỉnh sửa của bạn không cho phép bạn dễ dàng nhập các ký tự cần thiết, bạn cũng có thể sử dụng Escapes. Lưu ý rằng đây không phải là một giải pháp dài hạn, cũng không phải là giải pháp hoạt động tốt nếu bạn phải nhập nhiều nhân vật như vậy-nó mất nhiều thời gian hơn và khiến việc bảo trì trở nên khó khăn hơn. Lý tưởng nhất là bạn sẽ chọn một công cụ chỉnh sửa cho phép bạn nhập các ký tự này làm ký tự. Ngoài ra, nếu bạn chỉ cần ký tự thường xuyên, hãy sử dụng công cụ bản đồ ký tự hoặc người chọn ký tự. If your editing tool does not allow you to easily enter needed characters you may also resort to using escapes. Note that this is not a long-term solution, nor one that works well if you have to enter a lot of such characters – it takes longer and makes maintenance more difficult. Ideally you would choose an editing tool that allowed you to enter these characters as characters. Alternatively, if you only need the occasional character, use a character map tool or character picker.

Khoảng cách mã hóa. Escapes có thể hữu ích để biểu diễn các ký tự không được hỗ trợ bởi mã hóa bạn chọn cho tài liệu, ví dụ, để đại diện cho các ký tự Trung Quốc trong một tài liệu được mã hóa là Windows-1252. Tuy nhiên, bạn nên tự hỏi mình tại sao bạn không thay đổi mã hóa tài liệu thành UTF-8, bao gồm tất cả các ký tự bạn cần. Escapes can be useful to represent characters not supported by the encoding you choose for the document, for example, to represent Chinese characters in a document encoded as Windows-1252. You should ask yourself first, however, why you have not changed the encoding of the document to UTF-8, which covers all the characters you need.

Nguyên mẫu - Phương thức Escapehtml () Phương thức này chuyển đổi các ký tự đặc biệt HTML thành các tương đương thực thể của chúng.

Sử dụng Escapes trong các thuộc tính phong cáchstyle element in the head of an HTML file. Occasionally, or perhaps on a temporary basis, you may use a style attribute on a particular element, instead. Even more rarely, you may want to represent one or more characters in the style attribute using character escapes.

Nó thường là một ý tưởng tốt để đặt thông tin phong cách vào một bảng kiểu bên ngoài hoặc một yếu tố kiểu trong đầu tệp HTML. Đôi khi, hoặc có lẽ trên cơ sở tạm thời, bạn có thể sử dụng một thuộc tính kiểu trên một yếu tố cụ thể, thay vào đó. Thậm chí hiếm hơn, bạn có thể muốn đại diện cho một hoặc nhiều ký tự trong thuộc tính kiểu sử dụng Escapes ký tự.style attribute in HTML can represent characters using numeric or named character references or CSS escapes. On the other hand, the style element in HTML can contain neither numeric nor named character references, and the same applies to an external style sheet.

Một thuộc tính kiểu trong HTML có thể biểu thị các ký tự bằng cách sử dụng các tham chiếu ký tự hoặc có tên là thoát khỏi CSS. Mặt khác, phần tử phong cách trong HTML có thể chứa các tham chiếu ký tự không có tên cũng không được đặt tên và tương tự áp dụng cho một bảng kiểu bên ngoài.

Vì có xu hướng muốn di chuyển các kiểu được khai báo trong các thuộc tính cho phần tử kiểu hoặc biểu định kiểu bên ngoài (ví dụ, điều này có thể được thực hiện tự động bằng cách sử dụng ứng dụng hoặc tập lệnh), nên việc chỉ sử dụng các lối thoát CSS là an toàn nhất.

...

Ví dụ: tốt hơn là sử dụng

...

hơn

Nhân tiện Using the character encoding UTF-8 for your page means that you can avoid the need for most escapes and just work with characters. Note, however, that to change the encoding of your document, it is not enough to just change the encoding declaration at the top of the page or on the server. You need to re-save your document in that encoding. For help understanding how to do that with your application read Setting encoding in web authoring applications.

Hex so với thập phân. Thông thường khi tiêu chuẩn Unicode đề cập đến hoặc liệt kê các ký tự, nó sẽ sử dụng giá trị thập lục phân. Chẳng hạn, điểm mã cho chữ cái á có thể được gọi là u+00e1. Với tỷ lệ lưu hành của quy ước này, nó thường hữu ích, mặc dù không bắt buộc, phải sử dụng các giá trị số thập lục phân trong các Escapes thay vì các giá trị thập phân. Bạn không cần phải sử dụng các số không hàng đầu trong Escapes, tức là. Á có thể được đại diện là  6.Typically when the Unicode Standard refers to or lists characters it does so using a hexadecimal value. For instance, the code point for the letter á may be referred to as U+00E1. Given the prevalence of this convention, it is often useful, though not required, to use hexadecimal numeric values in escapes rather than decimal values. You do not need to use leading zeros in escapes, ie. á could be represented as  6.

Ký tự bổ sung. Các ký tự bổ sung là những ký tự Unicode ngoài mặt phẳng đa ngôn ngữ cơ bản (BMP). Trong UTF-16, một ký tự bổ sung được mã hóa bằng hai điểm mã thay thế 16 bit từ BMP. Do này, hoặc vì kinh nghiệm với phiên bản cũ của cú pháp JavaScript, một số người nghĩ rằng các ký tự bổ sung cần được biểu diễn bằng hai lần thoát, nhưng điều này không chính xác - bạn phải sử dụng giá trị điểm mã duy nhất cho ký tự đó. Ví dụ: sử dụng  7 thay vì  8.Supplementary characters are those Unicode characters beyond the Basic Multilingual Plane (BMP). In UTF-16 a supplementary character is encoded using two 16-bit surrogate code points from the BMP. Because of this, or because of experience with older version s of JavaScript syntax, some people think that supplementary characters need to be represented using two escapes, but this is incorrect – you must use the single, code point value for that character. For example, use  7 rather than  8.

Ampersands đơn. Mặc dù các tác nhân người dùng HTML có xu hướng nhắm mắt làm ngơ, nhưng bạn không bao giờ nên có một ampersand và) trong tài liệu HTML của bạn. Bạn nên đặc biệt chú ý đến URI bao gồm các tham số. Ví dụ: tài liệu của bạn phải chứa  9, thay vì &#0. Although HTML user agents have tended to turn a blind eye, you should never have a single ampersand (&) in your HTML document. You should pay particular attention to URIs that include parameters. For example, your document should contain  9, rather than &#0.

đọc thêm

  • Bắt đầu? Giới thiệu các bộ ký tự và mã hóa

  • Hướng dẫn, xử lý mã hóa ký tự trong HTML và CSS

  • Các liên kết liên quan, tác giả HTML & CSS

    • Nhân vật
    • Sử dụng Escapes để đại diện cho các ký tự
  • Các liên kết liên quan, tác giả XML

    • Nhân vật
    • Sử dụng Escapes để đại diện cho các ký tự
  • Các liên kết liên quan, tác giả XML

    • Các liên kết liên quan, phát triển thông số kỹ thuật

Mã thoát trong HTML là gì?

Trong HTML, XHTML hoặc XML, bạn có thể sử dụng một lối thoát ký tự để biểu thị bất kỳ ký tự unicode nào chỉ sử dụng các chữ cái ASCII.Escapes nhân vật được sử dụng trong đánh dấu bao gồm tham chiếu ký tự số (NCR) và tham chiếu ký tự được đặt tên.Một tham chiếu ký tự số trong định dạng thập lục phân.use a character escape to represent any Unicode character using only ASCII letters. Character escapes used in markup include numeric character references (NCRs) and named character references. A numeric character reference in hexadecimal format.

Escape HTML trong JavaScript là gì?

Nguyên mẫu - Phương thức Escapehtml () Phương thức này chuyển đổi các ký tự đặc biệt HTML thành các tương đương thực thể của chúng.converts HTML special characters to their entity equivalents.