Chuyển đổi Unicode sang UTF-8 JavaScript
Chức năng mã hóa/giải mã Base64 đơn giản cho JavaScript hỗ trợ mã hóa UTF-8 Show xuất bản 0. 2. 1 • 6 năm trướcxuất bản 0. 2. 16 năm trước Trình tạo bảng cho bảng điều khiển/thiết bị đầu cuối (ASCII, UTF, ANSI), MarkDown (MD), HTML, CSV, TSV và tùy chỉnh xuất bản 1. 2. 2 • 2 tháng trướcxuất bản 1. 2. 2 2 tháng trước ví dụCách chuyển đổi giá trị Unicode thành ký tự hãy để char = Chuỗi. fromCharCode(65); Tự mình thử »hãy để văn bản = Chuỗi. fromCharCode(72, 69, 76, 76, 79); Tự mình thử »Định nghĩa và cách sử dụngPhương thức A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #5 chuyển đổi giá trị Unicode thành ký tự A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #5 là một phương thức tĩnh của đối tượng Chuỗi Cú pháp luôn là A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #5 Bạn không thể sử dụng A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #8 cú phápSợi dây. fromCharCode(n1, n2,. , nX) Thông sốThông số Mô tản1, n2, nXBắt buộc.Một hoặc nhiều giá trị Unicode sẽ được chuyển đổi. Giá trị trả vềTypeDescriptionMột chuỗiMột chuỗi đại diện cho (các) ký tự unicodeHỗ trợ trình duyệtA–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #5 là một tính năng ECMAScript1 (ES1) ES1 (JavaScript 1997) được hỗ trợ đầy đủ trên mọi trình duyệt ChromeEdgeFirefoxSafariOperaIECóCóCóCóCóCóHàm A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 mã hóa URI bằng cách thay thế từng phiên bản của các ký tự nhất định bằng một, hai, ba hoặc bốn chuỗi thoát đại diện cho mã hóa UTF-8 của ký tự (sẽ chỉ có bốn chuỗi thoát cho các ký tự bao gồm hai ký tự thay thế). So với A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #1, hàm này mã hóa ít ký tự hơn, bảo toàn những ký tự nằm trong cú pháp URI
A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #2 Một chuỗi được mã hóa dưới dạng URI Chuỗi mới đại diện cho chuỗi đã cung cấp được mã hóa dưới dạng URI A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #3 Bị ném nếu A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #2 chứa một A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 là một thuộc tính chức năng của đối tượng toàn cầu Hàm A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 thoát các ký tự theo đơn vị mã UTF-8, với mỗi octet được mã hóa ở định dạng A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #3, được đệm bên trái bằng 0 nếu cần. Bởi vì các ký tự thay thế đơn độc trong UTF-16 không mã hóa bất kỳ ký tự Unicode hợp lệ nào, nên chúng khiến A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 đưa ra một A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #3 A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 thoát khỏi tất cả các ký tự ngoại trừ A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , # Các ký tự trên dòng thứ hai là các ký tự có thể là một phần của cú pháp URI và chỉ được thoát bởi A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #1. Cả A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 và A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #1 đều không mã hóa các ký tự http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor0, được gọi là "dấu hiệu không được đặt trước", không có mục đích dành riêng nhưng được cho phép trong URI "nguyên trạng". (Xem RFC2396) Hàm A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 không mã hóa các ký tự có ý nghĩa đặc biệt (ký tự dành riêng) cho URI. Ví dụ sau hiển thị tất cả các phần mà một URI có thể chứa. Lưu ý cách một số ký tự được sử dụng để biểu thị ý nghĩa đặc biệt http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 khác với A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #1 như sau
Lưu ý rằng bản thân A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #0 không thể tạo thành các yêu cầu HTTP http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor5 và http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor6 thích hợp, chẳng hạn như đối với http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor7, bởi vì http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor8, http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor9 và 0 không được mã hóa, được coi là các ký tự đặc biệt trong các yêu cầu http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor5 và http://username:[email protected]:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor6. Tuy nhiên, A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #1 mã hóa các ký tự này Một A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #3 sẽ bị ném nếu một người cố gắng mã hóa một đại lượng thay thế không phải là một phần của cặp cao-thấp. Ví dụ A–Z a–z 0–9 - _ . ! ~ * ' ( ) ; / ? : @ & = + $ , #4 RFC3986 gần đây hơn tạo dấu ngoặc vuông dành riêng (cho IPv6) và do đó không được mã hóa khi tạo thành thứ gì đó có thể là một phần của URL (chẳng hạn như máy chủ lưu trữ). Nó cũng dự trữ. , ', (, ) và *, mặc dù các ký tự này không có cách sử dụng phân tách URI chính thức. Hàm sau mã hóa một chuỗi cho định dạng URL tuân thủ RFC3986 Làm cách nào để chuyển đổi Unicode thành văn bản trong JavaScript?phương thức fromCharCode() chuyển đổi giá trị Unicode thành ký tự. chuỗi. fromCharCode() là một phương thức tĩnh của đối tượng String. Cú pháp luôn là String.
Cách mã hóa UTFJavaScript. hàm mã hóaURI()
. nước tiểu. Mã định danh tài nguyên thống nhất hoàn chỉnh.
Cách chuyển đổi chuỗi thành UTFBộ mã hóa văn bản . phương thức encodeInto() lấy một chuỗi để mã hóa và một Uint8Array đích để đặt văn bản được mã hóa UTF-8 kết quả vào và trả về một đối tượng từ điển cho biết tiến trình của .
Làm cách nào để lấy ký tự từ Unicode trong JavaScript?Phương thức charCodeAt() trả về Unicode của ký tự tại một chỉ mục (vị trí) đã chỉ định trong một chuỗi. Chỉ số của ký tự đầu tiên là 0, ký tự thứ hai là 1,. Chỉ mục của ký tự cuối cùng là độ dài chuỗi - 1 (Xem ví dụ bên dưới). Xem thêm phương thức charAt(). |