Chuyển đổi Unicode sang UTF-8 JavaScript

Chức năng mã hóa/giải mã Base64 đơn giản cho JavaScript hỗ trợ mã hóa UTF-8

xuất bản 0. 2. 1 • 6 năm trướcxuất bản 0. 2. 16 năm trước

Trình tạo bảng cho bảng điều khiển/thiết bị đầu cuối [ASCII, UTF, ANSI], MarkDown [MD], HTML, CSV, TSV và tùy chỉnh

xuất bản 1. 2. 2 • 2 tháng trướcxuất bản 1. 2. 2 2 tháng trước

ví dụ

Cách chuyển đổi giá trị Unicode thành ký tự

hãy để char = Chuỗi. fromCharCode[65];

Tự mình thử »

hãy để văn bản = Chuỗi. fromCharCode[72, 69, 76, 76, 79];

Tự mình thử »

Định nghĩa và cách sử dụng

Phương thức

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
5 chuyển đổi giá trị Unicode thành ký tự

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
5 là một phương thức tĩnh của đối tượng Chuỗi

Cú pháp luôn là

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
5

Bạn không thể sử dụng

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
8

cú pháp

Sợi dây. fromCharCode[n1, n2,. , nX]

Thông số

Thông số Mô tản1, n2, nXBắt buộc.
Một hoặc nhiều giá trị Unicode sẽ được chuyển đổi.

Giá trị trả về

TypeDescriptionMột chuỗiMột chuỗi đại diện cho [các] ký tự unicode

Hỗ trợ trình duyệt

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
5 là một tính năng ECMAScript1 [ES1]

ES1 [JavaScript 1997] được hỗ trợ đầy đủ trên mọi trình duyệt

ChromeEdgeFirefoxSafariOperaIECóCóCóCóCóCó

Hàm

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 mã hóa URI bằng cách thay thế từng phiên bản của các ký tự nhất định bằng một, hai, ba hoặc bốn chuỗi thoát đại diện cho mã hóa UTF-8 của ký tự [sẽ chỉ có bốn chuỗi thoát cho các ký tự bao gồm hai ký tự thay thế]. So với
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
1, hàm này mã hóa ít ký tự hơn, bảo toàn những ký tự nằm trong cú pháp URI

encodeURI[uri]

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
2

Một chuỗi được mã hóa dưới dạng URI

Chuỗi mới đại diện cho chuỗi đã cung cấp được mã hóa dưới dạng URI

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
3

Bị ném nếu

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
2 chứa một

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 là một thuộc tính chức năng của đối tượng toàn cầu

Hàm

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 thoát các ký tự theo đơn vị mã UTF-8, với mỗi octet được mã hóa ở định dạng
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
3, được đệm bên trái bằng 0 nếu cần. Bởi vì các ký tự thay thế đơn độc trong UTF-16 không mã hóa bất kỳ ký tự Unicode hợp lệ nào, nên chúng khiến
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 đưa ra một
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
3

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 thoát khỏi tất cả các ký tự ngoại trừ

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #

Các ký tự trên dòng thứ hai là các ký tự có thể là một phần của cú pháp URI và chỉ được thoát bởi

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
1. Cả
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 và
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
1 đều không mã hóa các ký tự
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
0, được gọi là "dấu hiệu không được đặt trước", không có mục đích dành riêng nhưng được cho phép trong URI "nguyên trạng". [Xem RFC2396]

Hàm

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 không mã hóa các ký tự có ý nghĩa đặc biệt [ký tự dành riêng] cho URI. Ví dụ sau hiển thị tất cả các phần mà một URI có thể chứa. Lưu ý cách một số ký tự được sử dụng để biểu thị ý nghĩa đặc biệt

//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 khác với
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
1 như sau

const set1 = ";/?:@&=+$,#"; // Reserved Characters
const set2 = "-.!~*'[]"; // Unreserved Marks
const set3 = "ABC abc 123"; // Alphanumeric Characters + Space

console.log[encodeURI[set1]]; // ;/?:@&=+$,#
console.log[encodeURI[set2]]; // -.!~*'[]
console.log[encodeURI[set3]]; // ABC%20abc%20123 [the space gets encoded as %20]

console.log[encodeURIComponent[set1]]; // %3B%2C%2F%3F%3A%40%26%3D%2B%24%23
console.log[encodeURIComponent[set2]]; // -.!~*'[]
console.log[encodeURIComponent[set3]]; // ABC%20abc%20123 [the space gets encoded as %20]

Lưu ý rằng bản thân

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
0 không thể tạo thành các yêu cầu HTTP
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
5 và
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
6 thích hợp, chẳng hạn như đối với
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
7, bởi vì
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
8,
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
9 và
const set1 = ";/?:@&=+$,#"; // Reserved Characters
const set2 = "-.!~*'[]"; // Unreserved Marks
const set3 = "ABC abc 123"; // Alphanumeric Characters + Space

console.log[encodeURI[set1]]; // ;/?:@&=+$,#
console.log[encodeURI[set2]]; // -.!~*'[]
console.log[encodeURI[set3]]; // ABC%20abc%20123 [the space gets encoded as %20]

console.log[encodeURIComponent[set1]]; // %3B%2C%2F%3F%3A%40%26%3D%2B%24%23
console.log[encodeURIComponent[set2]]; // -.!~*'[]
console.log[encodeURIComponent[set3]]; // ABC%20abc%20123 [the space gets encoded as %20]
0 không được mã hóa, được coi là các ký tự đặc biệt trong các yêu cầu
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
5 và
//username:password@www.example.com:80/path/to/file.php?foo=316&bar=this+has+spaces#anchor
6. Tuy nhiên,
A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
1 mã hóa các ký tự này

Một

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
3 sẽ bị ném nếu một người cố gắng mã hóa một đại lượng thay thế không phải là một phần của cặp cao-thấp. Ví dụ

A–Z a–z 0–9 - _ . ! ~ * ' [ ]

; / ? : @ & = + $ , #
4

RFC3986 gần đây hơn tạo dấu ngoặc vuông dành riêng [cho IPv6] và do đó không được mã hóa khi tạo thành thứ gì đó có thể là một phần của URL [chẳng hạn như máy chủ lưu trữ]. Nó cũng dự trữ. , ', [, ] và *, mặc dù các ký tự này không có cách sử dụng phân tách URI chính thức. Hàm sau mã hóa một chuỗi cho định dạng URL tuân thủ RFC3986

Làm cách nào để chuyển đổi Unicode thành văn bản trong JavaScript?

phương thức fromCharCode[] chuyển đổi giá trị Unicode thành ký tự. chuỗi. fromCharCode[] là một phương thức tĩnh của đối tượng String. Cú pháp luôn là String.

Cách mã hóa UTF

JavaScript. hàm mã hóaURI[] . nước tiểu. Mã định danh tài nguyên thống nhất hoàn chỉnh.

Cách chuyển đổi chuỗi thành UTF

Bộ mã hóa văn bản . phương thức encodeInto[] lấy một chuỗi để mã hóa và một Uint8Array đích để đặt văn bản được mã hóa UTF-8 kết quả vào và trả về một đối tượng từ điển cho biết tiến trình của .

Làm cách nào để lấy ký tự từ Unicode trong JavaScript?

Phương thức charCodeAt[] trả về Unicode của ký tự tại một chỉ mục [vị trí] đã chỉ định trong một chuỗi. Chỉ số của ký tự đầu tiên là 0, ký tự thứ hai là 1,. Chỉ mục của ký tự cuối cùng là độ dài chuỗi - 1 [Xem ví dụ bên dưới]. Xem thêm phương thức charAt[].

Chủ Đề