"%UXXXX" là sơ đồ không chuẩn cho các ký tự Unicode mã hóa URL. Rõ ràng nó đã được đề xuất nhưng không bao giờ thực sự được sử dụng. Như vậy, hầu như không có bất kỳ chức năng tiêu chuẩn nào có thể giải mã nó thành một chuỗi UTF-8 thực tế.
Mặc dù vậy, không quá khó để tự làm điều đó:
$string = '%u05E1%u05E2';
$string = preg_replace['/%u[[0-9A-F]+]/', '$1;', $string];
echo html_entity_decode[$string, ENT_COMPAT, 'UTF-8'];
Điều này chuyển đổi ký hiệu %uXXXX
thành ký hiệu thực thể HTML XXXX;
, có thể được giải mã thành UTF-8 thực tế bởi html_entity_decode
. Các đầu ra ở trên các ký tự "" trong mã hóa UTF-8.
Như vậy, hầu như không có bất kỳ chức năng tiêu chuẩn nào có thể giải mã nó thành một chuỗi UTF-8 thực tế. Mặc dù vậy, không quá khó để tự làm: $ String = '%U05E1%U05E2'; $ String = preg_replace ['/%u [[0-9a-f]+]/', ' $ 1;', $ String]; echo html_entity_decode [$ String, ent_compat, 'utf-8'];
Làm thế nào để mã hóa Unicode trong PHP? — Converts a string from UTF-8 to ISO-8859-1, replacing invalid or unrepresentable characters
Hàm UTF8_encode [] mã hóa chuỗi ISO-8859-1 thành UTF-8. Unicode là một tiêu chuẩn phổ quát và đã được phát triển để mô tả tất cả các ký tự có thể của tất cả các ngôn ngữ cộng với rất nhiều biểu tượng với một số duy nhất cho mỗi ký tự/ký hiệu.
Cách sử dụng UTF
Mã hóa PHP UTF-8-sửa đổi mã của bạn:.
Đặt UTF-8 thành ký tự được đặt cho tất cả các tiêu đề đầu ra bằng mã PHP của bạn. ....[string $string
]: string
Chỉ định UTF-8 là loại mã hóa cho XML. ....:
Loại bỏ các ký tự không được hỗ trợ từ XML. ....
Chỉ định UTF-8 là bộ ký tự cho tất cả nội dung HTML ..
PHP có sử dụng unicode không?PHP không cung cấp hỗ trợ Unicode gốc. PHP chỉ hỗ trợ bộ 256 ký tự. Tuy nhiên, PHP cung cấp các hàm UTF-8 UTF8_ENCODE [] và UTF8_DECODE [] để cung cấp một số chức năng Unicode cơ bản.
[Php 4, Php 5, Php 7, Php 8]
UTF8_DECODE-Chuyển đổi một chuỗi từ UTF-8 thành ISO-8859-1, thay thế các ký tự không hợp lệ hoặc không thể trình bày
Cảnh báo
8.2.0 | UTF8_DECODE [Chuỗi $string ]: Chuỗi |
7.2.0 | Ghi chú: |
Nhiều trang web được đánh dấu là sử dụng mã hóa ký tự ISO-8859-1
thực sự sử dụng mã hóa tương tự và trình duyệt web sẽ diễn giải các trang web ISO-8859-1
là Windows-1252
. Windows-1252
có các ký tự có thể in bổ sung, chẳng hạn như dấu hiệu Euro [5a6feb
string[1] "?"
string[1] "?"
1] và trích dẫn xoăn [5a6feb
string[1] "?"
string[1] "?"
2 5a6feb
string[1] "?"
string[1] "?"
3], thay vì một số ký tự điều khiển ISO-8859-1
. Hàm này sẽ không chuyển đổi các ký tự Windows-1252
như vậy một cách chính xác. Sử dụng một chức năng khác nếu cần chuyển đổi Windows-1252
.
Thông số
5a6feb string[1] "?" string[1] "?"9
5a6feb string[1] "?" string[1] "?"7
5a6feb string[1] "?" string[1] "?"
Một chuỗi được mã hóa UTF-8.
- Trả về giá trị
- Trả về bản dịch ISO-8859-1 của
5a6feb string[1] "?" string[1] "?"
7. - Thay đổi
- Phiên bản
Sự mô tả ¶
18 năm trước
%uXXXX
0
Sadi ¶ ¶
2GE tại No2Gespam Dot chúng tôi ¶
%uXXXX
1
%uXXXX
2
%uXXXX
3
%uXXXX
4fhoech ¶ ¶
Tobias tại Code-x dot de ¶
%uXXXX
5
%uXXXX
6
%uXXXX
7
%uXXXX
8
%uXXXX
4Làm thế nào để chuyển đổi Unicode thành ký tự trong PHP? ¶
2GE tại No2Gespam Dot chúng tôi ¶
XXXX;
0
XXXX;
1
XXXX;
2
%uXXXX
4fhoech ¶ ¶
Tobias tại Code-x dot de ¶
XXXX;
4
Làm thế nào để chuyển đổi Unicode thành ký tự trong PHP? ¶
14 năm trước
XXXX;
5
XXXX;
6
XXXX;
7
XXXX;
8
%uXXXX
4Ajgor ¶ ¶
Yannikh tại Gmeil Dot Com ¶
html_entity_decode
0
html_entity_decode
1
html_entity_decode
2
%uXXXX
416 năm trước ¶
gto tại interia dot pl ¶
html_entity_decode
4
html_entity_decode
5
html_entity_decode
6
%uXXXX
418 năm trước ¶
Sadi ¶
html_entity_decode
8
html_entity_decode
9
$string
0
$string
1
$string
2
$string
3
$string
4
%uXXXX
42GE tại No2Gespam Dot chúng tôi ¶ ¶
15 năm trước
$string
6
$string
7
$string
8
$string
9fhoech ¶ ¶
15 năm trước
ISO-8859-1
0
ISO-8859-1
1
%uXXXX
4Tobias tại Code-x dot de ¶ ¶
gto tại interia dot pl ¶
ISO-8859-1
3
ISO-8859-1
4
ISO-8859-1
5
ISO-8859-1
6
ISO-8859-1
7
%uXXXX
418 năm trước ¶
14 năm trước
ISO-8859-1
9
Windows-1252
0
Windows-1252
1
Windows-1252
2Ajgor ¶ ¶
15 năm trước
Windows-1252
3
Windows-1252
4
Windows-1252
5
Windows-1252
6
%uXXXX
4Yannikh tại Gmeil Dot Com ¶ ¶
15 năm trước
Windows-1252
8
Windows-1252
9
%uXXXX
416 năm trước ¶
15 năm trước
ISO-8859-1
1
Paul.hayes tại Entropedia.co.uk ¶ ¶
15 năm trước
ISO-8859-1
2
ISO-8859-1
3
ISO-8859-1
4
%uXXXX
4PHP-net tại --- nospam --- lc dot yi dot org ¶ ¶
16 năm trước
ISO-8859-1
6
ISO-8859-1
7
ISO-8859-1
8
%uXXXX
4Rasmus tại Flajm dot se ¶
17 năm trước
Windows-1252
0
Windows-1252
1
%uXXXX
4Thierry.bo # NetCourrier Point Com ¶ ¶
17 năm trước
Windows-1252
3
Windows-1252
4
Windows-1252
5
Windows-1252
6
Windows-1252
7
Windows-1252
8
Windows-1252
9
5a6feb string[1] "?" string[1] "?"00
5a6feb string[1] "?" string[1] "?"01
%uXXXX
4Thierry.bo # NetCourrier Point Com ¶ ¶
punchivan tại gmail dot com ¶
5a6feb string[1] "?" string[1] "?"03
5a6feb string[1] "?" string[1] "?"04
5a6feb string[1] "?" string[1] "?"05
5a6feb string[1] "?" string[1] "?"06
%uXXXX
414 năm trước ¶
15 năm trước
5a6feb string[1] "?" string[1] "?"08
5a6feb string[1] "?" string[1] "?"09
5a6feb string[1] "?" string[1] "?"10
5a6feb string[1] "?" string[1] "?"11
5a6feb string[1] "?" string[1] "?"12
%uXXXX
4Luka8088 tại Gmail Dot Com ¶ ¶
17 năm trước
5a6feb string[1] "?" string[1] "?"14
5a6feb string[1] "?" string[1] "?"15
%uXXXX
4Thierry.bo # NetCourrier Point Com ¶ ¶
punchivan tại gmail dot com ¶
5a6feb string[1] "?" string[1] "?"17
5a6feb string[1] "?" string[1] "?"18
5a6feb string[1] "?" string[1] "?"19
5a6feb string[1] "?" string[1] "?"20
14 năm trước ¶
15 năm trước
5a6feb string[1] "?" string[1] "?"21
5a6feb string[1] "?" string[1] "?"22
5a6feb string[1] "?" string[1] "?"23
%uXXXX
4Luka8088 tại Gmail Dot Com ¶ ¶
16 năm trước
5a6feb string[1] "?" string[1] "?"25
5a6feb string[1] "?" string[1] "?"26
%uXXXX
4Rasmus tại Flajm dot se ¶
17 năm trước
5a6feb string[1] "?" string[1] "?"28
5a6feb string[1] "?" string[1] "?"29
5a6feb string[1] "?" string[1] "?"30
5a6feb string[1] "?" string[1] "?"31
%uXXXX
4Thierry.bo # NetCourrier Point Com ¶ ¶
15 năm trước
5a6feb string[1] "?" string[1] "?"33
punchivan tại gmail dot com ¶ ¶
16 năm trước
5a6feb string[1] "?" string[1] "?"34
5a6feb string[1] "?" string[1] "?"35
5a6feb string[1] "?" string[1] "?"36
5a6feb string[1] "?" string[1] "?"37
5a6feb string[1] "?" string[1] "?"38
Rasmus tại Flajm dot se ¶
17 năm trước
5a6feb string[1] "?" string[1] "?"39
5a6feb string[1] "?" string[1] "?"40
%uXXXX
4Thierry.bo # NetCourrier Point Com ¶ ¶
15 năm trước
5a6feb string[1] "?" string[1] "?"42
5a6feb string[1] "?" string[1] "?"43
%uXXXX
4Rasmus tại Flajm dot se ¶
17 năm trước
5a6feb string[1] "?" string[1] "?"45
5a6feb string[1] "?" string[1] "?"46
5a6feb string[1] "?" string[1] "?"47
%uXXXX
4