Hướng dẫn php encoding functions
Show Nội dung chính
Đã đăng vào thg 12 2, 2017 6:45 CH 7 phút đọc Đối với một lập trình viên PHP hay MySQL, mọi thứ có vẻ khá dễ dàng và thoải mái khi làm việc với dữ liệu chỉ gồm các ký tự tiếng Anh. Cho đến khi bạn vướng vào sự rắc rối của mã hóa UTF-8 trong xử lý ngôn ngữ không phải tiếng Anh. Nói sơ lược về mã hóa UTF-8 thì đây là một kiểu mã hóa ký tự của tập ký tự Unicode. Nó được thiết kế để tương thích ngược với mã hóa ASCII và tránh những nhược điểm của UTF-16 và UTF-32. UTF-8 trở thành kiểu mã hóa phổ biến và chiếm ưu thế khi hơn một nửa số trang web hiện tại sử dụng kiểu mã hóa này. Trong bài viết này, sẽ có 3 hướng dẫn chính được trình bày để có thể sử dụng mã hóa UTF-8 trong PHP và MySQL:
PHP và mã hóa UTF-8Để sử dụng UTF-8 là kiểu mã hóa ký tự mặc định, thay đổi ở file config Ở header:
Trong file XML:
Trong HTML:
Chỉ định UTF-8 trong hàm hmlspecialchars:
Khi kết nối với MySQL:Sử dụng hàm
Từ PHP 5.5.0, hàm
Sử dụng hàm xử lý chuỗi tương thích với UTF-8:Có nhiều hàm sẽ lỗi hoặc xử lý sai khi một ký tự cần nhiều hơn 1 byte (như UTF-8). Ví dụ hàm
MySQL với mã hóa UTF-8Thay đổi trong file config my.ini:
Chuyển đổi dữ liệu sử dụng mã hóa latin1 sang UTF-8
Lời kếtMã hóa dữ liệu đòi hỏi sự cẩn trọng và tỉ mỉ. Nếu hiểu rõ về nó, lập trình viên có thể tiết kiệm một khoảng thời gian và công sức đáng kể khi đối mặt với những vấn đề về dữ liệu. Bài viết này như một lần nữa khẳng định tầm quan trọng của việc cân nhắc khi định nghĩa charset trong dự án cũng như môi trường phát triển ngay từ ban đầu. Referrence: https://www.toptal.com/php/a-utf-8-primer-for-php-and-mysql All rights reserved |