Mới đầu, theo như bác miêu tả em nghĩ cái web của bác được thiết kế cũng tiêu chuẩn và chỉn chu lắm, nên mới giới thiệu bác cách xử lý như mấy bài trước. Giờ tận mắt nhìn thấy cái cơ sở dữ liệu của bác em mới giật mình vì đông tây kim cổ nó gộp chung vô làm một. Thực sự em không có ý xấu gì với bác mà chỉ muốn nhân cơ hội đây giới thiệu cho mọi người một kinh nghiệm thực tế như bác đã từng gặp khi có nhu cầu cần xây dựng một website cho cá nhân, công ty hay tổ chức để biết mà có cách xử lý sau này. Việc này rất hay xảy ra cho việc chuyển đổi hosting (nơi chịu trách nhiệm lưu giữ cái web và trưng bày cho cả thế giới biết) do sự không tương thích của nơi chuyển đến và nơi cũ. Còn lý do chuyển đổi, di dời thì người ta có cả tỷ lý do, chỉ khi nào có trong tay một cái web mới thấy được điều đó.
Các thông tin đưa ra ở đây đều mang tính kỹ thuật thuần túy, không hề gây ảnh hưởng cho việc kinh doanh hay cái trang web, mong rằng điều này không mang lại sự bất tiện cho bác chủ thớt. Còn đây là các việc mà em đã làm :
- Khảo sát qua cơ sở dữ liệu
- Kiểm tra tính tương thích
- Đưa ra giải pháp kỹ thuật xử lý vấn đề
1. Khảo sát : tiếng Việt mình khác cái tiếng Tây u vì dấu tè lè, bởi vậy người ta mới bày cái trò font chữ hỗ trợ cho các thứ tiếng không phải ký tự latin lẫn latin có độ, chế (kiểu tiếng Việt mình). Do đó mới xài cái gọi là Unicode cho tiếng Việt. Dựa trên các thông tin được cung cấp, em hăm hở nhào vô thế nào :
Cơ sở dữ liệu đã là Unicode rồi nhưng từng bảng dữ liệu lưu trữ lại hổ lốn. Chỗ thì
latin1_swedish, chỗ thì
utf8_unicode. Tò mò, em vô một cái có vẻ quan trọng coi sao :
Đúng như em dự đoán nè. Cái đề là
utf8_unicode kia là làm màu khè thiên hạ chơi. Thử coi một vài dữ liệu mẫu xem thế nào :
Toàn là tiếng gì đâu, cũng may là web còn thông dịch ra tiếng Việt được. Lấy đại một cái bảng dữ liệu nho nhỏ để kiểm tra coi sao. Hơi bị kinh dị vì chỗ có khả năng hiển thị được tiếng Việt, chỗ thì ra tiếng Tây u gì đâu nhìn nhức cả mắt.
2. Kiểm tra tính tương thích : Em đưa dữ liệu lên QNAP server kiểm tra thử coi sao. Đầu tiên là cho vài ba chữ Việt Nam vô cho nó có màu mè chút xíu.
Kết quả thu được hơi bị bất ngờ. Cái mình mong đợi thì ra chữ giun, cái không mong đợi thì ngọt ngào quá xá.
3. Giải pháp : Vậy làm em nắm được thóp của nó rồi, chỉnh sửa lại chút xíu là ngon cơm thôi. Cách làm là tìm cái file có tên là
wp-db.php trong thư mục mang tên là
wp-includes (vì trang web bác chủ thớt này xài Word Press). Thêm vô một dòng nữa như hình dưới đây là hết phim :
* Nhận xét : Cách làm đó chỉ mang tính chất chữa cháy, tạm thời, không triệt để và xử lý ở phần ngọn - vì ở tận sau cùng nằm dưới cơ sở dữ liệu vẫn là tiếng Việt đi mượn xác
latin1_swedish tá túc chứ chưa hoàn toàn trở thành
utf8_unicode để hiển thị tiếng Việt thực sự. Cách xử lý triệt để nhất vẫn là chuyển toàn bộ cơ sở dữ liệu qua Unicode (bảng mã là
utf_unicode_ci hay tương tự) để cho dữ liệu ở bên dưới với thông tin hiển thị trên trang web là đồng nhất, tăng hiệu năng lẫn tốc độ đáp ứng cùa trang web mà không cần phải xử lý nhiều.
Bác chủ thớt cứ xử lý như vậy là được. Nếu có trục trặc hay vấn đề gì thì cứ nhắn cho em, em sẽ cố gắng giúp trong khả năng của mình.
Về việc xuất dữ liệu từ Windows bác cứ tiến hành làm bình thường và nên sử dụng lệnh dump dữ liệu từ dòng lệnh vì trong trang web phpMyAdmin của bác có giới hạn dung lượng nên có lỗi xảy ra và khả năng là không lấy hết được dữ liệu. Trên QNAP bác làm như sau để nhập dữ liệu vào :
[BLOCKQUOTE]
export PATH=$PATH:/usr/local/mysql/bin
mysql -u admin -p
create database "ten_database" character set=utf8 collate=utf8_general_ci;
use "ten_database";
source < "ten_file_du_lieu_tu_Windows";
commit;
exit
[/BLOCKQUOTE]