Các bảng mã tiếng Việt

Vì những khó khăn kỹ thuật trong những năm trước đây, đã xuất hiện rất nhiều bảng mã tiếng Việt khác nhau và không tương thích với nhau. Chỉ sau khi unicode được sử dụng rộng rãi thì chuẩn tiếng Việt mới được quy về một mối. Mặc dù UniKey vẫn hỗ trợ các bảng mã cũ nhưng bạn nên sử dụng unicode trong mọi trường hợp, chỉ nên dùng các bảng mã khác khi không thể dùng unicode.



1. Đôi điều về unicode

Unicode là bảng mã chuẩn quốc tế vốn được thiết kế để dùng là bảng mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới. Về nguyên tắc, Unicode cũng dùng 2 byte, nhưng khác với các bảng mã 2 byte của Việt Nam là Unicode là chuẩn quốc tế nên đã và sẽ được hỗ trợ trong các hệ điều hành và các chương trình ứng dụng.
Mặc dù hiện tại số ứng dụng hỗ trợ Unicode chưa nhiều, nhưng xu hướng sử dụng Unicode sẽ ngày càng tăng lên. Unicode đã được hỗ trợ ngay từ trong nhân của hệ điều hành Windows NT và nay là Windows 2000. Các hệ Windows 9x cũng có hỗ trợ cho Unicode tuy chưa hoàn chỉnh. Các chương trình phổ dụng hiện nay có hỗ trợ Unicode có thể kể đến: Internet Explorer 5, Microsft Outlook Express 5, Microsoft Office 97/2000, Netscape 6 ....
Theo giới chuyên môn, Unicode tỏ ra là giải pháp trọn vẹn cho vấn đề bảng mã tiếng Việt. Đặc biệt đối với các ứng dụng Internet việc sử dụng tiếng Việt Unicode ngày càng có ưu thế hơn so với các bảng mã tiếng Việt khác.

Tổ hợp hay dựng sẵn?

Unicode tổ hợp và dựng sẵn chẳng qua là 2 dạng khác nhau của một chuẩn chung do tổ chức Unicode quy định. Hai dạng này hoàn toàn tương thích với nhau, có thể dùng lẫn lộn. Tuy nhiên, do đa phần các ứng dụng chưa hỗ trợ unicode một cách hoàn hảo theo như khuyến cáo của Unicode, bạn cần phải cân nhắc cẩn thận khi quyết định dùng dạng nào. Ngay cả các chuyên gia của Việt Nam cũng chưa thống nhất nên dùng dạng nào. Theo quan điểm riêng của tác giả, với góc độ một người dùng thông thường bạn nên ưu tiên dùng Unicode dựng sẵn trong mọi trường hợp có thể. Unicode dựng sẵn là sự lựa chọn an toàn và có ưu điểm là hiển thị tốt trong mọi môi trường.
Trong UniKey, unicode dựng sẵn được viết gọn là Unicode. Unicode tổ hợp được viết là Composed Unicode (To hop).

2. Hệ thống bảng mã trong UniKey

  • Unicode: unicode dựng sẵn.
  • Composed Unicode: unicode tổ hợp.
  • ABC, VNI, VISCII, VPS, VIETWARE, BKHCM: Đây là các bảng mã cũ, dần dần sẽ không còn được dùng nữa.
  • MS CP 1258: bảng mã tiếng Việt do Microsoft quy định. Nếu dùng bảng mã này trong các chương trình hỗ trợ unicode của Microsoft như Office, Outlook Express... thì nó cho cùng một kết quả như unicode tổ hợp.
  • VIQR: Thực chất đây không phải là bảng mã mà chỉ là dạng thể hiện tiếng Việt dưới dạng "thô sơ" thông qua các ký tự chuẩn. Dạng này vẫn còn được dùng nhiều trong trao đổi email.
  • UTF-8 Literal, NCR Decimal, NCR Hexadecimal: Đây thực chất là các dạng thể hiện khác nhau của Unicode dựng sẵn. Nếu bạn là người dùng bình thường và chưa nghe đến chúng thì nhiều khả năng bạn sẽ không bao giờ cần đến chúng. Các dạng này chủ yếu nhằm phục vụ những người soạn Web chuyên nghiệp khi chương trình soạn Web không cho phép soạn unicode trực tiếp. Hiện nay nhiều người dùng NCR Decimal trong chương trình Yahoo Chat để trao đổi tiếng Việt có dấu.
  • X UTF-8: dạng đặc biệt để soạn unicode trong các chương trình vốn xuất xứ từ môi trường Unix, Linux như Emacs, gVim.

Mời các bạn xem bảng mã Tiếng Việt bên dưới để biết cách gõ tiếng Việt nhanh nhất:




0 Response to "Các bảng mã tiếng Việt"

Post a Comment

Friends list