Thứ sáu, 1/4/2005, 03:34 GMT+7

Tương lai cho chuẩn tiếng Việt trên PC còn xa vời

Với nỗ lực của các chuyên gia, nhiều tiện ích tiếng Việt trên máy tính đã ra đời. Tuy nhiên, ngôn ngữ bản địa vẫn chưa được đánh giá tương xứng vai trò của nó trong quan hệ với CNTT.

Việc đưa tiếng Việt vào máy tính có điều kiện thuận lợi là ngôn ngữ này theo hệ Latin. Như vậy, công việc phải làm là bổ sung thêm các ký tự riêng cùng với quy tắc bàn phím để soạn thảo được các ký tự đó. Tuy nhiên, bảng mã ASCII 8 bit khi đó chỉ có phần mở rộng cho 128 ký tự bổ sung. Và với các ký tự riêng (ă, â, đ, ê, ư) cộng với 5 thanh dấu cho các nguyên âm thì sẽ không đủ chỗ cho 143 ký tự nữa, cho cả chữ hoa và chữ thường. Nếu tôn trọng bảng mã ASCII chuẩn thì phải sử dụng 2 bộ font riêng cho chữ hoa và chữ thường. Còn nếu chung cho cả chữ hoa và chữ thường trong một bộ font thì đành phải vi phạm bảng mã ASCII chuẩn.

Vấn đề tiếp theo là vị trí đánh dấu cho nguyên âm. Ban đầu, người ta đánh dấu huyền của chữ "Hòa" vào O nhưng sau đó chuyển sang A vì khi tìm kiếm tự động, nếu gõ "Hòa" sẽ được cả "Hoàn" và "Hoàng". Tuy nhiên, vẫn còn rắc rối khác tồn tại bởi với chữ "Thụy" theo các hệ soạn thảo thông dụng hiện nay thì dấu nặng rơi vào Y trong khi đó nếu đặt vào U thì sẽ thuận mắt hơn.

Gai góc hơn với người làm công nghệ thông tin (CNTT) là từ điển điện tử, các dự án Việt hóa nhận dạng chữ, chuyển đổi văn bản thành tiếng nói, nhận dạng tiếng nói...

Ông Phạm Hồng Quang, Giám đốc Công ty Cadpro, cho biết hệ soạn thảo VNIJ của đơn vị ông đã chuyển đổi được với tất cả các bảng mã đang lưu hành. Chương trình này còn có tiện ích về soát lỗi chính tả tự động đa âm tiết. Theo ông Quang, cần phải đưa vào máy tính một bộ từ điển chính tả chuẩn để làm căn cứ đối chiếu và quan trọng hơn là phải tìm ra quy luật cho nó để biến thành thủ tục tiện ích.

Tiếp sau đó, các hệ nhận dạng chữ in như VnDOCR của Viện CNTT và Cadpro Scanner Image của Công ty Cadpro, phần mềm dịch thuật Anh-Việt của Lê Khánh Hùng (Viện ứng dụng công nghệ) và Đinh Điền (khoa Công nghệ thông tin Đại học Bách khoa TP HCM), hệ thống trả lời điện thoại tự động của công ty CDIT, hệ điều hành tiếng Việt Vietkey Linux tiếp tục ra đời....

Cuối năm 2003, lần đầu tiên một hội thảo về mối quan hệ giữa CNTT và ngôn ngữ học được tổ chức tại Đại học Khoa học xã hội và nhân văn, Đại học Quốc gia Hà Nội. Dịp này, GS.TS Trần Trí Dõi, Phó chủ nhiệm khoa Ngôn ngữ học, Đại học Khoa học xã hội và nhân văn, cho biết tại Malaysia và nhiều quốc gia khác, rất nhiều đồng nghiệp của ông đã làm việc trong môi trường CNTT cùng với các chuyên gia phần mềm và nhận thấy thực tế trong các đề án, chiến lược quốc gia cho CNTT và truyền thông, yếu tố ngôn ngữ học còn khá mờ nhạt. GS Dõi cho rằng đó là thiếu sót của chính các chuyên gia ngôn ngữ học bởi chưa tự giới thiệu để xã hội biết đến mình. 

TS. Nguyễn Chí Công, Trưởng ban KHCN Hội tin học VN, đã kỳ vọng về tương lai của sự hợp tác chính tức giữa CNTT và ngôn ngữ học. "Đây chính là bản sắc cho CNTT VN mà chúng ta phải tự làm và không thể trông chờ hoàn toàn vào các công ty CNTT nước ngoài", ông Công khẳng định.

KS Đặng Minh Tuấn, Trưởng nhóm Vietkey khi đó đã tỏ ý lấy làm tiếc vì trong các đề án, chiến lược quốc gia cho sự phát triển CNTT, yếu tố ngôn ngữ học gần như chưa được đề cập rõ ràng. Ông Tuấn cũng kêu khổ vì không có một bộ thuật ngữ cho CNTT. Bộ tiêu chuẩn TCVN 6695:2000 mới có khoảng 300 thuật ngữ chuẩn.

Vậy là sau cái "loạn 12 sứ quân" trong việc mã hóa, bỏ dấu tiếng Việt... người ta còn phải đối đầu với loạn tiếng Việt ngay ở giao diện, trợ giúp trực tuyến, thông báo của các phần mềm và trong các tài liệu, sách bằng tiếng Việt về CNTT.

(Theo Lao Động)