Dịch thuật với công cụ CAT / Thuật ngữ

Xây dựng thuật ngữ và dùng trong phần mềm hỗ trợ nhóm dịch

Thuật ngữ là thành phần cơ sở cho việc dịch các tài liệu chuyên ngành. Người đọc sách dịch có kỳ vọng là thuật ngữ chuyên ngành được dùng thống nhất ở tất cả các sách. Tuy nhiên thực tế ở Việt Nam là một thuật ngữ, đặc biệt ở lĩnh vực khoa học kỹ thuật, có thể được các dịch giả dịch thành những từ khác nhau. Có lẽ có ba nguyên nhân chính: một là thuật ngữ chưa được xác lập chính thức nên các dịch giả phải tìm kiếm cách dịch theo lối riêng, hai là dịch giả thiếu tra cứu nên không cập nhật được cách dịch thuật ngữ, ba là dịch giả muốn làm mới cách dịch thuật ngữ sau khi đã phân tích để có cách dịch hợp lý hơn.

Bài này đưa ra cách làm để các nhà chuyên môn cùng hợp tác trong việc xây dựng thuật ngữ và dùng trong dịch thuật, có phần liên quan đến nguyên nhân thứ hai nêu trên. Về hai nguyên nhân còn lại, sách “Danh từ khoa học” của Hoàng Xuân Hãn có giá trị tham khảo tốt.

Trước tiên, về nguyên tắc là cần có các từ điển chuyên ngành để ghi lại cách dịch các thuật ngữ. Trong quá trình làm từ điển, các tác giả đã cân nhắc nhiều khía cạnh nên thuật ngữ trong từ điển có giá trị sử dụng cao.

Tiếp theo, để sử dụng trong việc dịch, cần có sự thống nhất giữa những người dịch. Về điểm này, trong Liên minh châu Âu có một cách giải quyết để tham khảo: các công ty và cá nhân dịch thuật cùng đóng góp các thuật ngữ để làm thành một bản dữ liệu tham khảo, chia ra theo các lĩnh vực và gồm nhiều thứ tiếng khác nhau, dần dần họ làm được một cơ sở dữ liệu lớn, được chia sẻ miễn phí một cách rộng rãi qua dự án IATE.

Đối với việc dịch thuật ngữ chuyên ngành sang tiếng Việt, trong hoàn cảnh chưa có một tổ chức để tập hợp dữ liệu như mô hình IATE, chúng tôi đề nghị cách làm là mỗi nhóm chuyên gia xây dựng và bảo quản thuật ngữ của mình qua một dạng dữ liệu mở, thuận tiện cho người khác tham khảo và sử dụng. Dần dần những người quản lý các kho thuật ngữ được nhiều người dùng thì sẽ biết đến nhau và tương tác để điều chỉnh thuật ngữ cho khớp với nhau. Việc mở dữ liệu thuật ngữ mà mình xây dựng được cũng sẽ giúp những người dịch tham khảo và nhanh chóng đưa các thuật ngữ vào những bản dịch, giúp phổ biến chúng và mang lại ích lợi cho cộng đồng.

Cụ thể hơn, giải pháp xây dựng thuật ngữ và sử dụng thuật ngữ trong việc dịch có thể tóm tắt như sau:

1. Một nhóm chuyên gia của một ngành cùng xây dựng bảng thuật ngữ (termbase), sử dụng công cụ chia sẻ bảng tính trên mạng để tiện đóng góp (họ chỉ cần làm việc qua internet, không có ràng buộc về thời gian).

2. Thuật ngữ được tổ chức thành dạng file bảng tra cứu (glossary) có thể dùng ngay vào các phần mềm hỗ trợ dịch thuật (computer-assisted translation – CAT). Như vậy tiết kiệm công sức xử lý dữ liệu của những người liên quan.

3. Người dịch tổ chức dữ liệu dịch có đưa thêm các thành phần con (submodule) là bảng thuật ngữ tham chiếu trực tiếp từ các kho thuật ngữ được chia sẻ trên mạng. Dự án dịch cũng được kết nối với trung tâm dữ liệu trên internet để hỗ trợ một nhóm cùng dịch (dữ liệu có thể được đóng nếu không muốn lộ thông tin khi đang dịch).

Mô hình này thực ra có thể thực hiện được khá dễ dàng, sử dụng các công cụ phần mềm và dịch vụ miễn phí, khá ổn định. Chẳng hạn: việc cùng lập bảng thuật ngữ có thể được làm thông qua dịch vụ miễn phí Google Sheets hỗ trợ nhiều người cùng sửa một file bảng tính, kho lưu trữ thuật ngữ và dữ liệu dự án dịch có thể sử dụng dịch vụ miễn phí của Gitlab (thậm chí Gitlab còn là phần mềm nguồn mở, nếu không muốn dùng dịch vụ trên máy chủ của họ thì có thể tự cài đặt máy chủ riêng), phần mềm CAT nguồn mở OmegaT hỗ trợ dịch thuật theo nhóm rất hiệu quả, giúp tích hợp được submodule là dữ liệu thuật ngữ trên Gitlab dễ dàng.

Mô hình này được vẽ tổng hợp lại trong hình dưới đây: