Làm việc với file Translation Memory

Translation Memory (bộ nhớ dịch thuật) là file lưu lại những gì mà một người (hoặc nhóm) đã dịch, để giúp cho lần dịch sau sử dụng lại kết quả của lần dịch trước một cách tiện lợi. Thường là phần mềm CAT sẽ nhắc lại một cách tự động khi gặp một câu văn [cần dịch] có độ trùng lặp cao so với một câu đã có trong dữ liệu Translation Memory (TM).

Các phần mềm CAT cũng tự động ghi lại những gì đã dịch vào file TM. Như vậy, quá trình sử dụng TM diễn ra hầu như ở background – do phần mềm CAT tự động lưu dữ liệu, tự động tra cứu. Người dịch chỉ cần lưu trữ và bảo quản các file TM của mình sau khi dịch, thường là mỗi lĩnh vực / chủ đề dịch thì người ấy sử dụng một file TM, và trước khi bắt đầu một dự án dịch mới thì người dịch sẽ chọn file TM nào để phần mềm tra cứu.

Định dạng phổ biến để trao đổi Translation Memory giữa các phần mềm là dạng file TMX.

Sửa chữa file TMX:

Các phần mềm CAT thường có sẵn công cụ để xem lại và sửa chữa các mục từ trong Translation Memory. Có công cụ chuyên dùng để edit file TMX, là Heartsome TMX Editor 8 (miễn phí), các bản cài đặt download ở: Microsoft OneDrive, Dropbox.

Convert file TMX:

Mỗi phần mềm CAT có thể có định dạng TM riêng của mình, để chia sẻ giữa các phần mềm CAT thì nên chuyển file TM sang định dạng TMX. Ví dụ để convert các loại TM của phần mềm SDL Trados Studio và Wordfast sang dạng TMX, có các công cụ miễn phí:

Lưu ý khi dùng Google Translate Toolkit (GTT):

  • Người dùng có thể upload TM của mình lên GTT, dưới dạng file TMX, dung lượng tối đa 50 MB. Nếu file TMX lớn thì cần tách nội dung thành các file TMX nhỏ, GTT cho phép mỗi tài khoản upload đến 1GB các file TMX mỗi năm.
  • Nên dùng file TMX có tên riêng cho mỗi dự án trong GTT, đừng dùng “Global TM” hay “Personal TM”, vì Global TM thì không cho mình download lại được, còn “Personal TM” thì thường trộn chung TM ở nhiều chủ đề với nhau (phần mềm CAT khi tra cứu sẽ dễ gặp “rác” làm chậm đi). Thói quen tốt là đặt tên cho mỗi cái TM cho phản ảnh được chủ đề đang dịch, sau khi dịch xong từng dự án thì nhớ download cái TM đó về máy tính cất (nó vẫn còn được lưu trong GTT).

Xem thêm hướng dẫn chi tiết của Google về cách dùng Translation Memory: https://support.google.com/translatortoolkit/answer/6306375?hl=en&ref_topic=6306365