Uncategorized

Xóa tags rác khi dùng SDL Trados Studio xử lý file Word

Khi SDL Trados Studio chia đoạn (segmenting) một tài liệu Word, thì nó lưu lại những cái tags cho biết định dạng của chữ trong segment, tuy nhiên những cái tags này làm rối việc dịch, làm cho các segments của Trados khó dùng ở phần mềm khác. Các tags dư thừa thường sinh ra khi convert file PDF sang file Word. Có nhiều giải pháp xóa những cái tags đó đi.

Một số khẩu quyết:

  • Nếu để SDL Trados Studio tự convert file PDF sang DOCX (chất lượng convert của SDL Trados được xem là tốt, nếu dữ liệu chủ yếu là text mà ít hình), thì nên mở file vừa convert trong Word, “Select all” rồi dán sang một file DOCX mới. (ở đây có chút bug trong Trados)
  • Chạy add-on “Cleanup tasks” trong SDL Trados Studio để xóa các tags không cần (có thể không xóa hết được, nhưng chỉ còn rất ít). “Cleanup tasks” này là open source và miễn phí, có hướng dẫn cụ thể ở link này: http://jessegood.github.io/translation/cleanuptool.html

Video hướng dẫn cùng Cleanup tasks trong SLD Trados Studio: (1)

Để xóa tag rác trong Translation Memory của SDL Trados, làm theo hướng dẫn ở đây:

Removing Tags from a Translation Memory

Ngoài ra, ứng dụng CodeZapper là một file template trong Word, có chứa một số VBA macros để xóa các tags định dạng trong Word, giới dịch thuật dùng thấy rất hữu hiệu. Cần trả 20$.
http://www.asap-traduction.com/CodeZapper

Video này bảo là Translator Tools cũng xử lý được các tags, theo nguyên lý chạy macro trong Word:
Get rid of unneeded tags with Translator Tools

Tham khảo:

1. Tackling a translators graffiti!

2. How to get rid of a tag soup in Trados Studio.