CafeTran / CAT

Workshop làm quen công cụ CAT cho việc dịch

Nội dung workshop:

Buổi workshop này là dịp để thực hành chuỗi 12 công đoạn, từ lúc có một file PDF cần dịch đến khi ra được file Word nội dung dịch. Một số file tạo ra trong quá trình này sẽ làm trung gian để giúp nhóm dịch & hiệu đính sử dụng linh hoạt các công cụ làm việc (có thể dịch và hiệu đính bằng tay như cách truyền thống, mà vẫn sử dụng được các ưu điểm cốt lõi của việc dịch bằng phần mềm; có thể làm một mình ở máy tính cá nhân, hoặc làm việc hợp tác qua internet).

Các video hướng dẫn từng bước:

Các chủ đề bổ sung:

  1. Nhận diện chữ trong file PDF bị khóa: khi nhận được file PDF bị khóa (ví dụ PDF của bản in tiếng Việt từ phía nhà xuất bản), làm sao để copy, sửa chữa chữ trong file PDF? Giải pháp: tách file PDF ra từng trang, rồi dùng phần mềm VietOCR để nhận diện chữ trong hàng loạt file PDF. Xem video: https://youtu.be/HM2tScq4biE
  2. Tạo Translation Memory bằng công cụ “Align”: làm sao để tạo ra bộ nhớ dịch thuật từ các tài liệu đã dịch bằng tay trước kia? Giải pháp: dùng phần mềm LF Aligner để tạo Translation Memory từ cặp file tài liệu đã dịch. Xem video: https://youtu.be/CZ8PJITQOTM
  3. Xử lý các file Translation Memory (TMX), Glossary cho tương thích với Google Translate Toolkit (dạng CSV), và Termbase (TBX). Đăng chuẩn bị sẵn phần mềm: Heartsome TMX Editor 8 (miễn phí), các bản cài đặt download ở: Microsoft OneDriveDropbox; và Trados Studio Resource Converter: http://www.vannellen.com/fortranslators.php (requires Java JRE 8).

Đề nghị chuẩn bị:

1. Phần mềm:

Download và cài đặt vào máy các phần mềm sau (miễn phí):

Việc soạn thảo trên file DOCX có thể dùng nhiều phần mềm, như MS Word (có phí) hoặc LibreOffice Writer, OpenOffice Writer (miễn phí).

2. Tài liệu: mỗi người chuẩn bị những tài liệu mình đã hoặc đang cần dịch, để làm thí nghiệm (file PDF, Word, Excel…).

Các chủ đề để thảo luận, sau khi mọi người thuần thục các công cụ trên:

1. Tìm kiếm cách chuyển đổi một dự án đang thực hiện sang dùng phần mềm CAT:

  • Đối với sách đang dịch, mới bắt đầu hiệu đính (chưa nhiều) thì CAT can thiệp từ phần nào? (ví dụ: Cẩm nang cơ khí)
  • Đối với sách đang hiệu đính (sắp hiệu đính nội bộ xong) thì có thể dùng CAT để cải thiện gì không? (ví dụ: Môi trường)
  • Đối với sách đã in trước đây và đang hiệu đính để tái bản, có thể cần so sánh với phiên bản mới, thì dùng CAT vào đâu? (ví dụ: Điện – điện tử)

2. Sắp xếp các thuật ngữ đã có trong các file Sachwortverzeichnis thành các kiểu file Termbase / Glossary để đưa vào phần mềm CAT (Excel -> TBX & CSV)

3. Lập quy trình sử dụng dữ liệu dịch tay đã có sẵn để đưa vào phần mềm CAT (Align -> TMX)