Dịch thuật với công cụ CAT

Sửa file Word sau khi chuyển từ PDF: kiểm tra các bảng

Các phần mềm convert PDF to Word, ví dụ ở trang pdf2docx.com, thường gặp khó khăn khi xử lý các bảng (table). Ví dụ trong hình dưới này: đúng ra chia mỗi ô trong bảng giống như đường biên được vẽ sẵn, thì phần mềm chia mỗi dòng của một bảng thành một hàng riêng, do đó một câu ban đầu bị tách ra thành nhiều đoạn text ở các ô. Điều đó sẽ gây khó khăn cho việc dịch tài liệu với phần mềm CAT, vì người dịch sẽ phải tự tách nội dung câu dịch ra cho tương ứng độ dài với các đoạn gốc, và khi lưu vào bộ nhớ dịch (translation memory) thì sẽ không còn các câu hoàn chỉnh.

Cách khắc phục: sửa bằng tay các ô trong table, gộp chúng lại để nối thành câu hoàn chỉnh (trong MS Word: chọn các ô gần nhau, nhấn chuột phải, bấm “Merge Cells”), và xóa các ký tự xuống dòng để nối câu cho hoàn chỉnh.

Merge Cells để tránh tách dòng trong một câu