Làm việc với file PDF

Một số công đoạn khi làm việc với file PDF, theo kinh nghiệm ở nhóm dịch sách Nhất nghệ tinh:

+ Chia tách các trang trong file PDF: dùng PDF Split and Merge Basic (miễn phí)

+ Convert PDF to Word:

  • Online: Adobe Online Converter (thu phí dịch vụ 2 EUR/tháng), pdf2docx.com, convertio.co, online-convert.com, zamzar.com
  • Phần mềm trên máy tính:
    • Với PDF Xchange Editor: dùng chức năng “Save as…” và chọn định dạng là DOCX. Đối với bản miễn phí, file xuất ra sẽ có một số hạn chế nhưng có thể gỡ bỏ được. 2 hạn chế là: yêu cầu phải có mật khẩu mới được edit (giải pháp: mở bằng Word, “Save as” thành file mới, thì sau đó mở file không cần mật khẩu nữa); có một số text box ghi “PDF-XChange Editor DEMO” (giải pháp: tìm kiếm cụm từ này trong văn bản và xóa text box đi).
    • Với SDL Trados Studio (có phí), dùng chức năng “Convert to Translatable Format” thì file PDF sẽ được convert thành file DOCX (tạo ra ở thư mục lưu tài liệu ngôn ngữ gốc của Project trong SDL Trados Studio).
    • Với MS Word 2013 (có phí), hoặc LibreOffice / OpenOffice (miễn phí), có thể mở file PDF và lưu lại dưới dạng file DOCX.

+ Dùng OCR để nhận diện chữ trong hình ảnh: (chỉ khi file PDF bị khóa khả năng copy chữ, hoặc gồm các hình chụp, hoặc là các chữ bị chuyển hết thành hình vector do xuất ra từ file thiết kế kiểu Adobe InDesign)

  • Online: convertio.co/ocr, onlineocr.net
  • Phần mềm trên máy tính:
    • Dùng phần mềm VietOCR (vietocr.sourceforge.net), dựa trên động cơ nhận dạng chữ Tesseract, miễn phí, độ chính xác cao (tài liệu sau khi làm OCR chuyển thành trắng đen).
    • Dùng phần mềm PDF Xchange Editor, bản miễn phí cũng có chức năng OCR và cũng dựa trên Tesseract, giữ được màu sắc của file PDF.
    • Dùng phần mềm Nitro PDF Pro (có phí): có đủ các chức năng OCR, ghi chú, edit file PDF.
    • Dùng phần mềm PDF Architect (có phí): có đủ các chức năng OCR, ghi chú, edit file PDF, tính tiền thêm theo từng module.
    • Dùng phần mềm ABBYY Fine Reader (có phí).

+ Ghi chú trên file PDF trong quá trình hiệu đính:

  • Adobe Reader (miễn phí): mở menu View -> Comment sẽ thấy các chức năng ghi chú trên file PDF, xong rồi save file lại, người khác có thể duyệt lại các ghi chú đó từ trên xuống dưới mà không sợ bỏ sót (xem “Comment List” trong phần mềm Adobe Reader).
  • PDF Xchange Viewer (miễn phí): phần mềm nhẹ, hiệu quả, các ghi chú cũng mở được bằng các phần mềm PDF reader. Các biên tập viên NXB Trẻ khi làm việc với nhóm Nhất nghệ tinh cũng khuyên dùng phần mềm này.

+ PDF24 – Bộ công cụ miễn phí (và phần mềm chạy trên Windows) để làm việc với các file PDF: https://tools.pdf24.org/en/, ví dụ có công cụ so sánh giữa 2 file PDF xem nội dung text khác nhau thế nào (https://tools.pdf24.org/en/compare-pdf), phù hợp với việc so sánh 2 version của một văn bản.