Dịch tài liệu PDF giữ định dạng tự động

Bài này tôi đăng tại tinhte.vn https://tinhte.vn/thread/how-to-dich-tai-lieu-pdf-ngoai-quoc-cach-tinh-te.3142170/
Post ngược qua đây để lưu trữ.

*tóm tắt: bài viết hướng dẫn dịch tài liệu giữ nguyên định dạng sử dụng onlinedoctranslator.

Thẳng vào vấn đề, ắt hẳn đa phần anh em (bao gồm mình) đều thường đọc/xem hướng dẫn sử dụng thiệt là kỹ khi mua về một sản phẩm công nghệ. Thường chúng được viết bằng tiếng Việt (cho các sản phẩm phân phối chính hãng) hoặc tiếng Anh.

Nếu chỉ thế thì đời thiệt đơn giản, thế nhưng nếu bạn muốn sử dụng một số sản phẩm nội địa của Trung Quốc (e.g Xiaomi Eco Sys) hay hàng nội địa Nhật (cái này thì max khó chịu bởi hãng tàu thì manual thường họ in kèm thêm tiếng anh, riêng nội địa Nhật, manual thì giấu kỹ, và nữa là chẳng có tiếng anh và trên nữa là tính phức tạp về số lượng tính năng của nó quá nhiều). Trước đây thì mình thường dùng Google Translate để dịch mấy cái nút bấm tiếng Nhật ra tiếng anh rồi đoán (bởi tủ lạnh hay máy giặt thì nó cũng đều là những tính năng cơ bản cả, hiểu nút bấm là xài chuẩn rồi). Riêng với những sản phẩm mà nhìn vô không biết nó là cái gì và cách hoạt động ra sao thì buộc phải đọc manual thôi.

Bài viết này mình sẽ hướng dẫn anh em dịch một file hướng dẫn sử dụng (manual) của một sản phẩm nội địa Nhật (chỉ sản xuất và bán tại Nhật). Với file gốc là PDF mà vẫn giữ nguyên được định dạng và đặc biệt là miễn phí. Anh em cũng có thể tận dụng bài này để dịch các tài liệu cho các ngôn ngữ khác, với các định dạng khác (.doc, odt…).

Trong bài viết này mình sẽ minh họa cách tìm và dịch manual của chiếc máy Hitachi N5000. Lưu ý đây là một dạng bài viết how-to nên sẽ có nhiều screenshot. Ah quên cái máy này ngon nhé anh em, ai mà mua làm quà tặng vợ/bạn gái cũng ổn lắm á. Nhìn như đồ chơi mà tầm 5 củ, nhưng thấy feedback dùng tốt. Quay lại vấn đề chính nào, dưới đây là các steps:

Tìm manual
Thường thì các manual này đều có thể tìm được trên trang chủ của các hãng, mình hay google với từ khóa là tên sản phẩm kèm trang chủ của nó. Với trường hợp này từ khóa của mình là: “site:hitachi.co.jp N5000”

May quá có luôn tại #1.
Screenshot 2020-06-01 at 03.34.52.png

Truy cập link và chúng ta có một trang tiếng nhật và vấn đề là các website này không hỗ trợ nội dung bằng tiếng anh.
Screenshot 2020-06-01 at 03.47.58.png

Mình sử dụng tính năng dịch tự động của trình duyệt Edge (dùng Bing Translation), thấy có cái chữ PDF mà chẳng biết nó là gì nên dịch cho chắc. Anh em nếu sử dụng Chrome thì hình như Google cũng có offer tính năng dịch trang web.
Screenshot 2020-06-01 at 03.48.16.png
Mình chọn tải file PDF theo hướng dẫn của trang web.

Đù, chuẩn cmnr, vậy là chúng ta đã có file gốc manual, dù nó là chữ giun dế.
Screenshot 2020-06-01 at 03.55.10.png

Việc tiếp theo là xác định xem file có bị mã hóa (không được phép copy hoặc không thể chọn ký tự hay không). Nếu không bị mã hóa thì tiếp tới bước sau. Còn không thì phải sử dụng điện thoại và bật Google translate để dịch từng đoạn thôi. Bởi select và copy được, vậy là file không bị mã hóa.


Dịch file


Tại đây mình sử dụng dịch vụ của trang https://www.onlinedoctranslator.com/; bởi tính ổn định khi dịch, ráp file và trên hết nữa là nó miễn phí (giới hạn file <10Mb, nếu hơn thì bạn dùng tính năng Split a PDF để cắt file thành nhiều file nhỏ).

💬Free Online Document Translator - Preserves your document's layout (Word, PDF, Excel, Powerpoint, OpenOffice, text)

⚡ Free, online service which translates office documents (Word, Excel, Powerpoint, PDF, OpenOffice, text) into multiple languages, preserving the original layout. Supported file formats: Word: doc, docx; PDF: pdf; Excel: xls, xlsx; Powerpoint;...
 ONLINEDOCTRANSLATOR.COM


Nói thêm thì những ứng dụng dạng này sẽ đọc vào file PDF và dịch những đoạn text đó bằng Google Translate thông qua các API được cấp sẵn và sau đó là ghi đè những dữ liệu đó. Và bởi thế trong hầu hết các trường hợp, quá trình này sẽ giữ được format gốc của file ban đầu. Lưu ý là vì để diễn đạt cùng một từ thì tiếng Việt thường dài hơn tiếng anh còn riêng tiếng Trung và Nhật thì rất ngắn nên khả năng bị vỡ định dạng là có thể xảy ra.

Chọn Translate Now
Screenshot 2020-06-01 at 04.01.25.png

Upload file và chờ chút để hệ thống tự đoán ngôn ngữ, hoặc bạn có thể tự chọn ngôn ngữ nguồn (chỉ nên dùng nếu bạn biết chính xác, giả như tiếng Trung có giản thể và phồn thể, và chọn sai thì nó không dịch đúng thôi – Cho nên hãy để system auto detect thôi, chính xác lắm.
Screenshot 2020-06-01 at 04.01.58.png

Trang web này bảo họ hỗ trợ dịch 109 bộ ngôn ngữ qua lại, nhưng mình đoán là với những ngôn ngữ không được hỗ trợ dịch tiêu chuẩn thì sẽ là có thể hệ thống sẽ sử dụng tiếng Anh như là ngôn ngữ đệm trung gian. Cho nên khuyến cáo những ai có thể đọc được tiếng anh thì nên chọn tiếng Anh. Trong bài viết này mình sẽ dịch tiếng Anh và tiếng Việt để so sánh.

Sau khi ấn Translate, hệ thống sẽ xử lý và cho mình tải file về.
Screenshot 2020-06-01 at 04.09.51.png

*cho những ai quan tâm tới privacy, system sẽ tự động xóa file sau 1 giờ. Ai sử dụng nhiều thì donate ly café cho các volunteers tạo ra dịch vụ này nhé.


Kết quả


File hoàn tất sẽ thêm hậu tố vào tên file với ngôn ngữ nguồn và đích.
Screenshot 2020-06-01 at 04.11.26.png


File gốc của tụi Nhật
Screenshot 2020-06-01 at 04.15.54.png

File được dịch sang tiếng Anh
Screenshot 2020-06-01 at 04.16.00.png

Hay tiếng Việt
Screenshot 2020-06-01 at 04.16.06.png

Thử một trang phức tạp hơn nào. Et voilà!!!
Screenshot 2020-06-01 at 04.25.38.png

Bởi format được giữ nguyên nên thiết bị công nghệ giờ dễ tiếp cận hơn rất nhiều. Chắc các anh em bán đồ nội địa nhật sẽ đỡ vất vả khi phải hướng dẫn người mua cách dùng. Thậm chí nếu anh em lái đem in file này theo khổ a5 rồi gửi kèm lúc bán máy thì coi như cũng là quá bán hàng quá sành điệu rồi vì các tài liệu hướng dẫn dịch từ tiếng nhật qua mà nó trông y như hàng chính chủ vậy :v.



Bài viết chưa tới ngàn chữ, mong ae đừng đọc xong rồi than bài dài nha. Chúc anh em có một tuần mới làm việc tràn đầy năng lượng. 😃.

Abe

Ps: công nghệ phát triển thiệt quá nhanh chóng, nên một số những thứ tưởng chừng như chuyện viễn tưởng trong Doraemon giờ thành sự thật cả rồi. (lâu quá rồi không nhớ lắm, nhưng truyện đó hình như cũng có bửu bối qq gì đó có thể auto-dịch ngôn ngữ).

Nhận xét

Bài đăng phổ biến từ blog này

Hướng dẫn viết báo cáo theo chuẩn báo cáo của trường đại học Hoa Sen

Peter và sợi dây thần