大量的 HTML 文件需要翻译,用什么方法比较好?

2022-05-13 20:11:44 +08:00
 Jakarta
离线的 HTML 文件,大概上百个左右,是英文文档。

肯定是要先机翻以下,然后再手动调整。

不知道怎么能比较方便实现?有没有什么现成的工具?
1386 次点击
所在节点   翻译
7 条回复
renmu123
2022-05-13 20:27:15 +08:00
用你喜欢的语言找个解析 html 的库,把文字解析出来后找个翻译 api
TimePPT
2022-05-13 20:32:44 +08:00
大厂机翻的接口都支持网页文档翻译的
比如百度的: https://fanyi-api.baidu.com/doc/27
比如阿里云的: https://help.aliyun.com/document_detail/163814.html?spm=a2c4g.11186623.0.0.7b97273fOFEeoO
wangkun025
2022-05-13 20:42:56 +08:00
找兼职的学生。
Chism
2022-05-13 21:23:30 +08:00
@TimePPT
有没有那种网页里引入.js ,直接就可以对本网页进行翻译的?
ch2
2022-05-13 21:42:58 +08:00
python 很简单,bs4 提取 text ,然后 google 翻译 api 一调用就完事了
flowerpiggy
2022-05-14 00:55:55 +08:00
用 windows/mac 上可用的 GT4T 吧,不折腾:

1. 直接翻译文件夹内及子文件夹里所有 html 格式的文件,保留文件夹层次结构,拖文件夹到界面,然后等即可。
2. 全球 29 个自动翻译引擎任选,什么 deepl, google, modernmt 你知道的不知道的都有。可找一两个文件先试几个引擎选择最优的。
3. 可使用自己的词汇表来修正自动翻译结果。
4. csdn 搬家技术供应商,练就一身好本领。

请自行搜索下 GT4T 。
bigtang
336 天前
批量导入 tanglib.com 成一本书, 然后一键整本书翻译

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/852700

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX