V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Jakarta
V2EX  ›  翻译

大量的 HTML 文件需要翻译,用什么方法比较好?

  •  
  •   Jakarta · 2022-05-13 20:11:44 +08:00 · 1388 次点击
    这是一个创建于 924 天前的主题,其中的信息可能已经有所发展或是发生改变。
    离线的 HTML 文件,大概上百个左右,是英文文档。

    肯定是要先机翻以下,然后再手动调整。

    不知道怎么能比较方便实现?有没有什么现成的工具?
    7 条回复    2023-12-21 08:20:54 +08:00
    renmu123
        1
    renmu123  
       2022-05-13 20:27:15 +08:00 via Android
    用你喜欢的语言找个解析 html 的库,把文字解析出来后找个翻译 api
    TimePPT
        2
    TimePPT  
       2022-05-13 20:32:44 +08:00
    大厂机翻的接口都支持网页文档翻译的
    比如百度的: https://fanyi-api.baidu.com/doc/27
    比如阿里云的: https://help.aliyun.com/document_detail/163814.html?spm=a2c4g.11186623.0.0.7b97273fOFEeoO
    wangkun025
        3
    wangkun025  
       2022-05-13 20:42:56 +08:00
    找兼职的学生。
    Chism
        4
    Chism  
       2022-05-13 21:23:30 +08:00 via Android
    @TimePPT
    有没有那种网页里引入.js ,直接就可以对本网页进行翻译的?
    ch2
        5
    ch2  
       2022-05-13 21:42:58 +08:00
    python 很简单,bs4 提取 text ,然后 google 翻译 api 一调用就完事了
    flowerpiggy
        6
    flowerpiggy  
       2022-05-14 00:55:55 +08:00
    用 windows/mac 上可用的 GT4T 吧,不折腾:

    1. 直接翻译文件夹内及子文件夹里所有 html 格式的文件,保留文件夹层次结构,拖文件夹到界面,然后等即可。
    2. 全球 29 个自动翻译引擎任选,什么 deepl, google, modernmt 你知道的不知道的都有。可找一两个文件先试几个引擎选择最优的。
    3. 可使用自己的词汇表来修正自动翻译结果。
    4. csdn 搬家技术供应商,练就一身好本领。

    请自行搜索下 GT4T 。
    bigtang
        7
    bigtang  
       338 天前
    批量导入 tanglib.com 成一本书, 然后一键整本书翻译
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2661 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 10:22 · PVG 18:22 · LAX 02:22 · JFK 05:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.