ChatGPT 翻译字幕的一个尝试

2023-09-21 11:19:48 +08:00
 yedaxia

相关软件:33 字幕

由于字幕一句话可能会拆分多行的特性,加之 ChatGPT 很容易拼接不同行来翻译,导致返回的行数不一致,所以用 ChatGPT 来翻译字幕变得非常困难。

之前发过一个讨论贴:

似乎没有办法阻止 chatGPT 合并句子

看了一些开源的 ChatGPT 字幕翻译,总结了几种思路:

  1. 逐句翻译:由于没有上下文,翻译质量一般
  2. 多行翻译 + 失败重试:效果会好一些,但行数越多,失败率越高
  3. 带上下文的几行或逐句翻译:这个效果应该也不错,但是会消耗很多附加 token

在拿到 GPT4 接口后,我用来试了一下字幕翻译,稳定了不少。本来对 ChatGPT 做字幕翻译快死心的我,又燃起了一丝希望。

这边采取的一个策略是,在失败率和 token 消耗之间做了一个平衡:

  1. 采用 GPT4 时,多行一起翻译( 50 - 100 行)
  2. 采用 ChatGPT3.5 ,先尝试少量行( 8 行左右),失败就变成逐行

目前简单的测试结果,GPT4 的表现还不错,3.5 就一般。

不过,提示词和翻译策略都还有很多改进空间,比如支持定义翻译风格,利用更多的上下文信息等,这边后续会持续去尝试一下。

需要有自己的 key ,我们会帮你解决网络问题,并且可以免费使用这个功能。

欢迎有 key 的朋友去体验,有啥好的建议或者问题也欢迎大家留言。

3092 次点击
所在节点    分享创造
8 条回复
hoythan
2023-09-21 14:43:04 +08:00
试试 DeelL 呢?
hoythan
2023-09-21 14:43:14 +08:00
DeepL
Liftman
2023-09-21 15:10:17 +08:00
gpt 单句翻译我觉得质量并不是特别好。可以每次翻译的时候,把之前的所有已经翻译的内容做一个压缩总结交给下一句去作为翻译的基础,设定一个固定值,前 25%的视频长度以前 10 句为基础,25-50%以前 25%的内容作为基础。不过用 4 的 api 确实略微奢侈了。。。。直接上传到 youtube 。。让他翻译算了。。
msg7086
2023-09-22 06:28:19 +08:00
你最好先想想能不能付得起这个钱。我之前拿 GPT4 跑小说翻译,几千字花了$0.5 。
GPT4 的价格是 GPT3.5 的十倍以上,用起来还是要想想的。
yedaxia
2023-09-22 14:09:31 +08:00
@hoythan 有支持 DeepL 。
yedaxia
2023-09-22 14:12:13 +08:00
@Liftman 单句翻译确实质量不行。
yedaxia
2023-09-22 14:16:18 +08:00
@msg7086 嗯,GPT4 的费用确实高,不是消耗我们自己的 token 。我们只是提供多一种选择,有 key 的朋友可以试试,这个功能是免费提供的。
xxxxman
313 天前
真巧,DeepL 已经支持上下文当作要翻译的内容的背景了,上下文不会被翻译

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/975817

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX