[沉浸式翻译] 这个浏览器扩展的翻译原理是什么样子的

66 天前
 shebaoting

我使用的是 [沉浸式翻译] 这个浏览器扩展。然后使用的某个 AI 的 api 。

我想请教一下各位,他是一段一段的发送给 AI 翻译,还是整篇发给 AI 进行翻译?

如果是整篇翻译,很容易超出 AI 的限定长度。

如果是一小段一小段的发给 AI 翻译,怎么能保证上下文连贯,语义一致并且意思相通呢?

2468 次点击
所在节点    程序员
17 条回复
z7356995
66 天前
应该是一段一段的,如果你看油管上的视频英语字幕,你会发现上下句之间并不能连接翻译,
xu33
66 天前
这个应该不是 ai 翻译的吧,感觉翻译质量很差,和 gpt 甚至 kimi 之类的都没法比
shebaoting
66 天前
如果是一段一段,做到上下文语义连贯就是个很麻烦的事情了。
shebaoting
66 天前
@xu33 可以在设置里面设置你喜欢的 ai 。用自己的 api 密钥。
xu33
66 天前
@shebaoting 原来如此,我试试
ao99
66 天前
不知道具体怎么实现的,如果想实现上下文连贯的话可以几段一起翻译,然后每次总结下之前的翻译内容,当做上下文给下次翻译输入
IDKAFK
66 天前
我记得是可以自定义段落数和文本长度的
XIU2
66 天前
你可以看一下另一个功能类似但开源的 fishjar/kiss-translator 代码是怎么实现的。
我记得这个作者好像也在 V2EX ?反正我也是在 V2EX 里发现这个项目的。
moudy
66 天前
@shebaoting #3 有没有可能重叠发送呢?发送段落 1 2 3 4 5 , 显示 1 2 3 4 5 。 在发送 4 5 6 7 8 , 显示 6 7 8 ?
iX8NEGGn
66 天前
设置里不是有说明吗,可以一段一个请求的,也可以多段一个请求,多段的时候用提示要求返回固定的格式,但这对模型的指令遵循性要求比较高。
msrcatn203
66 天前
内置 prompt 呗 有个上下文长度加上要求流利自然什么的 GPT 翻译不都是这么做的吗
aitianci
66 天前
作者有个新闻项目叫 Buzzing ,那个项目的 TG 群可以问他
GrayXu
66 天前
可以一段发,也可以小 batch 发。对应不同的 prompt ,你看设置就知道了。
lmdown
66 天前
ai 会自动关联上文啊😂
baidishenjian
65 天前
肯定不是整篇,而是一段一段处理的,如果是整篇都没有办法和对应的文本对齐啊。沉浸式翻译不是一段中文一段英文吗,那应该就是那一堆英文送进去得到一段中文,然后把中文附加到段落后面。整个流程应该不复杂,遍历网页上的标签( p div span )然后把段落中的文本翻译,然后附加到句子后面。我之前做过有点类似的功能插件 https://github.com/woniu9524/dingdang-extension
ily433664
64 天前
可以分成多段一起发,比如
{
第一段:xxx
第二段:xxx
第 N 端:xxx
}
放在一起发过去,写好 prompt 就行了
iorilu
64 天前
很简单

先分段

然后将每段发给 ai , 做两件事
1. 翻译
2. 总结

然后发下一段时, 带上前 1,2 段的总结, 让 ai 参考翻译下一段

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1072388

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX