[沉浸式翻译] 这个浏览器扩展的翻译原理是什么样子的

6 天前
 shebaoting

我使用的是 [沉浸式翻译] 这个浏览器扩展。然后使用的某个 AI 的 api 。

我想请教一下各位,他是一段一段的发送给 AI 翻译,还是整篇发给 AI 进行翻译?

如果是整篇翻译,很容易超出 AI 的限定长度。

如果是一小段一小段的发给 AI 翻译,怎么能保证上下文连贯,语义一致并且意思相通呢?

2069 次点击
所在节点    程序员
17 条回复
z7356995
6 天前
应该是一段一段的,如果你看油管上的视频英语字幕,你会发现上下句之间并不能连接翻译,
xu33
6 天前
这个应该不是 ai 翻译的吧,感觉翻译质量很差,和 gpt 甚至 kimi 之类的都没法比
shebaoting
6 天前
如果是一段一段,做到上下文语义连贯就是个很麻烦的事情了。
shebaoting
6 天前
@xu33 可以在设置里面设置你喜欢的 ai 。用自己的 api 密钥。
xu33
6 天前
@shebaoting 原来如此,我试试
ao99
6 天前
不知道具体怎么实现的,如果想实现上下文连贯的话可以几段一起翻译,然后每次总结下之前的翻译内容,当做上下文给下次翻译输入
IDKAFK
6 天前
我记得是可以自定义段落数和文本长度的
XIU2
6 天前
你可以看一下另一个功能类似但开源的 fishjar/kiss-translator 代码是怎么实现的。
我记得这个作者好像也在 V2EX ?反正我也是在 V2EX 里发现这个项目的。
moudy
6 天前
@shebaoting #3 有没有可能重叠发送呢?发送段落 1 2 3 4 5 , 显示 1 2 3 4 5 。 在发送 4 5 6 7 8 , 显示 6 7 8 ?
iX8NEGGn
6 天前
设置里不是有说明吗,可以一段一个请求的,也可以多段一个请求,多段的时候用提示要求返回固定的格式,但这对模型的指令遵循性要求比较高。
msrcatn203
6 天前
内置 prompt 呗 有个上下文长度加上要求流利自然什么的 GPT 翻译不都是这么做的吗
aitianci
6 天前
作者有个新闻项目叫 Buzzing ,那个项目的 TG 群可以问他
GrayXu
6 天前
可以一段发,也可以小 batch 发。对应不同的 prompt ,你看设置就知道了。
lmdown
6 天前
ai 会自动关联上文啊😂
baidishenjian
5 天前
肯定不是整篇,而是一段一段处理的,如果是整篇都没有办法和对应的文本对齐啊。沉浸式翻译不是一段中文一段英文吗,那应该就是那一堆英文送进去得到一段中文,然后把中文附加到段落后面。整个流程应该不复杂,遍历网页上的标签( p div span )然后把段落中的文本翻译,然后附加到句子后面。我之前做过有点类似的功能插件 https://github.com/woniu9524/dingdang-extension
ily433664
5 天前
可以分成多段一起发,比如
{
第一段:xxx
第二段:xxx
第 N 端:xxx
}
放在一起发过去,写好 prompt 就行了
iorilu
5 天前
很简单

先分段

然后将每段发给 ai , 做两件事
1. 翻译
2. 总结

然后发下一段时, 带上前 1,2 段的总结, 让 ai 参考翻译下一段

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1072388

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX