关于开源输入法的「云联想」,能否只下载数据不上传数据?

2023-04-15 21:32:58 +08:00
 pdog18

关于输入法的云联想功能,前段时间那个微信键盘,一次按键一次网络请求,我看似乎很多人反应激烈,我是不在乎的。

但是这个云联想的功能,可能是一部分 Rime 输入法用户期待的功能。

如果我是一个愿意牺牲一点点硬盘空间,并且不考虑热词的维护,每天固定时间一次性拉取当天的热词,作为「云联想」功能的词库。

是否能变相实现 Rime 输入法的「云联想」并且不会让玩家觉得有侵犯隐私的风险?

(除开可能的云联想需要脱敏统计所有用户每天的新的自造词。)

1607 次点击
所在节点    问与答
8 条回复
honeycomb
2023-04-15 21:38:23 +08:00
这个东西最后要搞差分隐私才能比较好解决既要不上传数据又要下载词库之间的矛盾。
iOS 已经在特定功能里(比如键盘)用了好几年了,接下来广告也会逐渐上或者已经用上了。
0o0O0o0O0o
2023-04-15 22:02:56 +08:00
MossFox
2023-04-16 06:54:34 +08:00
云联想不全是关于新词热词,也存在模糊输入的推测,比如这种:


这种推测远比模糊拼音要复杂。要说靠拉数据到本地的话,还有一个问题就是:不收集用户输入,这种数据从何来。
Yzh361
2023-04-16 08:39:44 +08:00
沒有上傳的話 服務器怎麽知道你要請求數據?
你如果想問別人問題,你不提出來人家怎麽知道你要問什麼…
pdog18
2023-04-16 08:42:32 +08:00
@MossFox 谢谢。
不过 `li'oul => 浏览` 这个模糊推测,似乎也没有必须要收集用户输入啊?
pdog18
2023-04-16 08:47:04 +08:00
@Yzh361
不好意思我没有解释的很明白。
「沒有上傳」指的是,沒有上傳「本次」輸入按鍵(或者說是预编辑码)。
云联想在我的认知里面就好似在服务器维护了一个热词词库,如果仅仅是一个词库的话,那么只要预下载合并至 Rime 的词库,不也可以使得 Rime 实现云联想的功能吗?
相对于每次将「预编辑码」上传至云端服务器的行为,转变成了仅下载词库,不上传「预编辑码」,这个角度来看,说「没有上传」似乎也没有不太合适。
pdog18
2023-04-16 08:52:04 +08:00
@honeycomb 感谢,似乎「差分隐私」比脱敏强大的多,那这样输入法似乎更加大有可为。
即使有「预编辑码」上传到服务器,只要确保上传的数据是经过「差分隐私」处理的,也是可以保护隐私的,服务器似乎只能获取到无法反推信息的数据。
那么用户端无需考虑服务器是由谁搭建的,都是可以不担心数据泄露的云联想目标服务器了?
honeycomb
2023-04-16 09:25:07 +08:00
@pdog18 差分隐私提供了能对脱敏程度的多少进行了定义的工具。

再回到上传数据的问题,去掉一部分用户的上传数据,不会影响云端词库的性能(显然这里不涉及到差分隐私),因此对隐私要求高的情况下,只下载词库,不上传数据的做法是合理的。

但问题是,它是否愿意?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/932808

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX