基于 ChatGPT 开发的应用怎么保证数据隐私性

现在 ChatGPT 这些很火，但是比如开发了一个私人助理，这个需要调用很多私人数据，

部署在云端，让用户自己做链接认证，这个怎么保证大家相信你？
私有部署，升级维护使用都是麻烦。

感觉这一波 ChatGPT 这个难点好难突破。

swulling

2023-04-03 16:04:32 +08:00

反正最后不都传给 OpenAI 了么。用户不相信，不想数据上传，那他肯定就用不了啊。

除非用私有化的 LLM

op351

2023-04-03 16:07:52 +08:00

就算你加密了
你的转发加密了
openai 也没保证不会利用你上传的数据

Removable

2023-04-03 16:10:42 +08:00

@op351 实际上是保证了的，openai 明确说明了不会利用 API 的数据进行训练等操作，并会在 30 天后删除数据。

DjvuLee

2023-04-03 16:10:45 +08:00

@swulling 现阶段还是没有大量的本地数据上传的，比如你本地的数据库，有的都只是 chat query 里面的。
但是想要想有个性化的效果，这个是无法避免的。但是私有化部署 LLM 其实就有第二个问题。

DjvuLee

2023-04-03 16:11:21 +08:00

@op351 现在是，但是只是 query 的数据，隐私性其实还好。

DjvuLee

2023-04-03 16:14:11 +08:00

@Removable 目前我还是相信 openAI ，但是你看他的 chat 页面上面有 vote-up 和 vote-down ，估计还是会做一些分析的。

op351

2023-04-03 16:16:14 +08:00

@Removable
https://help.openai.com/en/articles/6783457-chatgpt-general-faq
请看第 6 条
很明显没有保证而且态度很暧昧用的“maybe”

Removable

2023-04-03 16:16:23 +08:00

@DjvuLee 你指的是 openai 自己做的 ChatGPT 的数据吗？那个是会拿去做训练的。我说的是 api

DjvuLee

2023-04-03 16:17:10 +08:00

@Removable 我说的就是 API 。

libook

2023-04-03 16:17:22 +08:00

三星刚刚因为 ChatGPT 出了几次数据泄漏事故。

如果 AI 引擎是实时学习的，那么肯定保不齐会成为大喇叭，给点赛博咒语就把别人的隐私吐出来了。

现在的主要问题还是，GPT 只是个语言模型，它是基于概率来计算最可能出现的上下文，它不可能理解逻辑和人情世故，只能尽可能猜得符合惯例。即便是私有化部署企业内使用，也还是要解决信息从高安全等级的岗位流向低安全等级的岗位的问题。

要么 OpenAI 自己想出办法从底层来解决，要么就只能用于非敏感场景。

justfindu

2023-04-03 16:20:14 +08:00

保证不了三星不是刚出事么

hahastudio

2023-04-03 16:32:58 +08:00

基于 ChatGPT 不行，ChatGPT 是 OpenAI 的应用，它会有人来阅读你的聊天记录 https://help.openai.com/en/articles/6783457-chatgpt-general-faq

> 6. Will you use my conversations for training?
> Yes. Your conversations may be reviewed by our AI trainers to improve our systems.

基于 OpenAI API 的恐怕也不行，虽然 https://platform.openai.com/docs/guides/chat/do-you-store-the-data-that-is-passed-into-the-api 里面说

> Do you store the data that is passed into the API?
> As of March 1st, 2023, we retain your API data for 30 days but no longer use your data sent via the API to improve our models. Learn more in our data usage policy.

但是 https://openai.com/policies/usage-policies 里面说

> If we discover that your product or usage doesn’t follow these policies, we may ask you to make necessary changes. Repeated or serious violations may result in further action, including suspending or terminating your account.

你猜它怎么做到这一点

如果是基于 LLaMA 、ChatGLM 、Colossal-AI 这些可以本地部署的模型的话，那么数据隐私性就依靠你自己实现了

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/929449

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.