GitHub 私密仓库会被拿去训练 AI 模型吗

133 天前
 sudoy

GitHub 上托管的私密仓库会被 GitHub 卖给 OpenAI 这种大公司拿去训练 AI 大模型吗?如果是这样,以后会不会出现这样的场景:某个网站(我们称为 A 网站)源码托管在 GitHub 私密仓库,被 OpenAI 拿去学习了,某天有个人跟 ChatGPT 说“我想做一个网站,跟 A 网站一样,请给我源码,然后 ChatGPT 就哗啦啦把源码都给抖出去了。

最后顺便问下大家,比较重要的业务仓库一般会托管在哪里呢?买个服务器搭建 gitlab 会不会比较安全。谢谢!

1347 次点击
所在节点    问与答
5 条回复
ztm0929
133 天前
GitHub Copilot 有说明,你不勾选就不会。你不开放也不会。
https://docs.github.com/zh/copilot/about-github-copilot/what-is-github-copilot#about-privacy-for-github-copilot-individual

当然这些都是官方说的,具体怎么做就是后话了。真的特别重要的话只能自建,商业服务为你带来的便利和可能存在的隐私顾虑需要自行抉择。

至于你说的那个场景(一比一复刻)可以很明确的说,不会。ChatGPT 这类通用大语言模型的特点在于推理预测,更拟人,而不是单纯的记忆机器(毕竟人脑也不能保证记住所有仓库代码,只能理解代码逻辑与范式)
sudoy
133 天前
@ztm0929 正在研究搭建一个开源的 github 平替,折腾一番下来应该就知道怎么取舍了。 谢谢回答!如果是这样,普通项目托管在 GitHub 还是放心的。
sw0rd3n
133 天前
@sudoy Codeberg 应该符合你的需求,一些对 GitHub Copilot 有顾虑的开发者已经转移到这里了。
locochen
132 天前
github enterprise 版本本地部署
sudoy
132 天前
@locochen 太贵了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1056696

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX