为什么 GitHub Copilot 收费,却不给训练用的代码作者费用?

2022-06-23 18:45:59 +08:00
 zwgf

GitHub Copilot 收费是应该的,训练用的机器设备,项目的开发管理人员。这些都是成本。大家都要吃饭,所以支持 GitHub Copilot 收费!

我也仔细看了一下 Copilot 的协议,Copilot 不对建议的代码负责,其实这个也是能理解的,谁能保证代码没个 BUG ,也就是说除了 BUG 或者建议不准确以外。如果 Copilot 给的建议代码是受到知识产权保护的代码,你的项目使用受到任何问题也是和 Copilot 无关的。关系撇的很干净。这就像你在视觉中国买了一张图片,然后发现视觉中国对这张图片没有任何权利。

Copilot 的建议代码是通过官网标注的数十亿行代码训练而来的。协议中也说明了来自 Github 和使用 Copilot 的用户。然后 Copilot 就可以免费白嫖这些代码,不需要给代码作者费用。这就像你写了一本小说,然后被人拿去改拍电影,不需要给你费用一样。

Copilot 之前免费的时候我一直在用,怎么说呢,体验还算可以。因为当时是免费的,所以我觉得用了我的 github 的代码我也是可以接受的。

举个例子,你家有个果园,落的有很多树叶(这里就当对果园主没啥用)。有个人给你说想拿一些树叶回家烧火做饭用,同时他也给他邻居一些烧火做饭用。作为果园主大多数人都不会拒绝。有一天这个人有个想法,从你果园拿出来的叶子他装到麻袋里面包装一下,就坐在你家果园门口 10 刀一袋卖,买回去的人发现这些树叶上有白蚁还把家里的柴房给蛀了。这个时候买树叶的人回来还不能找这个卖树叶的评理。这个时候你这个果园主是什么想法呢?

9100 次点击
所在节点    GitHub Copilot
74 条回复
BeautifulSoap
2022-06-23 19:54:33 +08:00
lz 你这问题太特定于某个问题了,这个问题可以扩展为,扒了网上的公开数据炼丹,然后做成了产品盈利,那么应不应该为这些公开数据的作者付费?
yoa1q7y
2022-06-23 19:56:51 +08:00
我觉得这个问题很难界定,如果真要给钱,怎么给,给谁好,给多少。

以我的使用经验,Copliot 给我的代码 99% 是结合我的代码上下文给出的业务代码,也就是说这些建议代码是不通用的,放到别的地方也没有价值。

换言之,Copliot 没有原封不动的照搬某个人的代码。或许一些通用算法之类的代码是照搬,但是又怎么界定这段代码是属于谁的呢
icyalala
2022-06-23 19:59:06 +08:00
@icyalala Github 训练的代码,也是流行度高的项目、质量高的项目权重更高吧?
那些项目的维护者是可以免费使用 Copliot 服务的。
chocolatesir
2022-06-23 20:00:13 +08:00
是怪怪的,如果加个开关能让用户选择是否提供数据可能会好些。但是你前面举的两个类比的例子不合适,百度云一开始宣传免费大容量不限速让你把文件放上去,干死竞争对手后开始收费,不给钱限速,github 有不给钱不让你正常速度下载自己的代码吗?微信利用用户数据也不能和这个类比吧,你放 github 的开源的代码本来就是公开的,可是微信的个人隐私数据并不是公开的啊。
Jooooooooo
2022-06-23 20:07:12 +08:00
你给 google 喂数据 google 也不给你钱
zwgf
2022-06-23 20:21:37 +08:00
@otakustay 网盘容量限制合理,网速限制不合理。这种营销方式就是让你大量存储,然后想要下载就需要购买 VIP 付费。

@JQSM
我没有说他违法,我说的是这样非常不合理。

@RealJacob
我的说了服务付费是合理的,问题是你是如何让这变成一个服务或者这个服务是基于什么而来的。如果你存储容量收费我觉得合理。

@BeautifulSoap
是的你这个总结的好,我的想法就是这样的。只是刚好看到 Copliot 收费了而感。
RealJacob
2022-06-23 20:26:09 +08:00
@zwgf 存储收费和流量速度收费有什么本质的不同呢?为什么你认为存储收费就是合理的,流量速度收费就不合理呢?单纯探讨下
JQSM
2022-06-23 20:27:12 +08:00
@zwgf 现在大量的收费服务都基于开源代码,不过这属于“不合理”且应该被批评的话,那等于是放弃发展固步自封,也违背了开源的初衷。
JQSM
2022-06-23 20:27:50 +08:00
不过->如果
@JQSM
zwgf
2022-06-23 20:29:21 +08:00
@yoa1q7y
不是说照搬的问题,而是作为 AI 公司,训练的数据最终做出的服务是付费的服务,那么这些训练数据是不是也需要给数据的作者一定的报酬,相当于稿费。

@icyalala
他训练的绝对有流行度不高的开源仓库,因为我几个月的使用过程中给我推荐了很多小众的代码。那么这些小众代码的作者是不是应该收到一定的费用。

@chocolatesir
这本身就是探讨,这些都是不合理的。Github 可以收费,我的意思不是说不让收费,而是如果是一个盈利的项目,应该给予这个项目的贡献者相应的报酬,这应该是正常的事情,难道需要大家去争取才能得到,就不正常了。

@Jooooooooo
但是最起码谷歌不向我收费呀
rabbbit
2022-06-23 20:35:13 +08:00
想到个问题,假设 Github Copilot 使用了 GPL 协议的代码进行了训练,那么是否有义务向用户提供 Github Copilot 的源码?
yoa1q7y
2022-06-23 20:38:07 +08:00
我觉得你可以这么理解,把 Copliot 当成一个人,比如小张,小张天天在 GitHub 上看开源代码,日积月累掌握了很多的编程经验和技巧,成为了大神,然后他去开课指导其他人,每人每月 10 美元,那你觉得小张应该把自己的收入分出一部分给他之前看过的代码的作者吗?
rabbbit
2022-06-23 20:38:07 +08:00
另外,假如 Github Copilot 的用户使用了来自 GPL 协议的代码片段,那么该项目是否会被 GPL 传染?
darklights
2022-06-23 20:38:09 +08:00
Copliot 只会使用有明确开源协议的项目的代码。大人们只讲法律,如果在法律上没问题,那就没问题。“我觉得”这三个字连 5 毛钱都不值。当然选择是双向的,如果不能接受,不用就是了。

这几天的类似帖子让我想起一件事:开源中*以前有还有动弹的时候,里边的人言必称开源、自由,时刻为了人类的计算自由摇旗呐喊,彷如 IT 从业人员最后的希望。然后某天 Jetbrains 系 IDE 好像是换了激活方式还是啥的导致白嫖失败,里边的人像是听到珍珠港被炸一样惊慌失措。

也不是不能理解。毕竟面包吃饱了,才有力气讲理想、喊口号。想免费用,大大方方说出来就是了,何必搞那么多的大道理欺骗自己。
zwgf
2022-06-23 20:38:38 +08:00
@RealJacob
存储容量收费,流量收费我认同。限速不认同。
你买了个房子,按照房子面积算房子的费用合理吧(存储容量)、按照房子的使用年限算房子的费用也是合理的吧(流量)。那如果按照每天你家大门只能有 2 次进出次数算房子的价格是不是就很别扭?

@JQSM
这是代码的使用方式的问题吧,如果我的开源代码是被用做其他的开源项目,没问题呀。如果是用于商业项目也没问题,只要符合我的开源协议。而 Copliot 是把你的代码作为训练的资料数据,而不是他软件本身。而且他是一个商业付费项目,所以我觉得最起码要给一个开关或者给与代码提供者一些报酬。

@rabbbit
这里按照我的理解是不需要的,因为 Copilot 本体并不包含 GPL 开源的代码,而是作为训练数据存在的。所以我是认为需要给代码原作者一定的报酬。当然 Copilot 这样做不违法。
zwgf
2022-06-23 20:45:22 +08:00
@yoa1q7y
确实本质是是这样的,确实可以不给作者分。但小张一个人同时最多带 100 个学生,而 Copilot 可以同时带更多的人。那么他的收入更多,从道理上来讲是应该给与原作者一些补偿的。我比较认可罗永浩,最起码他做锤子的时候是给了开源社区回馈的。而国内其他头部互联网公司,很少有真正回馈开源社区的。

@darklights
如果你觉得我只是不想让收费的话,那么你私信我,我让你看一下我开的 Jetbrains 订阅和 Copliot 订阅。这点钱还没我炒币亏得多。不至于为了这点钱浪费我的时间。
2218675712
2022-06-23 20:54:19 +08:00
![图片]( https://imgur.com/a/Lmro7YY)

目前可以设置使用哪些代码
yoa1q7y
2022-06-23 21:00:12 +08:00
@zwgf 不,小张并不是只能带 100 个人,有很多种方式可以扩大输出,比如写收费专栏,出书,开直播,只要小张足够屌,那么他的收入可以非常非常多。
yoa1q7y
2022-06-23 21:02:32 +08:00
简单说就是,小张卖的是自己的天分和努力; github 卖的是自己的 AI 技术
SuperMild
2022-06-23 21:05:14 +08:00
@zwgf

> 如果按照每天你家大门只能有 2 次进出次数算房子的价格是不是就很别扭?

只要是事先声明,没有强买强卖,有什么问题?

(另外,你可能需要找一个有很多人买单的收费规则来举例才比较贴切,你这个举例太脱离现实,参考意义就不大了)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/861734

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX