有什么办法屏蔽 chatgpt 抓取网站内容?

2023-02-23 15:24:51 +08:00
 tellmeworld

像 chatgpt 这样的工具以后大概率是不会像现在的联盟一样分享收益的;

那么有什么办法屏蔽它来抓内容?

1966 次点击
所在节点    程序员
7 条回复
8355
2023-02-23 16:29:57 +08:00
是公开内容且通公网怎么能封禁呢...
就跟 robots.txt 一样 就是君子协议
抓是一定会抓的, 但是类似 bing 这种有网页内容回答引用的可能不会引用你的内容可能会用他找同类内容再引用
baobao1270
2023-02-23 19:11:51 +08:00
你可以起诉 OpenAI
dqzcwxb
2023-02-23 19:22:50 +08:00
很简单,断网
xieqiqiang00
2023-02-24 09:18:01 +08:00
可以改成每一次请求都要求人机验证
Fo3256Go
2023-02-24 09:41:30 +08:00
任何页面都需要登录后查看,这样就只能抓取到一个登录界面。
宝塔,某宝,咸鱼,腾讯会议
都是这样做的,禁止所有游客访问。
所有游客都强制劫持到登录页面。
laqow
2023-02-24 11:11:10 +08:00
如果目的不是节约流量的话能不能加一些看不见的东西给内容投毒
SunsetShimmer
2023-02-24 14:47:41 +08:00
大部分小网站没有被 OpenAI 抓取的价值。
这个需求从本质上看还是反爬虫。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/918568

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX