怎么防止前端页面被采集?

2015-06-11 08:12:07 +08:00
 niceday

防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法

4326 次点击
所在节点    问与答
24 条回复
binux
2015-06-11 10:25:49 +08:00
@gangsta 于是,你不是把这个赛高科技爬到 V2EX 来了吗?
mcone
2015-06-11 11:36:21 +08:00
没办法 很难

百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的
Hawk
2015-06-11 13:29:31 +08:00
@Havee 这个也是有点屌。。
amxku
2015-06-11 23:22:57 +08:00
其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/197668

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX