分享百度网盘爬虫源码

2016-12-22 11:42:51 +08:00
 guodong110

源码:https://github.com/gudegg/yunSpider.git
搜索站(之前域名太难记,新买了个):http://www.fastsoso.cn
大家试试速度如何,听说百度 cdn 是减速 cdn

4662 次点击
所在节点    分享创造
24 条回复
chroming
2016-12-22 12:40:34 +08:00
用着百度 cdn 爬着百度网盘的资源…
boro
2016-12-22 12:54:31 +08:00
是龟速
helloccav
2016-12-22 13:06:13 +08:00
谢谢分享,可是爬到了也没用啊,下载龟速
guodong110
2016-12-22 13:31:23 +08:00
@boro 很慢吗?
xiuc001
2016-12-22 13:37:14 +08:00
没什么用啊,搜到的资源全部下架了,爬虫更新频率不对
vincenttone
2016-12-22 13:40:11 +08:00
不错,谢楼主
guodong110
2016-12-22 13:44:34 +08:00
@xiuc001 前几天刚爬的 下架我也没法 不可能实时爬 没那资源
xiuc001
2016-12-22 14:44:00 +08:00
@guodong110 定期更新把下架的去掉,如果能做到可以搜索到最新可用资源的话,那是相当好的
Codewj
2016-12-22 14:45:14 +08:00
楼主,有些入门问题想咨询下,方便加个好友嘛
guodong110
2016-12-22 14:57:07 +08:00
@Codewj 企鹅 873455041
imxieke
2016-12-22 15:50:38 +08:00
合肥电信秒开
boro
2016-12-22 18:04:36 +08:00
@guodong110 是的
guodong110
2016-12-22 19:53:10 +08:00
@boro 什么宽带啊
a87150
2016-12-22 20:31:34 +08:00
nice
boro
2016-12-22 22:47:30 +08:00
@guodong110 我是说百度 cdn ,不是你的网站啊。

你的网站第一次打开稍慢。
guodong110
2016-12-22 22:57:14 +08:00
@boro 我网站用了百度 cdn 呢
mingyun
2016-12-22 23:13:47 +08:00
好评
SuperFashi
2016-12-22 23:26:27 +08:00
不知道有没有爬有密码的链接呢?
guodong110
2016-12-22 23:58:54 +08:00
@SuperFashi 加密都能爬 加密功能有何意义?
SuperFashi
2016-12-23 00:23:16 +08:00
@guodong110 嘛,我的意思是,既然你使用的枚举法来看分享地址,那应该可以撞到加密链接吧,为什么不做一个用户-链接关联的呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/329364

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX