写了俩微小的爬虫,一个爬垠神 blog 一个爬看雪论坛(同事的需求),欢迎来玩哦~

2016-12-02 16:47:08 +08:00
 supersu

Gayhub repo:
https://github.com/supersu097/mycrawler

上面的图片来自 gayhub 不知道 v2 支不支持,图不显示的话直接上 gayhub 看哦(是个看雪的最终效果图),最后欢迎各种 pr 啊

2669 次点击
所在节点    Python
7 条回复
supersu
2016-12-02 16:48:10 +08:00
噗...图果然挂了,本来以为预览不显示,实际会 ok , but...
supersu
2016-12-02 16:50:03 +08:00
加载图片用的语法是![](url),编辑的时候选的 markdown
haitang
2016-12-02 17:10:13 +08:00
supersu
2016-12-02 17:15:31 +08:00
@haitang 不知道哦, chrome 右键直接复制图片地址的
supersu
2016-12-03 02:23:38 +08:00
那啥系统提示有好几个人收藏了,泥萌也表忘记去 gayhub 上 star 哦(^_^)
rockzhou8
2016-12-03 10:13:32 +08:00
厉害!已 star,请问楼主能否帮忙解答一下,用 Python 爬虫的方法能监控 discuz 论坛某个帖子回帖的数目实时刷新不?
supersu
2016-12-03 12:12:22 +08:00
@rockzhou8 哦这个呀,实时的木有试过,我理解的话,就是不去调用 time.sleep()了,回帖数目的刷新数应该是有个 html 元素在页面上的,把 get 请问放在 while 循环里面,一直去读取你想监控的帖子,然后去解析那个数字做判断应该就可以了,不过感觉这样容易被封什么的😆

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/324860

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX