V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  lijinma  ›  全部回复第 6 页 / 共 59 页
回复总数  1176
1 ... 2  3  4  5  6  7  8  9  10  11 ... 59  
@hastelloy 当然可以,就是要批量的。
@uglyer
@AlwaysBee

我只抓列表抓过几十万的数据,但是阅读数和点赞数没有这么抓过。。。
2017-04-06 18:40:10 +08:00
回复了 linpeng123l 创建的主题 问与答 应届生 offer 选择,求指教
大厂是不错,但我建议做你喜欢的。。
@AlwaysBee 嗯哪, web 版本的微信文章,随便爬,没什么限制。
@AlwaysBee 是的,如果只是抓文章内容,只需要拿到文章 url ,然后自己爬就行了,但是我的媒体朋友需要点赞数,阅读数,赞赏数等。。。就没办法,只能代理客户端。
@AlwaysBee 哈哈, node 有方便的 anyproxy ,确实很舒服。谢谢你的工具,我做的 xiaolai.co 可能和你是类似的原理吧,我用 Guzzle 爬的。
@MrFireAwayH 你给的这个有问题的公众号奇怪了。。我等等有时间给你解决哈
@laoertongzhi 客气,求个 Star..
@MrFireAwayH 噢噢噢噢,明白了。 你换一个目录:

1. 跑列表的时候会生成一个 wechat.sqlite ,然后跑单个文章的是,从 wechat.sqlite 中拿那些没跑过的文章。

所以你换一个目录,就会在这个目录建立一个新的数据库。

我说明白了吗?
@MrFireAwayH 哈哈哈哈, mac 上 control + c 就能退出了吧。。。

Windows 你看看,不行就找这个进程,杀掉。。
@sundyli 太感谢你了,谢谢你的代码 + 你的文档。
@MrFireAwayH 说清楚了,看你的报错,应该是缺少 Windows SDK version 8.1

你试一下安装:

https://developer.microsoft.com/en-us/windows/downloads/windows-8-1-sdk
@yangxiongguo 不客气
千万要买两套,分开住。
@MrFireAwayH 啊啊啊啊啊啊,你可以给我提个 issue 吗?把详细情况写一写,我想办法解决一下,虽然我用 Mac
@falseen 可以的,但是我这个工具是没这么做的,我另外一个工具是这么做的,先采集好所有的公众号的 biz 参数,然后开始抓取,抓取完一个跳到另外一个账号的历史记录。

但是我这个工具就是想弄的简单点,大家直接可以完,然后看我的代码自己改改就可以随便抓了。

谢谢你的回复。
如果搞两张图片就更好了。哈哈
Summer 高产像母猪!!!
@falseen 恩恩,你说的是搜狗微信抓文章的,主要搜狗微信历史记录不全,而且 web 抓 不到点赞数和阅读数。才迫不得已使用代理的方式。
@fhefh 客气~
1 ... 2  3  4  5  6  7  8  9  10  11 ... 59  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5456 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 08:33 · PVG 16:33 · LAX 00:33 · JFK 03:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.