爬取 Twitter 和 Facebook 的数据有哪些方案

2021-09-07 22:00:56 +08:00
 TouwaErioer

前提是不用官方 API (因为申请的话也大概率不会通过,还有就是官方 API 提供的数据不满足需求)

目前方案有:

注:不满住数据需求大多是指获取不到评论

2400 次点击
所在节点    问与答
4 条回复
sunorg
2021-09-07 22:12:26 +08:00
chrome headless
hs0000t
2021-09-08 02:25:17 +08:00
看要爬什么数量级的数据,方案不一样
最少的话手动复制粘贴
多一点用按键精灵之类的录个脚本
再多一点无头浏览器
更多一点无头浏览器+IP 池+cookie 池
走 js 反编译路线费时费力,且 js 更新速度很快,爬虫特征明显,算是最后的解决方案。当维护高性能爬虫服务器集群的成本大于组程序员团队破解 js 的人力成本和时间成本时再说,加机器就能解决的话没必要加人来解决,当然了如果是为了学习当我没说
xiao109
2021-09-08 08:47:17 +08:00
推特不是找 api 就可以了吗?
Facebook 没爬过不评论
dearmymy
2021-09-08 09:18:38 +08:00
技术菜的走网页,就是麻烦加成本高。服务器成本,ip 成本, 速度也慢。团队有逆向高手还是建议去逆向手机端接口,逆向 ios 端,毕竟黑科技反调试少。厉害点脱机获得加密算法,实在不行,手机做个服务器单独去调用加密函数给 pc 去发送就好。成本低速度快。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/800498

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX