一个 twitter 帖子抓取工具,用来解决特殊的 kol 抓取需求

1 天前
 notot

[需求背景] 领导给你一批 kol twitter 用户,需要定时抓取这些 kol 的 twitter 情况,你会怎么实现

[实现方案] 用一个新的账号(注意,需要用新的,不能用自己经常使用的账号),用这个新的账号批量关注上面的 kol 信息。 关注了这些 kol 之后,每次就只需要请求当前账号关注列表的帖子就可以了,相比于如果需要去请求每个 kol 的最新信息,大大降低的封号风险

[项目] https://github.com/xiaoxiunique/x-kit 地址

我将核心逻辑提取了出来。

如果你有更加高效的抓取方案,欢迎分享

631 次点击
所在节点    分享创造
4 条回复
lckof
1 天前
优雅,高级。已 star 。

PS:为什么要增加一个`GET_ID_X_TOKEN`呢?
notot
1 天前
GET_ID_X_TOKEN

这个是那种受限制的 twitter 账号的 token ,没办法关注,但是可以请求部分 twitter 的 api ,比如拿到 twitter 用户的 id ,分散一部分请求
notot
1 天前
@lckof
GET_ID_X_TOKEN

这个是那种受限制的 twitter 账号的 token ,没办法关注,但是可以请求部分 twitter 的 api ,比如拿到 twitter 用户的 id ,分散一部分请求. 降低主要账号被封的频率,根据我现在目前的测试结果,现在线上跑的账号(新账号) 已经 10 多天正常抓取数据了,还不错
notot
4 小时 29 分钟前
顶一顶

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1098170

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX