### **背景**:
最近几天回复列表总是见到有人回复 "mark" / "战略性 mark"。在我看来,这样既没有践行 "让回复对别人有帮助",也扰乱别人看帖,毕竟有收藏可用。
### **我想**:
我想写一个爬虫,把内容简单的 "mark"er 挑选出来,人工查看回复历史决定是否要 Block 这个用户
### **想问**:
- 对 V2EX 的服务器压力不大吧?
我将不带有 cookie 爬取,因为我这个爬虫门外汉觉得带了 cookie 会让降低 CDN 的作用,使后台运算量增大
-
### **爬虫机制简述**:
最早处理 20181101 的帖子:
每帖在发布( 5 日,30 日,180 日)后进行一次回溯:
对每一层回复来说:
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.