请问爬取知乎时如何追踪答案的更新?

2017-09-14 09:27:33 +08:00
 SharkU
  1. 想爬取知乎问题下的所有答案并维护,如果有新答案添加就更新数据库。但是个人动态里面是没有对于你关注问题下某个答案修改的通知的。 所以在经过一段时间后数据库里面一些答案与最新的答案就会有一些差别。
  2. 我想的是每天对已经采集的问题查询是否有新答案,这个比较好解决;然后就是如果有某个答案答主进行了修改,那么总不能用已经采集的和最新的答案进行比对吧。
2490 次点击
所在节点    Python
7 条回复
ZSeptember
2017-09-14 09:34:11 +08:00
定期全部重新爬
ctsed
2017-09-14 09:34:36 +08:00
答案好像有修改记录
fyyz
2017-09-14 09:37:00 +08:00
可以查最新修改时间啊
airqj
2017-09-14 09:49:24 +08:00
最简单的就是混入知乎
取得他们的信任,然后就是要什么有什么了
sky0009
2017-09-14 10:10:43 +08:00
@airqj 你这段话可以精简为四个字:py 交易😀
pynix
2017-09-14 15:09:18 +08:00
对内容做个 hash
SharkU
2017-09-15 19:03:06 +08:00
@ctsed 好像取消了。
@fyyz 忘了这个信息,感谢。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/390565

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX