写了一个人人网信息备份工具,敬请指教

2018-08-20 11:35:12 +08:00
 whusnoopy

前阵子人人网又冒了个热点,在热点事件前就考虑是不是把自己的人人信息备份下来。找了一圈,之前的各个备份工具在 2017 年人人登录机制改变后就都不能用了。参考前辈们的经验,写了这么一个工具:

https://github.com/whusnoopy/renrenBackup

目前可以

  1. 邮箱密码登录
  2. 抓取自己的 状态、留言板、相册、日志 及对应的评论和点赞信息
  3. 抓取指定用户,被当前登录用户可见的上述内容
  4. 用 Flask 展示抓取的信息

  1. 头像、照片都抓到本地了,但是可能有因为人人的原因导致原图不存在的情况
  2. 原文评论和点赞评论都抓了,但有遗漏多半是人人自己的锅,登录到官方网页版都看不到
  3. 点赞数是对的,但只能显示最近 8 个点赞的人,也是人人接口的锅,官方网页版也只显示 8 个人

还打算做的工作

  1. 纯静态输出(即脱离 Flask 查看,方便抓取后导给没有 Python 环境的其他人看)
  2. 对抓挂了的图的补救抓取(对应上面注 1 )
  3. RESTful + Vue.js 纯动态输出(自我学习玩)
5887 次点击
所在节点    Python
30 条回复
yanyuechuixue
2018-08-20 12:02:25 +08:00
赞一下~ 这是有用的东西, 比什么知乎爬虫高到不知道哪里去了~
xream
2018-08-20 13:16:16 +08:00
感谢 已备份
RYAN0UP
2018-08-20 13:20:18 +08:00
不错不错
ys0290
2018-08-20 13:24:44 +08:00
活在我的记忆中
matrix1010
2018-08-20 13:35:40 +08:00
我以前按最近来访爬,爬了大概几万人
4u1kto
2018-08-20 13:57:56 +08:00
谢谢提醒,已停用
sniper1211
2018-08-20 15:31:41 +08:00
vjnjc
2018-08-20 16:14:08 +08:00
看起来不错,多谢分享
luanluan
2018-08-20 16:19:15 +08:00
不错,我把它改一下
muyi
2018-08-20 16:20:24 +08:00
非常实用,已备份,送上感谢~
wocanmei
2018-08-20 21:22:58 +08:00
人人网好久不用了
mingyun
2018-08-20 23:03:58 +08:00
进入主页就是一个妹子直播,还开着声音 现在人人网都这样了。。。
lemonda
2018-08-20 23:36:59 +08:00
有人人的时候交往女生真是很容易啊
whusnoopy
2018-11-14 18:09:05 +08:00
今天看到新闻,人人网的社交资产已经被陈一舟卖掉了,真庆幸自己先留了个后手
neoprc
2018-11-15 11:36:29 +08:00
File "fetch.py", line 5, in <module>
from playhouse.shortcuts import model_to_dict
ImportError: No module named playhouse.shortcuts
whusnoopy
2018-11-15 12:24:47 +08:00
@neoprc 环境都装好了么?这个应该是 sqlite 库里的
crazybaikal
2018-11-17 07:52:55 +08:00
非常实用,感谢楼主!
hackpro
2019-05-01 18:19:00 +08:00
感谢大佬 非常棒的工具 已 Star

提两点意见:
1、浏览器中显示时支持左右方向键自动切换图片,这个比一个个点按钮体验要好很多
2、当前显示大图的时候似乎是按照 Actual Size 模式显示的,能否做成 Fit 模式显示,这样不用滚轮上下滚了。用户查看原图的话可以考虑双击或者放大镜工具。

再次感谢🙏
whusnoopy
2019-05-01 19:08:22 +08:00
@hackpro 麻烦直接在 GitHub 项目下提 issue 吧,issue 不仅仅是问题,也可以是建议,这样有助于统一管理,如果有其他人能做,也可以看到 issue 后提 Pull Request (或者你有空的话也可以把这两个功能做掉发个 PR 来)
whusnoopy
2019-05-16 15:32:24 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/481371

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX