Python 实现 archive.org 类似快照的功能,有什么好的思路?

2016-08-17 03:12:21 +08:00
 cszhiyue

还需要注意些什么?

1131 次点击
所在节点    问与答
3 条回复
imcocc
2016-08-17 12:57:44 +08:00
页面渲染不需要的。
复杂点的, js 里包含网页地址就需要解析 js 了。

简单点的,类似离线浏览的功能,把所有需要的 htmljs 等网页文件抓好,换个路径供人访问。

你可以试试离线浏览器感受一下,学学思路( Offline Explorer )。
cszhiyue
2016-08-17 19:06:00 +08:00
@imcocc 这样的话暂时只需要把 js css img 抓取。然后更换路径了。
imcocc
2016-08-17 21:16:57 +08:00
@cszhiyue 对的,这就是扒站

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/299784

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX