有什么办法可以比较完整的把一个网页内容保存下来?

2021-05-06 23:22:45 +08:00
 overthemoon

经常看到一些比较好的博文,懒得自己写,又怕博文被删帖,怎样才能保存一个完整的把 html 页面保存下来呢?包括那些样式

3287 次点击
所在节点    互联网
27 条回复
ClericPy
2021-05-06 23:29:56 +08:00
chrome 可以保存 mhtml, 直接另存(ctrl S) 就行了

现在我批量缓存大量网页就用的 mhtml, 会把 css js 图片什么的都打包成 base64, 格式看起来像 Email 那套, 因为这里的 m 代表的不是可移动的, 而是 媒体类型(通常称为 Multipurpose Internet Mail Extensions 或 MIME 类型 )
catcn
2021-05-06 23:33:58 +08:00
全屏截图插件
geipen
2021-05-06 23:36:22 +08:00
@ClericPy mac 电脑用的谷歌浏览器下载,没有 mhtml 选项呀,只有 html
lostberryzz
2021-05-06 23:38:22 +08:00
竟然没有人提到 https://web.archive.org/ 互联网真正的宝藏所在地
imdong
2021-05-06 23:40:39 +08:00
打印为 pdf ?
Jirajine
2021-05-06 23:41:30 +08:00
Helsing
2021-05-06 23:44:37 +08:00
Web Clipper 剪藏
SuperMild
2021-05-06 23:44:49 +08:00
1. 可以截长图
2. 可以导出 PDF
3. (推荐!) 使用浏览器插件 SingleFile
ClericPy
2021-05-06 23:45:02 +08:00
@geipen 早年间我用的 https://chrome.google.com/webstore/detail/save-page-we/dhhpefjklgkmgeafimnjhojgjamoafof 插件去保存, 比自带的 mhtml 保存貌似省心一点. 后来是自己撸轮子走 CDP 了...

所以还真不记得怎么开启默认的保存选项(老版本我印象中手动从 flags 里打开的 Save Page as MHTML, 但是新版本没这东西了), 现在我浏览器保存时候选格式里就有...
wangsongyan
2021-05-06 23:46:09 +08:00
有道云笔记收藏网页,反正收藏了也不看🐶
crab
2021-05-06 23:57:48 +08:00
@geipen 保存类型有 mhtml 的,只是文件名显示的后缀是 html,要手动改下。
sephinh
2021-05-07 00:22:52 +08:00
直接打印保存 pdf
leishi1313
2021-05-07 03:37:30 +08:00
自建个 wallabag
delectate
2021-05-07 06:22:48 +08:00
webscrapbook
或者
scrapbee
Mutoo
2021-05-07 07:13:17 +08:00
早年间收藏整理了很多文章,时间久了全躺尸在老硬盘备份里了。现在也根本没有动力去翻看。
christin
2021-05-07 07:30:27 +08:00
Safari 可以选择保存为网页归档 保存出来的还挺不错
hafuhafu
2021-05-07 08:15:44 +08:00
ispinfx
2021-05-07 08:34:00 +08:00
archivebox
beijiaoff
2021-05-07 09:07:54 +08:00
@lostberryzz 这个网站收录是什么标准呀?感觉很随机
Greenm
2021-05-07 09:30:30 +08:00
有好几种方式:

1. 在线网站:web.archive.org, archive.is

2. 浏览器手工保存, 可以截图,可以 pdf,可以 singlefile 扩展,各有各的优缺点。

3. 用工具保存,httrack --list urls.txt 可以把一堆 url 都保存下来,包括多个目录和路径; 包岩村单个 url 的话,wget 其实也能做到。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/775307

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX