有没有什么 Chrome 插件能够自动保存浏览的网页

2021-05-07 20:02:22 +08:00
 Ayahuasec
已经好几次遇到这种情况,就是自己记得以前看到过的一个内容,还记得几个关键字,但是网页没有收藏,想重新详细看的时候怎么搜都搜不到看过的那个页面了,翻历史记录也非常麻烦,太老的历史记录也可能搜索不到。
之前用过一个叫 Save Page WE 的插件,可以把当前浏览的网页保存成单个 html 文件,而且包含了样式、图片等信息,可以非常方便地在本地回看,文本数据也可以直接用 grep 进行搜索。
但是这个插件需要每次手动将网页保存下来,如果有一个类似功能的插件,能够每打开一个网页后自动保存网页到一个指定路径就好了。所以想问问大家有没有类似这样功能的插件,求推荐
3715 次点击
所在节点    Chrome
16 条回复
zictos
2021-05-07 20:40:10 +08:00
试过很多插件都不好用,很多明明看过的网页也搜不到,估计都是只有访问网页的一瞬间保存了。现在很多网页都包含大量 js 代码,浏览网页的中途都会加载很多新内容。
ClericPy
2021-05-07 21:46:33 +08:00
如果是 PM 提这种需求, 我估计整七八行代码监听一下 Page.loadEventFired 事件然后 Page.captureSnapshot 保存成 mhtml.

如果是陌生人提这种需求, 我会说这是伪需求...
delectate
2021-05-07 21:46:46 +08:00
webscrapbook
scrapbee
infun
2021-05-07 21:52:38 +08:00
各种笔记软件的插件 比如为知笔记
3dwelcome
2021-05-07 23:45:00 +08:00
@ClericPy 惊了,都不知道 Chrome DevTools Protocol 还有这功能,马上去试试。
Ayahuasec
2021-05-07 23:45:16 +08:00
@infun 看了一下为知笔记,好像还是需要手动点击一下才能抓取网页内容。我是想有没有那种随看随存的功能,类似音乐软件那样边听边存,便于后续构建本地的浏览记录和浏览内容,文件平常可以保存在 NAS 上,然后需要找东西的时候可以用 grep 随时读取。
@zictos 测试了一下,Save Page WE 插件可以保存 js 加载的内容,但是不能保存网页的 js 本身。不过能存下内容就已经足够了。
@ClericPy 看到你的思路,感觉好像不太复杂,有空我也学下怎么做 Chrome 插件然后写一个这个功能好了。不过发现 mhtml 虽然也可以保存网页里的样式和图片等内容,和 Save Page WE 插件保存的效果基本差不多,但是文本被重新编码了,检索的时候还得加一些额外的步骤才行
ClericPy
2021-05-07 23:52:20 +08:00
@Ayahuasec 插件就复杂了... 不知道油猴里有没有这接口


@3dwelcome 实验功能啊, 之前截取流量被实验功能坑过, 几十行代码重新用 Fetch 接口撸了一遍, 不堪回首
cmdOptionKana
2021-05-07 23:57:51 +08:00
看到楼主说 “……但是网页没有收藏……”

但不管安装了什么插件,都需要点击一下才能帮你保存,如果你忘记点击,结果还是和现在一样,什么都没有保存。
3dwelcome
2021-05-08 01:05:13 +08:00
@cmdOptionKana

chrome 设置里有快捷键,可以绑定插件的功能。
只要在内部插件里写个定时器,把消息通过 websocket 发送到浏览器外部插件,再反过来触发 chrome 的绑定快捷键即可。
3dwelcome
2021-05-08 01:11:17 +08:00
@ClericPy 刚试了一下 Page.captureSnapshot,比我想象中的还要强。

保存文件标题写着 Saved by Blink,能自动分离 CSS 文件,能自动离线各种图片资源,能支持各种动态 JS 添加的 DOM 。

算是目前比较完美的,自动化保存单文件网页的方案了。
ClericPy
2021-05-08 20:20:07 +08:00
@3dwelcome
mhtml 之前丢到轮子里了至今没用过, 有一点不太确定就是惰性加载那种的图片一般在 data-original 里面的, 不知道会不会加载并且缓存成 base64, 如果不行, 那我就得魔鬼 scroll 一把了
DiamondYuan
2021-05-08 23:15:08 +08:00
试试看 SingleFile
mgrddsj
2021-05-18 16:12:03 +08:00
不好意思挖个坟,今天我又用到了平时有时会用到的保存网页的拓展 SingleFileZ (是 #12 提到的 SingleFile 的一个改进 fork ),发现它有 auto-save 功能( SingleFile 也有),可以在网页完全加载之后把整个网页保存下来(含样式、图片等)。

GitHub 仓库地址: https://github.com/gildas-lormeau/SingleFileZ
拓展商店:
Firefox: https://addons.mozilla.org/firefox/addon/singlefilez
Chrome: https://chrome.google.com/webstore/detail/singlefilez/offkdfbbigofcgdokjemgjpdockaafjg
Microsoft Edge: https://microsoftedge.microsoft.com/addons/detail/singlefilez/gofneaifncimeglaecpnanbnmnpfjekk
cocong
2021-08-10 20:37:25 +08:00
可以试试我自己开发的这个扩展 SaveTabs - 窗口标签管理器。
无论是 UI 还是 功能,在 Chrome 商店里都是绝无仅有、独一无二的,绝对惊喜。
以下是其最核心的功能:
1. 支持一键保存和打开所有网页,提高工作和学习效率
2. 支持书签、历史和标签页等的聚合搜索,避免多处查找
3. 可以根据自己的喜好调整插件的行为和样式,喜欢 DIY 的朋友可以尽情发挥
marc2017
2021-08-16 12:00:34 +08:00
mac 下有款软件 HistoryHound,chrome 插件 worldbrain,都可以实现浏览历史全文搜索。我只用过后者。
fucku
2021-08-28 11:40:10 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/775499

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX