迫于世界变化太快, 有哪些好的保存和整理分类网页内容的方案?

2021-02-28 15:44:09 +08:00
 Al0rid4l

最近整理浏览器收藏夹, 发现很多以前收藏的技术 /人文社科的文章消失了, 或是随着个人博客的关闭而消失, 或是随着平台倒闭而消失, 或是其他众所周知的原因. 偶尔想看的时候发现没有了亦觉得很是可惜.

其实从很早开始个人就不再信任他人的服务器, 尤其是在自己没有为其付费只是简单地点击一下收藏, 就指望他人能够很好地保存自己想要的信息, 是不切实际的. 获取并保存有价值的信息, 终究是有代价的, 或是金钱, 或是自己的时间. 也因此养成了对于自己觉得有价值的信息, 随手保存一份的习惯.

最开始的方案很简单也很笨(可能现在也依然如此), 就是浏览器保存网页, 并用文件夹分类, 好处是最大程度保留了所有信息, 比如内容中的链接, 也方便需要的时候进行复制. 但是缺点也很多, 硬盘上大量小文件, 一个页面一个目录, 搜索起来也麻烦, 并且有些 js, css 等资源无法加载导致排版错乱.

目前的方案是导出 PDF, 也能比较好地保留内容中的链接, 也比较方便复制文字, 并且没有太多小文件. 缺点是排版也可能有小幅错乱, 不过总体可以接受. 另外就是也不太方便搜索文本.

对于不带链接的内容, 偶尔也会直接网页截图, 占用空间比较小, 但是无法复制搜索里面内容了.

关于为什么不用 XX 笔记之类的方案, 如前所述不够信任, 另一方面有些是私有格式万一以后需要迁移也会比较麻烦.

扯这么多, 主要是两个问题

  1. 有没有更好的保存网页内容的方案?
  2. 另外就是如何整理分类这些保存下来的内容了, 目前只能通过目录的形式分类, 但是这是树状的, 个人更希望是基于 Tag 的方式进行分类
3089 次点击
所在节点    问与答
20 条回复
EasonC
2021-02-28 15:54:28 +08:00
Pocket 是 Premium 自动存永久,网站挂了也在,但是如果付费中断 30 天会删除掉之前保存的。

pinboard.in 的 pro 账号提供永久保存,老牌子了

印象笔记直接网页剪辑到笔记里

苹果用 Devonthink 也能永久,付费世界可及

Diigo 也能永久保存,也是付费,去官网看看,不展开说了

chrome 插件 SingleFile 下载离线本地化
xunco
2021-02-28 16:01:43 +08:00
换了很多,最后付费 raindrop.io 了,全平台,搜索能力强大,支持标签和子目录
xarthur
2021-02-28 16:17:18 +08:00
我推荐 WebRecoder,支持动态网页甚至是纯 JS 的网站,而且现在支持上传到 IPFS 上。
https://webrecorder.net/
演示视频。
<amp-youtube data-videoid="evcSETnTBf0" layout="responsive" width="480" height="270"></amp-youtube>
AndyAO
2021-02-28 16:21:05 +08:00
如果只是保存文章到本地,那么强烈推荐 MaoXian web clipper,支持 HTML 和 MarkDown,HTML 可以用 Word 直接打开,而 MarkDown 被支持更加广泛,例如可以直接用 Obsidian 打开做笔记,直接相互引用。
Al0rid4l
2021-02-28 16:24:56 +08:00
@EasonC
「关于为什么不用 XX 笔记之类的方案, 如前所述不够信任, 另一方面有些是私有格式万一以后需要迁移也会比较麻烦.」
以及见 append
其他几个方案我去了解下
ronman
2021-02-28 16:28:02 +08:00
说一个不算好的办法,就是把你觉得有价值的文章 /内容自己做总结整理,然后保存到本地 /发布到自己博客站。
essethon
2021-02-28 16:35:58 +08:00
看到这贴之后试了一下 Command + S 直接保存,Safari 的 .webarchive 格式,然后断网打开,效果看上去蛮好的
Kyon945
2021-02-28 18:44:30 +08:00
网页剪藏靠的是:SingleFile 或者 简悦(浏览器扩展)完美保留原网页格式,存为离线 html (移动端也可以完美查看)

网页做笔记:网页剪贴簿(浏览器扩展)
mythabc
2021-02-28 18:49:45 +08:00
为知笔记 docker 版+剪藏授权服务。
数据离线在自己的机子上,搜索和整理也方便。
superrichman
2021-02-28 19:01:53 +08:00
自建 wallabag,可以设置 tag,也可以搜索。
iConnect
2021-02-28 19:04:58 +08:00
虽然也经常收藏剪藏,后来发现几乎没有复用用过。需要的找类似资料的时候,还是直接搜索引擎😄
ponycoding3
2021-02-28 19:12:20 +08:00
chrome 可以将网页保存成单文件的, 效果还行, 然后用 md 文件对已经保存的网页进行汇总整理, 用链接跳转.
SJ2050cn
2021-02-28 21:07:49 +08:00
可以试试插件 print friendly,edge 和 chrome 商店都有,导出 pdf 的格式挺好的,至于搜索那就用最原始的,根据用途建立文件夹,后面直接搜文件名就行,文件搜索的工具就很多了。
bug403
2021-02-28 21:36:20 +08:00
网页剪辑我用 OneNote
loading
2021-02-28 21:47:05 +08:00
稍后阅=永不阅
crab
2021-02-28 21:49:21 +08:00
直接另存为 mhtml 格式
mmdsun
2021-03-01 00:14:04 +08:00
OneNote 可以把网页存笔记
yeqizhang
2021-03-01 00:39:41 +08:00
我尽量保存成普通文本,然后是 word html markdown,html 是用 singlefile 保存的,除非之后浏览器不兼容查看这些保存的文件了,就看不了了。
wy7305e
2021-03-01 08:05:51 +08:00
浏览器扩展 SingleFile
caixiaomao
2021-03-01 08:21:21 +08:00
暂时用印象笔记的剪藏

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/756967

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX