有什么好的办法可以管理 mhtml 文件

2022-10-06 00:35:07 +08:00
 patx

因为网上很多文章容易莫名其妙消失,所以渐渐养成了先存后看的习惯。目前是用浏览器插件保存页面到笔记软件,比如 trilium 、joplin 。会有很多问题,比如:

比较满意的方法是把文章保存为 mhtml ,手机上保存 mhtml 也很方便,用浏览器就可以一键保存。但是这样有个问题,就是有密密麻麻一堆文件,不好统一管理、关键词检索和浏览。

所以就想问下各位,你们是如何处理这种情况的?有没有管理 mhtml 文件的好办法?

1865 次点击
所在节点    问与答
12 条回复
leonzym99
2022-10-06 08:53:58 +08:00
关于文章剪藏,你可以试试 cubox ,我付费用了快一年,体验挺好,公众号啥的也都能存
hing
2022-10-06 08:54:15 +08:00
为什么不保存为 PDF 文件?
patx
2022-10-06 08:59:32 +08:00
@hing 假如页面有代码块(比较常见于论坛帖子),又有横向的滚动条,另存为 pdf 后,只会保存可见的部分。
shinsekai
2022-10-06 09:00:57 +08:00
保存到 archive.org 不好吗,保存后直接将 archive 网址添加到收藏夹。
patx
2022-10-06 09:11:59 +08:00
@fansvista 这种只能保存公开的页面吧,对于只能登录查看的帖子,行不通
Rache1
2022-10-06 09:28:13 +08:00
emberzhang
2022-10-06 09:34:41 +08:00
mhtml 怎么感觉是 20 年前用的了,现在不都 webarchive 或者 textbundle 么,devonthink 统一管理就行了,但要标注 /高亮 /引用什么的最终还得 pdf
patx
2022-10-06 09:57:47 +08:00
@emberzhang 主要是保存方便,PC/安卓上不需要额外安装软件 /插件,手机上基本都是一键保存。苹果的设备没怎么用过。
0o0O0o0O0o
2022-10-06 10:01:47 +08:00
手动:SingleFile 、Joplin Web Clipper ;
自动:ArchiveBox 以及一些其余的 archiving 程序,复杂页面用到 puppeteer 等工具来配合 JS 操作 headless chrome (感兴趣也可以看看 ArchiveBox issues #51 );
存储:个人通过 Joplin 存放和检索,互联网通过 archive org 。
patx
2022-10-06 11:15:22 +08:00
试了一下楼上的 SingleFile ,再加上: https://github.com/nil0x42/singlefile2trilium

有点麻烦,但是效果还行,后面再用一段时间看有什么问题。
v2tudnew
2022-10-06 12:08:09 +08:00
@Rache1 这个能关闭页面右键选项功能吗?
Rache1
2022-10-06 12:39:56 +08:00
@v2tudnew 可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/884827

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX