请问有什么好的个人资料库存储思路吗?

2022-05-13 20:14:32 +08:00
 harsonyoung

平时上网查资料时,发现一些写得特别好的个人博客文章会记录一下 URL ,但过一段时间想去回顾这篇文章,仅靠 URL 不太方便查找,有时好不容易找到这篇文章,但博客直接打不开了。 于是想着搭建个人资料库,整理出以下几个需求:

  1. 能方便的自由复制文章中的代码文字等。
  2. 样式特效等不要求保持原网页一致,只要求方便阅读即可。
  3. 能实现全文关键字搜索。
  4. 存储流程尽量做到自动化。

我目前的方案是一个网页保存一份 mhtml 和一份 html 。搜索文章时在 html 中搜索关键字,找到后打开对应的 mhtml 。这种方案数据量较少时还比较方便,现在收藏网页数越来越多了,这样用起来实在不方便。找了一圈没发现有合适的轮子,想着手开发一套资料库,但一直想不到有什么好的方案。

之前尝试过保存 html ,然后写脚本将 JS 、CSS 等外部引用内嵌。但效果不是很好,如果只针对某一种主题的网站,那没问题,但是不同网站前端得写不同的脚本,请教一下大家的个人资料库是如何存储的呢?

2702 次点击
所在节点    问与答
21 条回复
liuzhaowei55
2022-05-13 20:23:34 +08:00
onenote
ltkun
2022-05-13 20:25:15 +08:00
很多吧 随便举几个例子 公有服务有各种笔记 私有的我用 joplin 和 wallabag 都是浏览器插件点一下就保存了
mimzy
2022-05-13 20:25:29 +08:00
cubox
renmu123
2022-05-13 20:25:36 +08:00
全文复制到笔记软件,想自动化找个剪藏插件
monphey
2022-05-13 20:46:19 +08:00
obsidian 配合 chrome 的 markdown 剪藏插件
nuistzhou
2022-05-13 21:31:27 +08:00
onenote
SenLief
2022-05-13 21:35:12 +08:00
简悦可以保存到 notion
beyondex
2022-05-13 21:41:30 +08:00
我也剪藏了很多 但是 极少去看 后来养成一个习惯 就是真的很有用的 会写笔记记下来 其它 就再找一遍吧。
可能 90% 的情况是这样。
xQmQ
2022-05-13 23:08:38 +08:00
obsidian + 浏览器简悦插件,提供导入页面到 obsidian 的功能
sunlei
2022-05-13 23:10:55 +08:00
SingleFile + DEVONthink
Pogbag
2022-05-14 00:19:51 +08:00
cubox
lishuolin
2022-05-14 00:42:43 +08:00
DS NOTE 。前提是买一个 NAS
ZC3746
2022-05-14 01:03:43 +08:00
我的做法:
1 、在浏览器上阅读,一股脑剪辑到印象笔记里
2 、随时阅读,定期删除
3 、汇总这些文章的思想、写成一篇文章,践行。这样才是真正吃透了这些文章。
i3x
2022-05-14 09:13:07 +08:00
保存 mht 或者 html 很多站点其实是无效的。
我是页面截图+全文存数据库。。

我写了个火狐插件。点击插件图标。弹出输入框询问输入补充说明,可以不填。
然后插件就自动全屏截图。把所有的 css js html xhr 的文本拼接在一起。就不怕有文字搜不到了。是不是:真·全文搜索。
服务端是 php+mysql 。图片编码后直接存入数据库。
另外会自动保存页面上浏览器能直接“下载”的视频和 gif 。这两玩意儿是普通截图克星。

对于功能类网页没办法。
ZC3746
2022-05-14 13:13:55 +08:00
@i3x 牛逼。
haah
2022-05-14 21:27:23 +08:00
全屏截图
shuxhan
2022-05-14 21:48:17 +08:00
碰到有用的文章的话,我都是花上一到两分钟复制到自己的笔记本中,以后用到的时候直接用关键词搜索即可
其实你这个问题可以引申为搜索功能和剪藏功能比较强大的笔记软件
efcndi
2022-05-15 00:16:12 +08:00
@i3x #14 好奇,想了解下,你说的截图是真的截成了图片格式保存吗?这玩意怎么会方便搜索文字呢,ocr 的话效率是非常低的啊。
i3x
2022-05-15 03:35:07 +08:00
@efcndi 我说的还不清楚么?图片用于阅读。原始版本 html css js 所有的文本拼合成一个字段用于全文搜索。虽然效率很差,但是毕竟只有自己一个人在用,慢一点也无所谓。sqlite 或者 access 都能吃得消。单关键词搜索就是秒出结果,除非模糊之类的
Danswerme
2022-05-15 09:37:28 +08:00
我一般是直接生成 pdf 保存起来

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/852701

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX