V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sldaniel
V2EX  ›  问与答

有什么基于 web 的文档管理工具推荐吗

  •  
  •   sldaniel · 2023-10-25 10:42:00 +08:00 · 634 次点击
    这是一个创建于 398 天前的主题,其中的信息可能已经有所发展或是发生改变。
    部署在 NAS 上管理保存的文档,主要是 pdf 、word 、MD 还有 singlefile 生成的 html ,需要全文搜索和预览

    paperless 自带 OCR ,但是不支持 html 文档;

    Devonthink server 基本能满足要求,但是只支持 macos 系统和苹果生态

    nextcloud 没法在 web 上预览 html
    4 条回复    2024-04-29 08:25:42 +08:00
    f1ynnv2
        1
    f1ynnv2  
       212 天前
    搜到这个主题,差点是以为我提的问题

    和楼主一样,我也是用了一段时间 paperless ,这东西最大的问题是不支持 html 文件(恰好我也是用 singlefile 插件生成的)。

    https://github.com/Jarrettluo/all-docs
    这个全文档号称支持所有的文件格式,web 访问,但是开发动态一直比较慢,issue 里甚至说有丢数据的问题,要是能活跃起来快速迭代一下就好了


    我准备试试 Devonthink server
    sldaniel
        2
    sldaniel  
    OP
       212 天前
    @f1ynnv2 Devonthink server 只能跑在 mac 上,所以要多端用浏览器访问,需要有台 mac 一直开着。另外这个 app 的 web 端功能很简陋,和 c 端简直不是一个东西,如果只读的话还能堪用吧。
    sldaniel
        3
    sldaniel  
    OP
       212 天前
    @f1ynnv2 上去看了下 all-docs,demo 有点卡卡的。
    感觉这个项目不是很适合个人,Java + MongoDB + ES ,普通 NAS 吃不消,更适合中小团队。
    f1ynnv2
        4
    f1ynnv2  
       212 天前
    @sldaniel 对,我昨天试用 DEVONthink server 之后也是这个感觉,web 端太弱了。
    其实 paperless-ngx 目前来看除了不支持 html 外,是最合适的,基于 web ,功能比较齐全,还一直在更新。paperlesa-ngx 提供了格式扩展,实在不行就只能提交 pr 自己来实现了 https://docs.paperless-ngx.com/development/#making-custom-parsers
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5495 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 01:25 · PVG 09:25 · LAX 17:25 · JFK 20:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.