个人需求是搜索相册或图片中的文字,部署官方 immich 使用的 CLIP 模型 XLM-Roberta-Large-Vit-B-16Plus ,搜索结果真就随缘,查看 Issues 有说不支持 ocr 或者效果很差,看到一个 pr 用 PaddleOCR 实现 ocr ,但是被官方关闭了,后画了个饼说是未来会出插件系统,然鹅两年过去了。。
看了提 pr 作者的仓库
https://github.com/jasongwq/immich/tree/feature/ocr ,因个人小白,尝试克隆本地后./
install.sh,失败,docker 目录 docker compose -f docker-compose.dev.yml up -d --build 依旧失败,网络全局科学。
虽然 mtphotos 效果不错,但是习惯 immich 和群晖 photos 界面,再看 mt 界面总感觉别扭,加上免费优先,只能作为最后的选择。
有无大佬指点下,或者有无更好的选择。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/1070421
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.