发现一个好用的用于文本图片识别的 prompt,还有一个免费 AI OCR 工具

4 小时 41 分钟前
 ringcrl

在线免费 AI OCR 工具: https://functions-ocr.edgeone.app/

代码是开源的,核心 prompt 在这里: https://github.com/TencentEdgeOne/pages-templates/blob/main/examples/functions-ocr/functions/ocr/index.js

看模型用的是 hunyuan-vision ,换成其他平台的大语言模板效果应该都差不多。

250 次点击
所在节点    程序员
3 条回复
guet
4 小时 38 分钟前
glm?
Visoar
3 小时 16 分钟前
貌似只能 500K 的文件... 可以试试看这个 https://to-markdown.com/tools/ocr
xuelang
3 小时 4 分钟前
hunyuan-vision 现在这种收费不?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1098238

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX