V2EX › Suinn 的所有回复 › 第 1 页 / 共 2 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2

❮

❯

1 月 22 日

回复了 chjf2008 创建的主题 › 程序员 › 国家外观设计专利检索公共服务系统图搜还挺准的，他们用的是什么模型来实现的？

@fox0001 感谢，DINOv3 我前段时间也试过了，可能是我的场景类内相似度有点高，所以准确率不是特别好，我再研究研究

1 月 20 日

回复了 chjf2008 创建的主题 › 程序员 › 国家外观设计专利检索公共服务系统图搜还挺准的，他们用的是什么模型来实现的？

@fox0001 大佬求教，最近我也在做这个方向但是效果不是很好，除了 dino 提取特征后进行相似度比较外，还有其他优化的方向吗

2025 年 10 月 28 日

回复了 Suinn 创建的主题 › 问与答 › 最新的 PaddleOCR-VL 模型大家有尝试过吗

@Sh1xin 😂我又仔细看了下评测，PaddleOCR-VL 是 qwen2.5 比的，没和 qwen3 比。我这边目前用的是 30B-A3B 那个

2025 年 9 月 28 日

回复了 Suinn 创建的主题 › Local LLM › 大模型本地部署显存计算的问题

@hmbb 非常感谢，感觉这个比 huggingface 上的强了不止一点

2025 年 9 月 24 日

回复了 phpsarc55 创建的主题 › Go 编程语言 › pdf 转图片

word 转图片有大佬了解过吗

2025 年 9 月 23 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@kuanat 感谢分享，我图像处理和 vlm 学的还行，但确实没从事过真正生产端的 ocr 开发，你提到的需求场景几乎都采用人工复核的方式，我思考的点正是源自于是否能提供另一种模式，仅在服务不提供输出时再进行人工复核，对于输出部分的内容可以百分百信任

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@showonder 其实还是不太一样，说到底 ocr 本质基本是特征提取+分类，但 vlm 是有语义空间的，这种融合的说服力其实比单纯 ocr 的叠加要强上不少

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@retrocode o(*￣▽￣*)ブ感谢分享，这个思路确实很新颖

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@billbob 目前这个方案虽然无限降低了召回率，但几乎也过滤了所有假阳性的情况，现在比较头疼的点确实在于没法论证能达到百分百的准确率，直觉上来说总感觉就是无限逼近 100%😂

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@InkAndBanner 感谢分享，vlm 这块你们有试过 InternVL 或者 glmVL 吗，看最近的分数都挺高但是不知道实际能力和 qwen 比如何

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@gbw1992 一般主要是体现在出现了大量的 False Rejection 吗，其实这个方案只有能保证识别出来的没问题，我觉得就 ok 了

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@paopjian 对，因为主要是账单的数字识别，文本上不会有太多

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@gpt5 是的，主要还是预设业务场景属于要么不识别，要么尽量百分百识别的那种。所以想请各位大佬看看这个方案是否存在大的问题

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@RotkPPP 对，主要就是如果单纯只用 ocr 识别，光看置信度不能保证出来的一定准，这种做法相当于用 VLM 加了一层校验

2025 年 9 月 22 日

回复了 Suinn 创建的主题 › 程序员 › 这样是否可以保证 OCR 识别率接近百分之 100

@8355 主要是有些业务场景，人家的要求是要么不识别，要么就要识别准，所以我才会有了这个方案

2025 年 7 月 21 日

回复了 lzy4223 创建的主题 › 问与答 › 有没一些与大众印象不同的程序员？

@victor ┭┮﹏┭┮收徒弟吗

2025 年 7 月 16 日

回复了 momomoi 创建的主题 › 程序员 › 现阶段最优的语音转文本，文本转语音的方案是不是这两个呀

@chesha1 CosyVoice 3 好像还没开源┭┮﹏┭┮

2025 年 4 月 30 日

回复了 Suinn 创建的主题 › 程序员 › 百万数据下的大模型校验应用

@z1829909 哈哈，目前来看也只能这样了。

2025 年 4 月 29 日

回复了 Suinn 创建的主题 › 程序员 › 百万数据下的大模型校验应用

@NoOneNoBody 目前用的 deepseek ，主要还是担心批量给到模型后会影响输出质量

1 2

❮

❯