看到市面上有很多上传基金页面截图,就能自动获取到买了哪些基金,收益率是多少。 想问下大佬们,这是通过 OCR 特定位置识别的嘛? 感觉实现起来很麻烦,有位置问题,字体问题,暗黑模式问题等等
![]() |
1
Daimaogou 4 天前 via Android
上大模型
|
2
x1n04 OP 大模型没有 OCR 便宜吧。主要是个人产品
|
4
Mithril 4 天前
单纯背景下,印刷体的数字识别率很高的。特别是你如果是固定布局,还能用相对位置进一步限定识别内容。
基本的你找 Paddle 就可以了,大模型主要是能提高复杂背景,手写,或者多语言文本方面的识别率。 |
5
fredsunme 4 天前
如果你要从 0 开始 OCR ,考虑看看这个 base64: aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3RtYWNmcmFuay9hcnRpY2xlL2RldGFpbHMvMTM4NDEzMjg0
原文我记得是 10 年前看的 也不确定是不是这个作者了 而且现在都是 python 处理,你可以搜对应的 python 版本的,思路应该还是 opencv 做高斯模糊灰度二值膨胀分割那一套 |
![]() |
6
lower 4 天前
zhipu 的有个视觉模型 4v-flash 是免费的,白嫖吧
|
7
datocp 4 天前 via Android
之前看人家用 excel 做了一个 vba 抓取东方财富页面。后来不知道作者更新了什么,就出现了内存溢出问题。。。
东方财富就是纯静态页面,用网页抓取软件应该很容易采集自己需要的数据。 |
![]() |
9
Solace202 3 天前
碰巧公司有个业务碰到过类似场景,解决办法是分两步走:
1. OCR 提取所有文字 2. 将所有文字和你的要求组成 promot 喂给 gpt 或者 claude ,获得结果。 |