微信的文字识别

2023-06-15 16:34:38 +08:00
 shyrock

不知道大家有没有感受,微信的文字识别准确率比市面上收费的各种 OCR 软件都高。 比苹果、华为手机自带的识别准确率也高不少。

这说明腾讯的识别算法独树一帜吗?

我怀疑是腾讯利用了微信用户上传的原始文本,比如原始文本是微信里的一段对话(这时不是图片,而是文字编码),截图分享后变成图片。但是微信知道这个图片跟文字的对应关系,所以可以非常准确的从图片还原出文字。

或者,根据分享的热度和用户相关性。找到相关性最高的文字内容作为 OCR 的矫正依据。

有人知道答案吗?

684 次点击
所在节点    程序员
6 条回复
AoEiuV020JP
2023-06-15 16:42:46 +08:00
有没有对照实验,
我没用微信的识别但经常用 qq 的,没感觉有比较强,
shyrock
2023-06-15 16:45:07 +08:00
@AoEiuV020JP 对照微信跟苹果、华为吗?有啊。几个月前一次群里分享的桃色八卦新闻,是很模糊的截图,苹果华为错误率大概在 20%,而微信感觉只有 3%。具体截图懒得找了。
shyrock
2023-06-15 16:48:56 +08:00
找到了,这个图片 https://imgur.com/N7Eu1a5
wangxiaobo775
2023-06-15 17:12:27 +08:00
微信 OCR ,我主观感觉识别率确实比其他厂商的高一些。具体技术细节就不是很了解了。
hatw
2023-06-15 17:25:06 +08:00
瞎说:估计微信后台用用户发的文字图片(例如新闻啥的公开页面截图)训练了好久的 AI 了。。。
shyrock
2023-06-15 17:50:02 +08:00
@wangxiaobo775 重点是,如果微信是 OCR 算法比其他长都牛逼,完全可以出独立的 OCR 产品大杀四方。

现实没有这样干,是不是说明微信的 OCR 其实没法脱离微信分享内容这个场景。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949024

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX