求倾斜汉字 ocr 识别方案

单个汉字左或右倾斜无法识别或错误识别，列出用过的方案：
1. 阿里云腾讯云百度云 API 接口方式 OCR
2. Tesseract-OCR 原生或自训练数据集
3. 百度 paddlepaddle PP-OCRv4
4. python dataset 自训练数据集
--
以上方案汉字右倾斜识别成功率较高，左倾斜识别较差。
自训练数据集：通过将单一汉字图片旋转不同角度打标签方式训练，本身汉字图片较小，也许是这个原因无法训练出正确的数据集。
--
目前方案：
灰度二值化后将图片顺逆向分别+－ 2 度旋转 20 次，得到生成后的 40 张图片，手搓 Hough 直线检测算法，筛选出投票得分最多的图片，最后通过 paddlepaddle PP-OCRv4 进行识别，成功率 70%，4h8g 耗时 4-6 秒。
--
求助大神：
目前是否有专门针对倾斜汉字 OCR 的场景模型，通过打标签训练数据集的也行。

rming

141 天前

直接用公开数据集在训练中做数据增强，在 ppocrv4 基础上做迁移学习就行，自己标注意义不大，除非是字典里没有的汉字
公开数据集的话首先就规避掉了自己搞数据集的数据本身的问题
我隐约记得 ppocr 是有行高限制的，太小的图在训练时前会过滤掉，也可以用超分算法模型预处理那些小图片（但是感觉这个路子不太值得）
训练时候的预处理和预测的预处理要保持一致，也不太随便加，有时候不加反而效果更好

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1068056

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.