V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
yehoha
V2EX  ›  问与答

英文数字字体识别咨询

  •  
  •   yehoha · Jul 6, 2025 · 1436 views
    This topic created in 301 days ago, the information mentioned may be changed or developed.
    老哥们,现在我想根据一些验证码图片进行生成验证码,进行训练。但是验证码的字体识别很困难,老哥们有什么方法么
    6 replies    2025-07-06 16:55:52 +08:00
    stobacco
        1
    stobacco  
       Jul 6, 2025
    https://github.com/sml2h3/ddddocr
    可以直接使用,也可以自己准备训练集
    EndlessMemory
        2
    EndlessMemory  
       Jul 6, 2025
    你不会是完全自己搓一个模型训练吧
    yehoha
        3
    yehoha  
    OP
       Jul 6, 2025
    @stobacco 老哥,我就是自己准备训练集,所以想知道最接近的字体,dddd 已经用了,效果很差。找 ai 生成的 和验证码原图总有点差距,所以想知道最接近的字体,自己慢慢调
    yehoha
        4
    yehoha  
    OP
       Jul 6, 2025
    @EndlessMemory lepture/captcha 生成的也不像
    stobacco
        5
    stobacco  
       Jul 6, 2025
    @yehoha #3 你的意思是反向生成一些训练集数据,然后再训练模型吗?我也构想过,不过别人的验证码不是简单的更换了字体吧,应该有一些随机扭曲变形噪点啥的,难...不如直接先用打码平台识别,成功的就存着做数据集。
    yehoha
        6
    yehoha  
    OP
       Jul 6, 2025
    @stobacco 哈哈哈,嗯嗯 现在我也是这样。想更快一点。直接一步到位
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2669 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 03:01 · PVG 11:01 · LAX 20:01 · JFK 23:01
    ♥ Do have faith in what you're doing.