V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
albertofwb
V2EX  ›  外包

一个 2000 元的图片识别类外包,返回一张图片至少包含多少个中文字符

  •  
  •   albertofwb · 2020-07-07 18:14:38 +08:00 · 235 次点击
    这是一个创建于 1602 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一个 2000 元的图片识别类外包,返回一张图片至少包含多少个中文字符

    背景

    开发一个程序实现图片内容检索,用的 tesseract-ocr 识别图片比较慢,因此想做一个预处理,只识别包含大量文字的图片,忽略风景,人物等不含文字的照片

    时间要求

    7 天

    开发要求

    1. 期望使用 python3 或者 C/C++
    2. 应提供编译,部署文档
    3. 应包含 人物,风景,建筑,扫描件 这 4 种类型的图片各 3 张

    联系方式

    • 微信 albertofwb (请注明 v 站-图片类外包)
    xwhxbg
        1
    xwhxbg  
       2020-07-08 22:34:19 +08:00
    提供 training set 不?这个场景可以用个小模型先做分类,然后分类是扫描件的再用 ocr 扫描
    albertofwb
        2
    albertofwb  
    OP
       2020-07-09 00:51:27 +08:00 via Android
    @xwhxbg 有人接了,因为主要想筛选扫描类文件,特征明显,用传统算法搞
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1314 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 23:32 · PVG 07:32 · LAX 15:32 · JFK 18:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.