rocky55 最近的时间轴更新
rocky55

rocky55

V2EX 第 384522 号会员,加入于 2019-02-16 21:45:46 +08:00
rocky55 最近回复了
100 w 前缀树的方式存储应该也不会太占内存,如果词不是很长,如果是英文应该就更省了
100 w 好像不多直接放内存,AC 自动机,速度应该不会慢
2020-08-06 18:26:03 +08:00
回复了 Beeethoven 创建的主题 程序员 国内有什么好用的 PDF 文档 OCR 产品吗
或许我能做,现在的输出是 xml 能定位图片和文字表格,目前的输出是 xml, 主要是 C++ 和 python 写的,实在有需要可以 [email protected]
2019-02-17 09:02:12 +08:00
回复了 wvvW 创建的主题 算法 自然语言处理序列标注算法实现
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2820 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 13:24 · PVG 21:24 · LAX 06:24 · JFK 09:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.