如题,我这里有一堆 word 文档,内容会按标题格式或者序号的形势来排列,有没有工具能够将这些内容结构化出来存到数据库中呢?
1
JaguarJack 2022-10-20 18:54:50 +08:00 via iPhone
如果只是文字的话,可以解析成 xml 处理
|
2
damai0419 2022-10-21 13:20:15 +08:00
刚做的需求。
我们是解析 word 试卷,里面还包含图片公式之类的。 word --> html ,然后解 html 。 |