有这样一件事,文字对比工作,不知道怎么加速。

2020-08-31 20:51:58 +08:00
 NonClockworkChen
客户会给我们一个 word 格式的新闻稿。
我们需要用 CMS 编辑好后,上传到后台发布。因为一些特殊原因,这个 CMS 使用起来复杂。所以,我们不太能要求,上传的同事,一点错都不出。那么我负责检查工作,怎么能批量检查 word 中每行字,都在网页中。
不需要检查样式,只要保证,字对就行。经常漏内容- -,我再解释一遍,这个 CMS 比较复杂而且不能替换,我自己上去传内容,都不能保证一定不出错。。。
1013 次点击
所在节点    问与答
7 条回复
pelloz
2020-08-31 21:03:58 +08:00
有很多工具包可以读取 word,然后再和你们发布的网页内容对比一下就能告诉你是不是完整的。程序实现应该不难。
pelloz
2020-08-31 21:15:25 +08:00
我想到的最简单而且不用写代码就能完成这件事情的方法是,把原始 word 内容全选复制粘贴到 1.txt 文本文件,然后全选 CMS 输出的内容到 2.txt ,然用 beyondCompare 工具进行比对的到结果。
dlsflh
2020-08-31 21:18:46 +08:00
CMS 是什么?
TimePPT
2020-08-31 21:33:37 +08:00
@dlsflh 内容管理系统
sadfQED2
2020-09-01 08:52:16 +08:00
你会编程的话,写代码读取 word 内容,然后再通过爬虫抓 cms 数据,然后对比。

如果你不会的话,楼下大佬解答吧
soho176
2020-09-01 11:52:05 +08:00
换个简单的办法,word 直接转换成图片,cms 中直接贴图片
xiaoxinshiwo
2020-09-01 13:47:50 +08:00
将网页的文字复制出来保存为 word,然后用比较工具例如:beyondCompare 比较下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/702932

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX