求教各位大神, 300 页的 pdf 病历材料,马赛克遮挡医院名患者名最高效的办法是什么?

2018-07-04 21:58:25 +08:00
 revival83
求教各位大神,300 页的 pdf 病历材料,马赛克遮挡医院名患者名最高效的办法是什么?
3967 次点击
所在节点    问与答
35 条回复
revival83
2018-07-04 23:58:19 +08:00
@zhengjian 貌似发现新大陆!我赶紧去试试!
PP
2018-07-05 00:22:02 +08:00
@revival83 抱歉啊,私心作祟。

我尽量回忆一下当年的做法,纯属笨办法。当年处理 pdf 封装图片时,批量输出是第一步,真正的核心是将图片全部转成 png 灰度格式,因为接下来要用图片软件对这些灰度图片进行批处理。具体办法是通过图片软件内置工具编写批处理脚本,对不同灰度范围或具体灰度值进行不同处理如删除、加重和替换。可能是当年软件 bug 的原因,每次批处理过的图片会有大约 1%的图片被漏过,所以我对批处理后的图片重新执行一次批处理后再做检查筛选。其余的工作都有简单工具,网上应该有许多存档,如何处理应该可以随意了。时间太久,恐有遗漏,姑且当作给有需要的朋友们一点小参考。
revival83
2018-07-05 00:27:47 +08:00
@PP png jpg 到无所谓只要是我这些图片都是病历,都是密密麻麻的文字中会包含隐私文字,所以每一页都跟看字典似的要读一遍,所以效率很低。没有什么捷径…我的操作是:
1. Photoshop 打开 pdf 选取一页
2. 打马赛克
3. 保存图片
4. 将所有图片打包 pdf

想问下把 pdf 一页一页变成图片 在 mac 上有简单的办法吗
PP
2018-07-05 00:34:09 +08:00
@revival83 我不清楚,我只 z   d
PP
2018-07-05 00:34:48 +08:00
我只知道 windows 下没有问题。
zzj0311
2018-07-05 00:49:29 +08:00
@revival83 adobe acrobat 可以导出 jpg/png
KevZhi
2018-07-05 01:03:43 +08:00
不想写代码的话就 ocr 以后搜索 搜到结果手动抹 然后校对
revival83
2018-07-05 08:39:02 +08:00
@zzj0311
@KevZhi 感谢大家
laolinn
2018-07-05 08:49:55 +08:00
@shiny 一份就一两块钱,肯定有大学生抢着来干
revival83
2018-07-05 09:36:05 +08:00
@laolinn 一份两三百页。。
revival83
2018-07-05 10:06:51 +08:00
@zhengjian 这个方法我试了,打开之后能把罩住的部分删掉
revival83
2018-07-05 10:08:14 +08:00
@KevZhi 有推荐的工具吗 老铁
qvvo
2018-07-05 10:26:37 +08:00
如果医院和姓名都是打印的,带标题框的,比较容易搜索的那种,
比如:姓名:xxxx

可以先用 Adobe acrobat 自动识别一下中文,然后做全文搜索,搜到后就手工打码
这样总比一页一页自己翻看简单一些
ccoming
2018-07-05 11:53:29 +08:00
@revival83 win 上有雪莹虚拟打印,mac 的找找类似的吧。另外,直接在 pdf 上面做线框或者画笔这样的标注,不能打印出来?
chenjau
2018-07-06 15:00:38 +08:00
码农遍地爬的地方竟没人提 shell 和 ghostscript ?随便转

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/468191

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX