图片透视裁剪的需求怎么自动化?

2021-11-05 10:47:20 +08:00
 nowheretoseek

有 1000 张从图书馆拍摄来的古籍照片,因为拍摄角度的原因,是上宽下窄并且有不少桌面背景,想批量裁剪好做成 pdf ,以方便后面录入、校对。拍成这样,一是可能不让影印,二是拍的人不太懂,没准备更好的拍摄设备和环境。

Photoshop 透视裁剪好像没法自动化,一张张弄太麻烦,请教有什么好的方案。现在想到的是二值化后识别边缘获取四顶点坐标,但因为不是很规整的矩形,也不好直接截取,有什么工具可以进行透视裁剪吗?

1809 次点击
所在节点    问与答
23 条回复
sadfQED2
2021-11-05 10:58:54 +08:00
依稀记得 photoshop 好像有宏功能,看看能不能写个 photoshop 的批量脚本呢
nowheretoseek
2021-11-05 11:12:30 +08:00
@sadfQED2 可是 Photoshop 似乎没有自动检测裁剪位置的功能,而照片情况复杂,没法使用统一的位置,Photoshop 怕无能为力
BurneJones
2021-11-05 11:21:33 +08:00
手工制作,估计 10-20 天就做完了。还能大概看一遍😂
sadfQED2
2021-11-05 11:21:59 +08:00
python+opencv 自己按规则裁剪呢
sadfQED2
2021-11-05 11:23:29 +08:00
你可以发张实例图片看看,另外赞同 3 楼,1000 张照片可能人工裁剪比写代码还快一下
nowheretoseek
2021-11-05 11:42:26 +08:00
@sadfQED2 @BurneJones 量是不大,可我没时间搞,并且 Photoshop 一张张弄太伤神了。
opencv 检测边缘不难,不过我不知道什么图像库可以根据边缘位置数据实现 Photoshop 那种透视裁剪,因为四顶点勾勒的肯定不是水平垂直的矩形,而是不规则梯形。

照片可能有版权问题,打了个码 ![demo.JPG]( https://i.loli.net/2021/11/05/pRYuId6BngeWz2w.jpg)
BurneJones
2021-11-05 11:52:05 +08:00
@nowheretoseek 裁剪也可以试试其他工具。遇到这样的问题,先裁剪图片,因为我不会使用 photoshop ,所以我可能用白描、手机或电脑自带的裁剪,然后调整生成 PDF 。或者我可以把 1000 页照片排序后生成到一个 PDF 里面,然后修剪 PDF 。又因为有版权问题,不然也可以考虑付费让淘宝店人工做完 PDF 给你😂
BurneJones
2021-11-05 11:53:43 +08:00
效果应该达不到楼主要的效果,不过差不多可以凑合看
0o0o0o0
2021-11-05 11:55:14 +08:00
手机的 pdf 扫描 app 可能简单一点,多找几个试一试
BurneJones
2021-11-05 11:59:03 +08:00
又或者,如果书籍印刷字体比较标准,且为常见字,照片清晰度也不错,不需要完整保留文本的样式,那么也可以考虑用 OCR 工具将文字识别提取出来使用。这样可以减少裁剪时间
lithiumii
2021-11-05 11:59:59 +08:00
有个软件叫 scan tailor ,试试?
1350943277
2021-11-05 12:04:29 +08:00
对于区区一千来张,我看用 microsoft scope 或者 scaner pro 人工裁剪并矫正透视是最省时省力又靠谱的。
nowheretoseek
2021-11-05 12:15:34 +08:00
@BurneJones 现在已经有底本了,需要对照这些图片校对。所以我的思路是裁剪好后,用古籍 OCR 做一次识别,以便将每张照片和底本的文本位置对起来,方便后续录入、校对。不裁剪好,古籍 OCR 是没法用的,这个领域的 OCR 识别率很来就很低,白描讯飞什么的都不行,要用专门的 OCR 工具。
nowheretoseek
2021-11-05 12:16:31 +08:00
@0o0o0o0 这种情况的 pdf 恐怕得自己弄,这些通用软件效果都不大行
Muniesa
2021-11-05 12:21:07 +08:00
根据四个点位置透视变换到固定尺寸,OpenCV 可以做的
nowheretoseek
2021-11-05 12:22:10 +08:00
@BurneJones 整合成 pdf 后可以用 briss 切白边统一裁剪,但它对我这个需求不大适用
nowheretoseek
2021-11-05 12:27:39 +08:00
@lithiumii 这个工具不错,能将左右两页分开,内容区域识别功能准确度也挺高,虽然不能透视裁剪,但对勾勒大致区域很有用,谢谢
nowheretoseek
2021-11-05 12:37:08 +08:00
@Muniesa 是吗,那我试试
littlejohnny
2021-11-05 15:49:00 +08:00
如果大部分原稿的透视角和距离差不多(比如误差 10%以内?),且对裁剪结果精度要求不是非常高的话,PS 的批处理+动作是可以完成的。
先用一张样例建好动作(矫正透视、宽高比、画布大小裁剪);然后执行批处理就行。
wsxkit
2021-11-05 15:56:23 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/813225

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX