在论坛和社区种寻找过一些方法,但这些使用 PyPDF 和 PyMuPDF 库的方法基本只能提取 pdf 的 png ,jpg 格式的图形。
https://www.geeksforgeeks.org/how-to-extract-images-from-pdf-in-python/
https://stackoverflow.com/questions/2693820/extract-images-from-pdf-without-resampling-in-python
但 pdf 以下两种图片会提取不到:
1.以 svg 、eps 嵌入的矢量图(如曲线图)
2.以 pdf 格式嵌入的图(几张图组合在一起并有箭头等标记最终以 pdf 保存)
有什么办法可以解决以上问题吗
https://www.geeksforgeeks.org/how-to-extract-images-from-pdf-in-python/
https://stackoverflow.com/questions/2693820/extract-images-from-pdf-without-resampling-in-python
但 pdf 以下两种图片会提取不到:
1.以 svg 、eps 嵌入的矢量图(如曲线图)
2.以 pdf 格式嵌入的图(几张图组合在一起并有箭头等标记最终以 pdf 保存)
有什么办法可以解决以上问题吗