耗时一个月我开发了一个 PDF 转 Word 的在线工具

252 天前
 hfxsm

这是一个我花费了数月时间开发的在线 PDF 转换工具pdf2docx.cn,它不仅支持将 PDF 转换为 Word ,还包括 PDF 转 Excel 、PDF 转 PPT 等功能。今天,我想在 V2EX 这个技术社区分享我的项目,并且真诚地希望大家能试用并给出宝贵的反馈和建议。

项目背景: 我经常遇到需要将 PDF 文件转换为可编辑格式的情况。市面上虽然有许多此类工具,但往往难以满足高效率和高保真的需求。因此,我决定自己动手,打造一个更符合开发者和专业人士需求的工具。

主要特性:

技术挑战: 在开发过程中,我遇到了一些技术挑战,比如如何有效地处理复杂的 PDF 布局,如何确保转换后文档的格式不乱。

请求大家的反馈:

访问链接: www.pdf2docx.cn

期待大家的回复和讨论!

7740 次点击
所在节点    分享创造
78 条回复
gby
252 天前
pdf 转 word ?不是直接用 word 打开 pdf 文件就行了么。
jixiaopeng
251 天前
我也开源了一个项目,但不会推广,项目自我感觉很好,哎
haoxuexiaoyao
251 天前
我只需要提取里面的每一页的表格到 excel 的话可以的么
metalvest
251 天前
@metalvest 这个 python 库转换出来的基本可以保持大致格式,自测转了一个四百多页的单双栏混合带大量插图的 pdf 大概每秒钟一页的速度。
fzcf
250 天前
请问大概是什么技术路线,方便分享下吗?
hfxsm
249 天前
@zsj1029 可以的, 楼上同学提到 https://github.com/Stirling-Tools/Stirling-PDF 就可以实现。但是使用的 LibreOffice 是不能保持排版效果。

Conversion Operations
Convert PDFs to and from images.
Convert any common file to PDF (using LibreOffice).
Convert PDF to Word/Powerpoint/Others (using LibreOffice).
Convert HTML to PDF.
URL to PDF.
Markdown to PDF.
hfxsm
249 天前
@oliver2020 太大了,我加下文件大小限制
hfxsm
249 天前
@haoxuexiaoyao 可以啊,用 pdf 转 excel 就行了
hfxsm
249 天前
@fzcf 可以的,过段时间准备做一波分享
j6711
249 天前
挺强的,会有付费计划吗?能买断吗?
能有客户端离线使用的版本吗?有些资料只能本地处理
hfxsm
248 天前
@j6711 可以聊聊,后续会推出离线版本。
csx163
246 天前
带表格的 pdf 可以转么,目前 pdf 表格转 word 或 excel 市场上没一家能打的
hfxsm
246 天前
@csx163 可以啊,试试,效果非常棒
a5love3n
194 天前
老哥,你这个卖源码吗
halozzz
169 天前
问下老哥,表格转是基于啥技术?
mclxly
167 天前
扫描 PDF 现在能转么?
hfxsm
148 天前
@a5love3n 上线了 API ,可以接入哈
hfxsm
148 天前
@mclxly 可以,扫描的有两种方案,一种是采用开源的 ocr ,成本就我的开发成本。如果接入大厂的 ocr 比较贵

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009978

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX