耗时一个月我开发了一个 PDF 转 Word 的在线工具

252 天前
 hfxsm

这是一个我花费了数月时间开发的在线 PDF 转换工具pdf2docx.cn,它不仅支持将 PDF 转换为 Word ,还包括 PDF 转 Excel 、PDF 转 PPT 等功能。今天,我想在 V2EX 这个技术社区分享我的项目,并且真诚地希望大家能试用并给出宝贵的反馈和建议。

项目背景: 我经常遇到需要将 PDF 文件转换为可编辑格式的情况。市面上虽然有许多此类工具,但往往难以满足高效率和高保真的需求。因此,我决定自己动手,打造一个更符合开发者和专业人士需求的工具。

主要特性:

技术挑战: 在开发过程中,我遇到了一些技术挑战,比如如何有效地处理复杂的 PDF 布局,如何确保转换后文档的格式不乱。

请求大家的反馈:

访问链接: www.pdf2docx.cn

期待大家的回复和讨论!

7739 次点击
所在节点    分享创造
78 条回复
stiekel
252 天前
实测 34.2MB 文件,的确 90%会卡一下,但等一下就成功了。下载也耗了一点时。
但是……转换完,还是图片——从图片 PDF 变成了图片 Word 文档。
hfxsm
252 天前
@Morii 这两确实好用。我的做了点新功能,加了去除读写保护。其实也支持传入密码(前端还没加)处理加密的 pdf 。
hfxsm
252 天前
@stiekel 这个涉及到 OCR 技术,目前还在增加当中。扫描件不太好处理哈。
natsuki22
252 天前
扫描 PDF 挺麻烦的,楼主加油做个谷歌排名第一的(
oliver2020
252 天前
支持一下
leaf
252 天前
这不是一个红海市场了么?怎么还在不断开发,有啥特色功能吗?
hfxsm
252 天前
@leaf 准备加些特色功能:
1 、对于受保护的 pdf 不能转换,去除 pdf 的保护,其他的工具没有
2 、支持扫描件,用 OCR 技术实现还原,再导出 word
natsuki22
252 天前
我是做这个方面软件推广的,1 的话一把一把的网页工具,2 的话能够做的很好的现在都没有
2 的话有个大问题是文字识别的多语言。。。
natsuki22
252 天前
能把一个小语种做好就算特性了(英语的识别已经没啥大问题了
muyangren
252 天前
6.4 MB 文件卡 90%不动了
mdyh
252 天前
一点击开始转,就弹没了
metalvest
252 天前
临时有转换需求的话,from pdf2docx import parse 就行了
supuwoerc
252 天前
为啥转出来多了一页空白页...
hfxsm
252 天前
@natsuki22 大哥,哪些小语种需求相对多一些,准备排个计划
oliver2020
252 天前
试了一下,都是几 M 的文件,有时候显示接口调用失败
6581
252 天前
花时间做这个是为了赚钱吗?还是怎样呢?感觉市场上已经有很多这种工具了。
Felldeadbird
252 天前
效果不错,基本都可以转文本。就是转换速度慢了一点,可以接受。
oliver2020
252 天前
113MB 扫描件,转换过程中自动把文件删除哈,一点征兆都没提示
fru1t
252 天前
还不错,试了一个纯文本的 pdf
rupert
252 天前
我也做的一个小程序

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009978

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX