如何提高 Java 使用第三方库读写文件的效率

2020-06-12 11:33:17 +08:00
 cruii

说实话,我是没有抱着能拿到答案的心态来的,但还是得吐槽一下

给客户打包了一个 SDK,里面封装了一些对 word 文档操作的接口 结果客户说,在操作一个 5M 大小的 Word 文档时,要把整个流程控制在 50 毫秒左右,不能超过 100 毫秒。

在这个 SDK 中实际操作 Word 还是调用的第三方库 aspose-words

我本地测试了 100 次,结果都是 1 秒起步

请问大佬们,这真的能实现吗,能有什么思路。aspose-words 的接口也是固定的,也不可能修改里面的算法。

2147 次点击
所在节点    Java
7 条回复
undownding
2020-06-12 13:22:36 +08:00
问题不是出在读写速度上,而是那个裤子的解析(?)速度上吧。

感觉要不提前加载,不然也没别的办法了。
dallaslu
2020-06-12 13:36:50 +08:00
攒 20 个文件多线程操作,假设共用 1 秒,平均就 50 毫秒了。

客户用 SDK 操作 Word,第一步得先选择文件吧,然后在点按钮时才真正调用 SDK 吧?改 SDK 接口,对外暴露俩方法,一个验文件,一个做解析。然后验文件时就开始预处理。

或者换库。
arrow8899
2020-06-12 13:40:32 +08:00
profile 看下是哪个步骤耗时多,如果第三方库不能看源码,那可以考虑换个开源的库,比如 apache poi,而且这个还跟你硬盘的读写速度和 CPU 处理能力有关,你让你客户报一下机器配置,和你自己的对比下。
kop1989
2020-06-12 13:45:20 +08:00
5MB 的 word,如果算 50ms 加载完毕的话,都要 100MB/s 了,都逼近机械硬盘的读取速度了。这还仅仅是 IO,还没算处理。
dallaslu
2020-06-12 14:02:55 +08:00
另外 aspose-words 这个库是不是底层靠调用在线接口实现的啊?如果是的话,这边建议客户拉个专线呢
xyjincan
2020-06-12 23:54:31 +08:00
要做成服务,不能让 jvm 每次都加载着一大堆类,多看看各种库的特点找合适的
594duck
2020-06-13 03:30:28 +08:00
@kop1989 老哥思路清晰。5M 的 xml 文件序列化一下多少时间。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/680936

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX