准备写个文档预览服务

2016-01-12 22:37:42 +08:00
 ablula

最近做了些调研,准备用 Java 写个文档预览服务开源出来;
要支持文本文档,图片(含 psd), Office 文档等

4273 次点击
所在节点    奇思妙想
22 条回复
go4fun
2016-01-12 23:47:29 +08:00
具体说说,啥是文件预览服务?
ablula
2016-01-13 00:10:57 +08:00
@go4fun 目的是让文档能够在线预览,不需要等到下载下来才能看文档内容;
服务提供形式我还在考虑中,目前想的是让预览服务使用方实现一些接口就能够使用这个预览服务
dphdjy
2016-01-13 00:32:03 +08:00
全部转图片~简单粗暴~
imxieke
2016-01-13 00:43:45 +08:00
支持全系列还是?有用户账户功能不?
go4fun
2016-01-13 08:01:26 +08:00
这个不错
ablula
2016-01-13 09:03:22 +08:00
@imxieke 先支持常见格式文档,框架搭起来,后面慢慢扩展其它格式的文档; 用户账户目前还没考虑,做出核心功能再说

@dphdjy office 转图片没研究过,现在想的是转 pdf

@go4fun 代码写完 at 你哈
ty0716
2016-01-13 10:16:59 +08:00
转 pdf 就没意思了,七牛也支持.
https://dn-wsy.qbox.me/20160113101619.png 这种就不错

不过还是支持下
ljy2010a
2016-01-13 20:04:15 +08:00
关注中 有更新同步下帖子下哈
iLtc
2016-01-13 22:07:08 +08:00
这个服务挺好的,我就一直缺一个文档在线预览的工具
imxieke
2016-01-14 00:09:28 +08:00
@sweetvvck 楼主是否考虑收费呢?
ablula
2016-01-14 01:42:02 +08:00
@ty0716 感谢支持😄

@ljy2010a 一定会的,不过由于工作原因,进度不会很快

@iLtc 写好给你用😁

@imxieke 还真没考虑那么多,目前处于雏形阶段
imxieke
2016-01-14 08:56:51 +08:00
@sweetvvck 哦哦
okeydokey
2016-01-14 10:21:34 +08:00
文本预览说白了就是把字节流转换成字符,这里面涉及到字节流编码的识别,及不同编码分页的问题图片用 openCV
okeydokey
2016-01-14 10:25:31 +08:00
图片预览用 openCV 或者各种基于 openCV 的 jar 包

office 预览切记用微软的 officewebappserver ,千万不要尝试走 office->pdf->swf 这条路,毕竟只有微软才最懂自家产品
ablula
2016-01-17 02:18:58 +08:00
@okeydokey 看起来像是研究过类似服务啊,不过你说的方案我也看过,我先按照我的方式实现一把,搞不好再试试你的
ablula
2016-01-22 03:06:14 +08:00
@go4fun @okeydokey @imxieke @iLtc @ljy2010a @ty0716 @dphdjy
基础功能版本已经写完了,部署了个线上 demo ,大家可以去试试哦,目前只发现不支持带图片的 ppt 格式(Openoffice 的问题,后面看看怎么解决下), pptx 还是支持的;普通图片, psd 格式都支持,快来看看吧~
http://docpre.sweetvvck.com/docpre
ty0716
2016-01-22 10:43:23 +08:00
ablula
2016-01-22 10:46:55 +08:00
@ty0716 好的,记下了, thx~
可以给项目提个 Issue 哦
https://github.com/DocumentPreview/DocumentPreview/issues
okeydokey
2016-01-22 11:48:51 +08:00
@sweetvvck 上传的文件大小有限制啊, openoffice 转 pdf 的体验,和 officewebapp 转 html 的体验完全没法比啊
ablula
2016-01-22 12:32:51 +08:00
@okeydokey 文件大小限制是 nginx 默认的我还没来得及改;
当然没有 MS 自己的效果好啊,不过用 officewebapp 的话我还得搞台 windows 服务器比较麻烦,而且如果哪天它不让免费使用了,我们也没办法控制;
我还写过在 windows 下通过 COM 组件调用 MS Office 转换的方式,效果也很好(之后考虑开源);
不过目前在用的 aws 免费的 ec2 ,搞 windows 服务器比较麻烦,后面定义个通用接口,转换服务可切换;
项目才刚起步,慢慢优化嘛,谢谢关注~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/250282

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX