求问:这是用什么方式转换的图片站?

2015-08-11 15:41:23 +08:00
 manualplus

就这个http://oeeee.cc/qSUavR
用什么东东做的?很想知道这是一种好方法还是一种折中办法?

2705 次点击
所在节点    程序员
9 条回复
learnshare
2015-08-11 15:47:58 +08:00
并不知道你在说什么
402645707
2015-08-11 15:49:17 +08:00
爬虫爬的垃圾站
402645707
2015-08-11 15:49:56 +08:00
好吧当我没说,
pango
2015-08-11 15:51:52 +08:00
难道是ocr自动识别的?
Agromania
2015-08-11 15:55:35 +08:00
这个大概是人工或自动去收集了很多说明书的pdf,转成图片,很不错的点子

以PHP为例,pdf转图片很简单:

<?php
$im = new imagick('file.pdf[0]');
$im->setImageFormat('jpg');
header('Content-Type: image/jpeg');
echo $im;
?>
pimin
2015-08-11 16:10:20 +08:00
只是解析pdf吧
manualplus
2015-08-11 22:23:57 +08:00
@Agromania 转成图片这个好理解,方法也很多,但它这个解析提取出文本内容(按页提取并自动加上超链接和做分行处理)思路很好。可能就是不知用什么方法和技术方案实现的?
paperpeper
2015-08-12 13:22:11 +08:00
manualplus
2015-08-14 08:23:59 +08:00
@Agromania 点子很好吧,我们也在做说明书服务,欢迎交流

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/212405

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX