同样是扫描的电子书,为什么清晰度相差那么大?

2014-11-25 21:10:36 +08:00
 jason52
我是最近发现这个问题。例如网上 Perl语言编程(第三版).pdf 这本书,70M+ ,1123页,相当清晰。而代码大全900多页,150M的大小,清晰多却还差一点。

我是最近再找一本绝版的书的时候,再一次发现这个问题的。顺便说一句,电子出版时代还有绝版的书正是不应该啊,花钱也买不到,要么去tb上面买扫描版。我觉得还是应该像亚马逊那样提供电子版的。

这里还是要感谢一些扫描纸质书籍上传的志愿者,虽然有盗版等问题,但是在人类知识的留存上,还是有正面价值的(个人看法)。

一下是问题,我在看这本书的是后(游戏之旅-我的编程感悟 云风著 414页 37.5M 高清书签版),

这一页



你可以看到游戏的游字,反面被印出来了,正式因为这个原因pdf文档才体积大了吧。




而同样制作出来的文档后一页,就没有把反面打印出来,而且相当清晰。
这是因为打印机的设置缘故吧。

不知道大家谁有所了解。
4553 次点击
所在节点    问与答
13 条回复
jason52
2014-11-25 21:15:36 +08:00
我个人理解这个应该主要和数字图像处理有关系,减少信息量,二值化之类的,减少色深,同时不要有jpg压速率大了之后小圈圈这样的噪声。。

只是具体实现过程不知道有那些知识。
Sharuru
2014-11-25 21:17:03 +08:00
以我作为某组图源身份来讲,一份资料是否压扫,DPI,分辨率,后期的图像曲线,使用滤镜,保存格式都会影响到最后扫描成稿的质量。
jason52
2014-11-25 21:29:46 +08:00
@Sharuru 非常感谢,你能介绍一下你们扫描基本上是用一些什么样的工具,以及如何设置一些参数吗?
em70
2014-11-25 21:35:30 +08:00
绝版书二手市场可以找一下,比如云风这本编程感悟我就有正版,上升到人类知识留存上太夸张了。
jason52
2014-11-25 21:40:36 +08:00
@em70 恩,一个是孔夫子,还有一个是最近看到的http://www.youlu.net/ ,其他一般只能万能的淘宝了。 我知道是在不行国家图书馆里应该是不是有中国所有出版物的起码一份备份。

其实往往是找不到的时候,感叹一下google图书计划的超前性。
Sharuru
2014-11-25 21:48:59 +08:00
@jason52 仅仅是一台普通的佳能扫描仪而已,300DPI,使用驱动自己带的灰度预设扫描进PS,摆正,拉直等等,然后会根据纸张材质的不同进行图像曲线的调节。文本的话大概做到这里就差不多了。如果是图像,还会有网点和噪点的问题,这个时候就要过一遍滤镜和做的一些动作了。常见的滤镜就是Topaz家的TC和TD。
why
2014-11-25 22:01:56 +08:00
灰度图和二值图扫描,后者处理后为透明图层,还能改变背景色

要不然就是电子原稿转低分辨率图片
jedicxl
2014-11-25 22:16:10 +08:00
涉及的因素很多。扫描的书籍的纸质、扫描仪和扫描的过程、后期处理,都会影响扫描版电子书的最终质量。越老的书,纸背面的文字透过来的可能性越高,这样的处理起来越麻烦。负责任的有奉献精神的有技术的人来做,自然比其他普通水平的人做的质量好很多。
hipda论坛里长期做扫描版的那几个人就符合我上面的描述。
jason52
2014-11-26 09:08:46 +08:00
@jedicxl 对啊,这个事情真做起来也不是那么容易。还有一些论坛大神会出精排版,多是文学类,如资治通鉴,真是非常用心啊。
jedicxl
2014-11-26 09:30:47 +08:00
@jason52 是。为减轻后期工作量和提高质量,很多人都是自己买来书后拆了,一页一页单独扫描,这样最大限度降低畸变,但扫书的人就得承担买书的钱。这其中真的是没做过不晓得有多辛苦
zts1993
2014-11-26 09:33:30 +08:00
第一本书的问题不仅仅是扫描,显然纸张就不好。。
jason52
2014-11-26 11:37:15 +08:00
@jedicxl 是啊,我感觉做书签就麻烦死了,但是书签很重要。


@zts1993 没有哦,两个截图是同一个pdf里面的,同一本书的。所以我才问这个技术。
why
2014-11-26 16:35:50 +08:00
有图片用灰度图,它有吗?纯文字就二值图

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/149256

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX