JavaScript PNG 图片编码和解码

2019-10-23 22:07:39 +08:00
 vivaxy

PNG 解码是指将一张 PNG 图片的二进制数据转换成像素点数据 ImageData

PNG 的二进制数据有很多方式获取。

在浏览器中可以得到 ArrayBuffer 类型的二进制数据:

fetch(url).then(res => res.arrayBuffer()).then(res => { console.log(arrayBuffer) });

在 Node.js 中,可以得到 Buffer 类型的二进制数据:

console.log(fs.readFileSync(filename))

在微信小程序中可以得到 ArrayBuffer 类型的二进制数据:

wx.request({
  url,
  responseType: 'arraybuffer',
  success: (res) => { console.log(res.data); },
});

ImageData.data 是一个 Uint8ClampedArray,其中以 R、G、B、A 的顺序保存了像素点的数据,每四项表示一个像素点。

Uint8ClampedArray 是一种 TypedArray,存储了 0-255 的数据。其中 U 表示 unsigned,也就是无符号(都是正值)。8 表示 8 位,也就是其中的数据值不能超过 2 ^ 8 = 256。Clamped 表示如果数据值小于 0,则变成 0,如果大于 255,则变成 255。与之类似的 TypedArray 还有 Uint8Array,初始化的值如果不在 0-255 之间,则加或减 256,直到符合要求。还有 Int8Array,里面的值可以带符号,也就是说可以是负数。

TypedArray 是 JavaScript 中用来存储二进制数据的一种数据格式,类似于数组。但是 TypedArray 中存放的数据类型已经确定,执行引擎很容易分配内存,所以 TypedArray 更快。在 Node.js 中,在 Int8Array 的基础上实现了 Buffer,提供了二进制数据流的存储和操作。

解码

PNG 的二进制数据可以分为 2 大部分:文件签名( Signature )和数据块( Chunks )。

Chunks 分为 IHDR、PLTE、TRNS、GAMA、IDAT 和 IEND。

Signature

PNG 的文件签名是 [0x89, 0x50, 0x4e, 0x47, 0x0d, 0x0a, 0x1a, 0x0a],文件头部需要是这样的数据。

Chunks

在处理了 Signature 后,每次读取 8 个字节的数据作为 Chunk 标示,8 个字节中的前 4 个字节表示这个 Chunk 占用的长度,单位是字节;后 4 个字节表示 Chunk 的类型。使用 Buffer 的 readUInt32BE 方法可以轻松地拿到这些数据。

Chunk 之间可能有冗余的内容,当 Chunk 没有开始,遇到冗余内容的时候,我们需要跳过长度 + 4 个字节。

Chunks 一共分成 6 个类型(括号中的是 Chunk 标示):IHDR ( 0x49484452 )、PLTE ( 0x504c5445 )、TRNS ( 0x74524e53 )、GAMA ( 0x67414d41 )、IDAT ( 0x49444154 ) 和 IEND ( 0x49454e44 )。IHDR 必须是第一个 Chunk ; IEND 必须是最后一个; IDAT 存放着压缩过的图像数据。

IHDR 中存放了图片的宽度( width )、高度( height )、像素位数( depth )、颜色类型( colorType )、压缩方式( compression )(只有 0 )、过滤器类型( filter )(只有 0 )、是否是渐进式( interlace )。

解码 IDAT

通过对 Chunks 的分段,我们可以拿到 IDAT 部分的数据。使用 zlib 的 inflate 方法可以把压缩过的数据解码出来。解码后的数据里,每 5 个字节表示一个像素,其中第一个字节表示过滤器的类型。通过过滤器( filter )把数据还原,最后数据转换成像素数据,就可以得到 ImageData 了。

渐进式加载( interlace )

保存 PNG 图片的时候可以选择是否保存为渐进式。渐进式的 PNG 图片可以在加载过程中从模糊到清晰。

PNG 的渐进式加载采用了 Adam7 算法。将像素点重新排序,可以做到先展示较不清晰的图片,再展示较清晰的图片。Adam7 算法一共有 7 步。

到第 7 步时可以拿到全部像素信息,因此在解码过程中需要判断渐进式的开关,并重排像素数据。

编码

编码过程是一个逆向的解码。先写入文件签名,写入 IHDR 数据(文件宽高等),写入 GAMA 信息,将 ImageData 进行过滤(通过过滤可以提升压缩率),将过滤后的数据用 zlib 压缩,作为 IDAT 写入,最后写入 IEND。

源码可以参考 png,基于 pngjs 的同步源码将 Node.js 的 zlib 替换成了浏览器端可以运行的 pako。再添加 buffer 以来就可以在浏览器上运行了。

参考资料

2880 次点击
所在节点    JavaScript
3 条回复
dioxide
2019-10-23 22:25:46 +08:00
战术 mar k
yimity
2019-10-24 15:30:19 +08:00
不错,十分感谢.
magicdawn
2020-10-19 11:14:42 +08:00
> 在 Node.js 中,在 Int8Array 的基础上实现了 Buffer,提供了二进制数据流的存储和操作。

Buffer extends Uint8Array
https://nodejs.org/dist/latest-v12.x/docs/api/buffer.html#buffer_buffers_and_typedarrays

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/612273

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX