js 是否有专门进行编码检测(charset|encoding detection)的轮子

2017-04-26 14:41:15 +08:00
 abcbuzhiming
纯 javascript ,不是 nodejs

最近一直在研究如何让浏览器直接读取用户提供的文件,就和原生应用一样,发现有个问题很难解决,用户提供的文件使用的编码集你是不知道的,也不是所有文件都有 Bom 头, GBK 和 UTF-8 No bom 头是无法从头部分辨的。导致你读取的时候很容易乱码,你不能默认就是认为 txt 文件一定是 GBK 也不能认为 csv 就一定是 UTF8 ,其它语言都有能进行编码检测的能力, js 有没有相关的轮子实现?
2979 次点击
所在节点    JavaScript
7 条回复
denghongcai
2017-04-26 15:05:09 +08:00
denghongcai
2017-04-26 15:08:06 +08:00
楼上那个是 decode 的,探测可以看看 https://github.com/aadsm/jschardet
abcbuzhiming
2017-04-26 15:54:09 +08:00
@denghongcai 66666 ,我就说应该有轮子,但是始终找不到
AdamChrist
2017-04-26 16:04:33 +08:00
iconv-lite 需要 node 环境才能使用,里面用了 buffer 和 stream
orzfly
2017-04-26 16:07:30 +08:00
@AdamChrist #4 https://www.npmjs.com/package/iconv-lite 人家有提到脱离 Node 的方法……
In-browser usage via Browserify (~180k gzip compressed with Buffer shim included).
binux
2017-04-26 16:12:32 +08:00
大部分 nodejs 的 lib 都能 Browserify ,大部分库都不单独发布 Browserify 的版本了
AdamChrist
2017-04-26 16:18:01 +08:00
@orzfly 我之前在 react-native 中使用不行..忘记有 Browserify 的方法了..不过刚才看了一下..最新版也支持了 react-native 了..

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/357466

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX