怎么处理一段gbk、utf-8混合编码的字符串

2013-11-18 22:52:40 +08:00
 cctvsmg
情况是这样的:
读一个网页返回内容是json
里面大部分是gbk少部分是乱码
这个乱码部分是utf-8编码

如果按照gbk ignore解码
最后会出现有的 json的 ' 被吃掉
例如:

'php': '浗锛屽彜鏃', -------> 'php':'xxxxxx,

右边的 ' 于是就消失了
于是json就无法加载
4039 次点击
所在节点    问与答
3 条回复
plprapper
2013-11-19 00:21:27 +08:00
搞成这样是防止别人程序来解析吗。。。
SoloCompany
2013-11-19 16:23:01 +08:00
大哥你应该庆幸没有包含 BIG5 字符,否则你就等死吧,因为单引号是可以奇葩的合法出现在 BIG5 编码空间内的。对于现在所面临的情况,很简单,你只要使用 ISO-8859-1 编码来处理 JSON 就 OK 了,当然,转码神马的还得自己来
cctvsmg
2013-11-19 17:42:53 +08:00
@SoloCompany
@plprapper

无语凝咽 ╮(╯▽╰)╭

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/89740

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX