最近遇到了一个头大的编码问题,出现在 Chrome 改变页面编码至非 UTF8 的时候。
当前的 Chrome 已经不支持随便改页面编码了,所以要么安装插件,要么需要在本地调试,把编码设定到非 UTF8 ,比如 GB18030 。
var foo=new Image();
foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png 你';
console.log(foo.src);
以上这段返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png%20%E4%BD%A0
。
…嗯,非常正常。
var foo=new Image();
foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png?你';
console.log(foo.src);
…返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png?%C4%E3
。
…只多了一个问号,编码和之前完全不同了,变成了 GB18030 编码…
所以这是什么状况… Chrome 的 Bug 还是有标准要求这样处理?
有些不能理解,顺便 IE 是不会对这个字符串做 escape 的,实际提交了怎样的请求还有待观察…
1
wdhwg001 OP Edge 对不问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½
https://mdn.mozillademos.org//files/7693/catfront.png%20ä½%C2%A0` 对带问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½ ` 有些莫名其妙了…其中“ä½ ”用 escape()转码后刚好是%E4%BD%A0 … |
2
wdhwg001 OP 被 V2EX 的自动处理坑了一波, Edge 对不带问号的反应是`%20ä½%C2%A0`…%C2 出现的莫名其妙。
|
3
flyingghost 2017-01-22 11:37:23 +08:00
1 ,网站如果使用 UTF8 的话,第二段代码也会使用 UTF-8 。
2 ,网站如果使用 GBK 的话, url 部分依然是 UTF-8 (???), query 部分会被编码为 GBK 。 3 , chrome/firefox 表现一致。 问号部分和我预期不符啊。。。等高人解释问号部分。。。 |
4
p2227 2017-01-22 18:07:25 +08:00
把编码设定到非 UTF8
是指 HTML 文件包含 `<meta name="Content-Type" content="text/html;charset=gbk">`还是说文件的实际存储代码是 gbk ? |
6
wdhwg001 OP 简单翻了一下 URI 的 RFC ,似乎没有提到“ query 的编码由当前页面决定, path 统一编码为 UTF-8 ”这样的描述。
不过也许是我看的不仔细,或者这件事是由 w3c 一类的规定的…? |