xingzhi
2013-05-28 13:21:06 +08:00
这是我以前写过的一段话,若有错误请指正:
对于网页编码的处理,一般是按以下几个顺序的:
1. 在http response headers, content-type中的charset属性值
2. 网页源码中, header里meta标签中, content属性中指定的charset值
3. xml文件中的encoding
4. 自动检测
可是,以上的情况,对于不遵循标准的网站来说,就会成问题了,例如:
response headers没有提供charset
response headers中的charset值与网页源码中的charset值不一样
如何解决?
我想的就是,浏览器怎么做,我就怎么做。
查了下资料,对于浏览器而言, 它也是按上述顺序来进行编码检测的, 并且:
当response headers没有提供charset时, 检测meta中的charset,
当两者不一样时,使用的是response headers中的charset。