请问这是什么编码?

2014-03-06 11:26:32 +08:00
 paloalto
http://www.tol.edu.cn/uploads/files/

无意间发现的这个地址,试了 gbk 和 utf8 都是乱码。

另外,这个目录应该可以公开访问吗?
2870 次点击
所在节点    问与答
10 条回复
lululau
2014-03-06 11:55:09 +08:00
UTF-8编码的,被当做 GBK 转过码了

curl -s 'http://www.tol.edu.cn/uploads/files/' | iconv -c -t GBK
paloalto
2014-03-06 14:09:04 +08:00
@lululau 似乎是失败了,不花时间折腾了。

lululau
2014-03-06 14:37:00 +08:00
@paloalto 你这已经是成功了啊,看不到那个“会口安排”了吗,只是原本UTF-8编码的数据被当做GBK做过一次解码,因此有些信息已经丢失了,这样的丢失是不能恢复的
Mutoo
2014-03-06 14:54:25 +08:00
GB18030 效果会更好一些,但是还是丢了几个字符。
passluo
2014-03-06 14:56:38 +08:00
别纠结什么编码了。
这个网站是我们大二的时候做的,我都不知道什么编码了。
求不乱搞,服务器在教育部北京机房,小心被查水表谢谢。
passluo
2014-03-06 14:59:22 +08:00
不过按照常识,应该是UTF-8的,至于为什么会这样。。。就不知道了额。。
11138
2014-03-06 14:59:23 +08:00
Apache没配置好造成的。
IndexOptions Charset=UTF-8
这样就正常了。
paloalto
2014-03-06 16:11:07 +08:00
@passluo 哈哈哈哈原来如此!
passluo
2014-03-06 16:41:30 +08:00
应该是 @11138 说的这个问题,当时我们自己配置部署的服务器没这种情况,而且这个目录也是被封了的,不应该被访问到。。。。。应该是他们重新部署的时候没注意这些了。。。
passluo
2014-03-06 16:44:59 +08:00
刚才问了一下以前的哥们儿们,说可能是文件名md5过。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/103067

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX