JAVA 读取 BiliBili 网页乱码。

2016-09-17 16:06:24 +08:00
 XhstormR
public class Test1 {
    public static void main(String[] args) throws IOException {
        InputStream inputStream = new URL("http://www.bilibili.com/video/av6300269/").openStream();
        BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(inputStream, "utf-8"));
        for (String s; (s = bufferedReader.readLine()) != null; ) {
            System.out.println(s);
        }
    }
}

我运行后显示乱码,请问问题出在哪里,你们也是这样吗?

1541 次点击
所在节点    问与答
6 条回复
lisonfan
2016-09-17 16:09:35 +08:00
乱码一般都是编码格式问题吧?
XhstormR
2016-09-17 16:10:39 +08:00
@lisonfan 我知道, utf8 16be gbk 我都试了,都是乱码。
bsidb
2016-09-17 16:17:05 +08:00
是不是启用了 gzip 压缩?直接读取到的是原始的压缩数据流?
XhstormR
2016-09-17 16:17:24 +08:00
奇了怪了,我把地址换成 "https://www.v2ex.com/t/306758" 就不是乱码,就 Bilibili 的是乱码。
XhstormR
2016-09-17 16:25:50 +08:00
@bsidb 感谢,已解决,就是 GZip 的问题。
popok
2016-09-17 17:24:57 +08:00
肯定是 gzip 压缩的锅

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/306758

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX