昨天提问，碰一鼻子灰，现在真心重新求教：不依靠后端，浏览器端能不能抓其他网站的内容？

master13

2017-03-20 11:38:10 +08:00

我是这么理解的， LZ 提到的 native app 的一些功能其实是 WEB 架构里所谓的“后端”才能做到的，单凭前端特别是受各种限制的前端来完成 native app 的全部，显然是不可以的。

话说为什么不能依靠后端……前端把做不到的事当做类似于“任务”的东西（ something like a task ）甩给后端，前端轮询后端处理结果……现在不都是这样么……

qiayue

2017-03-20 11:41:41 +08:00

写个简单的 chrome 插件，可以跨域请求任何 API

Zzzzzzzzz

2017-03-20 11:44:20 +08:00

yahoo 的 YQL

Zzzzzzzzz

2017-03-20 11:45:05 +08:00

不过这个实质上也是 yahoo 的服务端替你读了一下

littleylv

2017-03-20 11:51:15 +08:00

想说，为啥“不依靠后端”？

wanttte

2017-03-20 14:04:53 +08:00

@hst001 我帖子里跨域二字都写出来了，难道我还不知道跨域吗？
帖子表达的意思是， web 能做的越来越多，现在有了 pwa 这种技术， google 声明给予和 native 同等的地位，但是 web 还是限制太多，起码这么简单的事情都做不到。
pwa 一大用途就是可以离线使用。可不可以假设，不依靠后端，点开主屏的图标，打开 web 应用，可以调用各种 api ，抓网站数据。如果是个 native ，没任何问题吧，但 web 就是不行。
这么说能明白我的意思了吧？

Rice

2017-03-20 14:12:11 +08:00

@wanttte 是啊，怎么了？

wanttte

2017-03-20 14:12:57 +08:00

@master13 你是最接近理解我意思的回帖了。为什么想这些呢？
因为 web 越来越流行，现在又有了 pwa 这种东西，可以把 web 当成一个图标放到手机桌面，对用户来说就和一个 native app 体验一样了。而且 pwa 号称可以离线，脱离后端运行。
现在，比如写一个 native ，抓各种 api ，数据，显示结果，很普通的一个应用。但是如果用 web 就不可以，因为浏览器的安全限制。
以后浏览器就是一切，就是一个操作系统。但浏览器就这一个同源安全限制，就做不了很多事情。

msg7086

2017-03-20 15:11:51 +08:00

@wanttte 操作系统也可以一样做限制 —— 防火墙等等。

你说要让 Web App 和 Native App 有一样的体验，那就意味着 ——

浏览器放开权限管理，如操作系统一般宽松，
- or -
操作系统收紧权限管理，如浏览器一样严格。

比如说 Windows 上一些 App 就是用 JS 写的（ Atom etc.），软件本身就是浏览器，软件可以自己给自己放宽权限，如操作系统一般宽松。

lecher

2017-03-20 15:41:41 +08:00

你想写 native 抓各种 api ，那是因为 native 你可以任意构造请求数据，所以没有同源安全这个限制。但是浏览器不可能放开这个限制，因为浏览器托管了 cookie 这类的敏感数据是可以做用户标识的，所以发出去的请求格式有限制，不能任意构造请求。
即便是 native 的开发，也还有存储域的限制，一个 app 如果在框架指定的私有存储域写入文件，那么别的 app 也不可以访问到这个私有存储域的文件。而且最重要的一点， native 不可以调用用户浏览器数据或者其它 app 的资源，只能靠 native 自己构造请求数据。

而浏览器对于 web 请求，是不验证发起域的，只要发出去的请求，默认就带上该域的 cookie 作为用户标识。所以 web 目前的请求方式决定了，限制跨域是保证浏览器用户数据安全的底线，不管任何浏览器都必须支持同源安全限制。只有符合 cors 白名单的网站才可以发跨域请求。

如果浏览器在目前的业务下可以在任意界面构造任何请求发出去，这个浏览器不可能有人会使用。如果所有浏览器都没有同源安全限制，那互联网不超过一周就崩盘了，你随便访问一个不知名的网站，它就在后台给一票网银系统构造转账请求，在你不知情的情况下，钱就消失了。对网站来说，自己站点提供的服务，图片、 api 这类的，别的网站可以不告而取，任意调用。

你想这么做，我猜测的原因可能是，你希望在自己的网页调用别人的资源，并且是别的网站没有在 cors 开放权限的资源。这种情况下你依然想调用这个资源，那就只剩你想盗用别人的资源这个情况了。
碰到这种不能调用的资源，要么你找对方网站在 cors 上面加上你的网站域名，允许你直接调用。要么你自己开服务器做反代，转成同域请求。

以后浏览器如果可以任意构造请求，那就要改变浏览器的请求模式，对于非同源的域发起的请求，比如 A.com 网页中构造了一个向 B.com 的请求，那这个请求拿不到任何 B.com 存储在浏览器的数据，相当于一个独立的用户发起的请求。比如 A.com 网页向 B.com 发出的请求永远不能携带 cookie 和敏感的 header 数据。

这种情况下，才可能出现任意网页调用任意域的 api 数据。否则只会出现更多欺诈用户的现象。对行业生态和用户都是伤害。

Exin

2017-03-20 16:02:12 +08:00

1. “基于浏览器”不等同于传统网页， PWA 这类应用如果要逼近 native App ，必然会有绕过 cors 的措施。
2. 网页中 js 不能访问无相应 cors 的 api ，现在不能，将来也不太可能。

hst001

2017-03-20 16:03:36 +08:00

@wanttte 我不知道谷歌有没有说过 pwa 跟 native 同等地位，就算有，也不是这个意思。
为什么 pwa 不能跨域？因为它是基于 web 的， web 不能跨域是因为安全问题，如果 pwa 可以跨域，那 web 的同源策略形同虚设，木桶原理大家都懂，所以为什么 pwa 不能跨域就是这样，除非可以隔离开来使用。

wanttte

2017-03-20 16:39:12 +08:00

@lecher @Exin @hst001 所以这就是我问题的本质，浏览器的安全策略很重要，但结果就是局限很严重。

wanttte

2017-03-20 16:46:15 +08:00

@lecher @Exin @hst001 所以这就是我问题的本质，浏览器的安全策略很重要，但结果就是局限很严重。
@msg7086 这种限制和你的举例，比如操作系统的防火墙，不同 app 的安全沙盒，我觉得不是一回事，不能这么举例子。
有很多网络资源不是不让读取，不算盗取的概念。只是以前很多东西只能放后端，现在 web 够强大，够方便，未来很多东西可以放到 web 来做。
就比如我举的那个 api 的例子，如果感兴趣可以上网站看看 api 文档。很明显这是正常使用，不算盗取。只是 api 的开发者没有考虑到会在 web 端使用，这种情况。

所以我的意思就是，浏览器未来难道不会修改跨域的限制？肯定有一种解决方案，既能满足安全需求，又能解决跨域问题。
浏览器最开始没有 js ，后来也没人用 ajax ，现在又了 websocket ，甚至 webassembly 。我不相信未来浏览器还会一直存在这种限制。

binux

2017-03-20 16:54:59 +08:00

LZ 你口口声声说什么 pwa ，但是为什么 pwa 不能依赖后端？ Facebook 的 Web app 也要脱离后端吗？
不要和我说什么 offline ，你一个网络抓取 app ， offline 一样用不了，为什么不能有后端？ pwa 不是这么要求的。

binux

2017-03-20 17:10:19 +08:00

而且，你知道 CORS 的 header 叫做 Access-Control-Allow-Origin 吗？它本来就是一种许可机制，不是你说 API 是公开的就是公开的，即使是公开的，别人是否允许你拿来做 web app 也是不一定的。如果你觉得是，和我们说没有用，和 okcoin 说去啊，让他们给你加访问许可啊。

wanttte

2017-03-20 17:57:59 +08:00

@binux 别激动，就是探讨而已。我没有说 pwa 不能依赖后端。
没有 Access-Control-Allow-Origin ，用 node.js 可不可以访问？直接写原生应用能不能访问？
我觉得 web 越来越强大，能做的事情也应该越来越多。所以就是探讨下现在这种跨域是否合理。

binux

2017-03-20 18:20:05 +08:00

@wanttte #37 没有警察，没有摄像头你就能偷能抢了吗？

xialdj

2017-03-20 18:45:02 +08:00

1 首先对楼主表示心疼其实楼主这个问题非常值得探讨的但是不解决这个问题目前的应用还是可以用 pwa 写的因为大部分应用不需要跨域请求本身 web 完全取代 native 也是不现实的

2 目前没有办法跨域有个跨域比较像的技术 foreign fetch 是在缓存拦截跨域资源的时候的一个解决办法但是和楼主这个没啥关联

wanttte

2017-03-20 19:04:46 +08:00

@binux 我对你的这个回复非常无语，你根本不明白我在说什么