最近用 Python 的 asyncio,有好多不懂。。

2017-03-14 17:25:45 +08:00
 param

我想实现的一个需求是这样的,我写一个 http 服务端(正在用 Flask ),接到一个用户浏览器发来的 request 之后,同时向多个上游服务器发送 request ,哪个上游服务器的 response 最快就拿谁的结果,把处理一下响应给用户浏览器。 有点类似 HTTP proxy ,只不过是多个上游服务器。由于需要同时向多个上游服务器发请求,我尝试了用 asyncio+aiohttp 。 可是这用在 Flask 里面应该怎么用啊? 难道我要在每个 route 里面写 loop.run_until_complete 吗?

app = Flask(__name__)
loop = asyncio.get_event_loop()

@app.route("/list1/")
def filelist1():
	async def get_file_list1():
    	await dosomething1()
	loop.run_until_complete(get_file_list1())


@app.route("/list2/")
def filelist2():
	async def get_file_list2():
    	await dosomething2()
	loop.run_until_complete(get_file_list2())

另外有一个 https://github.com/Hardtack/Flask-aiohttp ,不知道有没有用,不知道这个插件解决了什么问题。。还是说要用tornado?也不知道tornado解决了什么问题。。

13611 次点击
所在节点    Python
23 条回复
yongzhong
2017-03-14 17:57:41 +08:00
u need tornado
param
2017-03-14 18:05:41 +08:00
@yongzhong 原因是什么。。 tornado 解决了什么问题?
cljnnn
2017-03-14 18:09:55 +08:00
你可以试看看 sanic 。
a87150
2017-03-14 18:13:03 +08:00
@param 大概是指异步
param
2017-03-14 18:15:14 +08:00
@a87150 我知道 tornado 跟异步有关。那么我在 Flask+uwsgi 里面用异步又有什么不一样呢?我想搞清楚。
param
2017-03-14 18:16:18 +08:00
@a87150 另外, gevent 用在 flask 上又扮演什么角色呢?
director
2017-03-14 18:24:12 +08:00
你可以看看 https://zhuanlan.zhihu.com/p/25530067 里面有很多对 asyncio 和 sanic 的内容。强烈关注作者的微信公众号
param
2017-03-14 18:29:53 +08:00
@cljnnn @director 谢谢,感觉 sanic 很棒。
param
2017-03-14 18:31:04 +08:00
感觉,好像要用异步的话,所有的库都要换成异步了。。还有,异步有异常的话不好调试。
xyjtou
2017-03-14 18:32:43 +08:00
从不同的上游服务器拿到的 response 相同吗?还是要再处理后返回给浏览器?
param
2017-03-14 18:33:57 +08:00
@xyjtou 不同的,要经过处理后再返回。
justfly
2017-03-14 18:35:14 +08:00
这个问题涉及的东西比较多 你要了解:

1. 基于 epoll 等实现的 event loop
2. 然后在此基础上理解类似 nodejs 的基于回调函数的异步处理
3. 然后再了解 python 的 cotoutine 如何基于生成器实现的
4. 然后理解 Python 的 Future 和 js 的 Promise 等如何解决基于回调的异步带来的回调嵌套问题
5. 最后 async await 只是一个生成器协程的语法糖

对比下 gevent, nodejs tornado asyncio golang erlang 和 线程模型,然后你就全都明白了。
justfly
2017-03-14 18:37:15 +08:00
@justfly cotoutine -> coroutine
lbp0200
2017-03-14 19:00:46 +08:00
youyongsong
2017-03-14 19:35:58 +08:00
说下我对这 python 这几种 web 模型的理解吧:

首先是 http server + wsgi server(container) + wsgi application 这种传统模型吧:
http server 指的是类似于 nginx 或 apache 的服务
wsgi server 指的是类似 gunicorn 和 uwsgi 这样的服务
wsgi application 指的是 flask django 这样的基于 wsgi 接口的框架运行起来的实例
最初这种模型只是为了方便 web 框架的开发者,不需要每个框架层面都去实现一遍 http server ,就增加了一个 WSGI 中间层协议,框架只要实现这个协议的客户端就可以,然后用 wsgi server 去实现 http 协议的解析并去调用客户端(wsgi application)。

为了方便开发,每个框架都内置了一个简易的 wsgi server ,为什么还要用专门的 wsgi server 呢?
wsgi 除了解析 http 协议以及 http 端口侦听外,还负责了流量转发以及 wsgi application 进程管理的功能。一般 wsgi 框架内置的 wsgi server 都是一个单进程,一次只能处理一个请求。而目的通用的 wsgi server(gunicorn, uwsgi)都至少支持 pre fork 模型,这种模型会起一个 master 来侦听请求,并启动多个 slave(每个 slave 是一个 wsgi application), master 负责把请求转发到空闲的 slave 上。除了这种传统的基于进程的 pre fork 同步模型,不同的 wsgi server 也会支持一些其它模型,有基于线程的同步模型,也有基于 asyncio 的异步模型。

这种模型下怎样写异步代码呢?
1. 直接用传统的异步编程(进程,线程,协程),虽然有些 wsgi server 支持 asynio 模型,但是这也需要用户所写的代码做相应的支持。这就导致了如果我们在 wsgi application 的时候不能随便使用线程和异步 IO ,如果用了就需要配置 wsgi server 使其支持我们自己的写法。因此为了使得我们缩写的 application 能部署在任意的 wsgi server(container)中,我们就只能写同步代码了。
2. 使用分布式异步编程,使用类似 celery 的方式,将需要异步处理的东西发送到 worker 去处理。

既然有了 wsgi server ,为什么还要有一个 http server 呢?
主要是因为 wsgi server 支持的并发量比较低,一般会用一个专门的 http server 来做一层缓冲,避免并发量过大时直接服务挂掉。


python 传统的这种 wsgi 模型,主要是为了方便框架开发者只需要专注框架层面,而非 http 处理层面。但这样却增加了服务部署的复杂度,需要同时部署和配置 http server 和 wsgi server ,如果想支持异步还要部署 worker ,而使用 tornado 或 go 开发的应用因为自己实现了高效 http 处理的应用只需要部署自己就可以了。


接下来是 tornado 和 twisted 这种模型:
这种模型和上面的传统模型处于一个时期,这种模型和 nodejs 差不多,都是基于回调的模型,适用于高 IO 低 CPU 的场景。这种模型自己实现了一个基于回调 http server(event loop),每一个请求都被注册成一个异步函数来处理,然后主循环来不断的循环这些函数。这样就和 pre fork 模型有了区别, pre fork 模型中每一个 slave 都是一个 wsgi application ,一个 wsgi application 都只能处理一个请求,而回调模型只有一个线程,不仅极大的减少了内存的分配还减小了进城以及线程间的切换开销,从而可以支持高 IO 并发。但是这种模型也有很明显的缺点,就是一旦应用程序有大量的 CPU 计算,就会让这个线程堵住,所有的请求都会收到影响,如果应用在处理一个请求时崩溃,所有的请求也都会收到影响。


接下来时 aiohttp/sanic 这种模型:
这种模型和 tornada 模型的改进,但实质上是一样的,因为回调的写法不易读也容易出错,于是将回调的写法改成了同步的写法。这种模型和 koa2 和 go net/http 查不多, asyncio 提供了类似 go coroutine 的功能和写法,而 aiohttp 则提供了类似 go 中的 net/http 的 http 处理库。
eloah
2017-03-14 19:41:35 +08:00
怎么说呢......Flask 是个 web 框架,但是并不是一个 webserver,这也就是你的前面还要加 nginx/unicorn 的原因(当然一般还会有 uwsgi)......简单但是不准确的来说 flask 只负责处理请求,而不负责收发请求......
而楼上提到的 tornado 有 web 框架,也有 webserver.
另外,楼主这个应该使用负载均衡更好一点吧,这种竞争式的其实一般来说效率反而底下.
Kilerd
2017-03-14 20:05:43 +08:00
@youyongsong 好久没有见过那么仔细地分析的了。
param
2017-03-14 21:05:26 +08:00
@eloah nginx flask uwsgi 的关系我理解。只是关于 tornado 的东西还不理解
AlisaDestiny
2017-03-15 10:55:40 +08:00
@youyongsong 厉害呀。理解这么透彻。服。虽然我看不懂。但是感觉很厉害。
Damnever
2017-03-19 20:29:54 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/347421

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX