月经贴， tornado + sqlalchemy

ryanking8215

2014-12-05 14:21:45 +08:00

@lianghui 不做什么玩意，就是评估一下，如果用tornado做一个api服务，需要用到数据库，但是我对sql不熟，所以想用orm来解决数据库的问题，我想知道在这样情况下，orm是同步的，但是web framework是异步的，如何来协调。再比如我用asyncio呢？如何和sqlalchemy配合使用？

"就告诉一个方法如何用tornado 和数据库异步落地架构"
就是这个问题。

zhouquanbest

2014-12-05 14:22:55 +08:00

Celery是最优解

当然如果你能处理好session的问题（即不要让一个进程里的所有Request都是用一个session）可以用Douban的黑科技Greenify做到Mysqldb异步

lianghui

2014-12-05 15:03:03 +08:00

@ryanking8215 你把自己绑死在sqlalchemy了。

@zhouquanbest celery只是一个解，但绝对不是最优的

zhouquanbest

2014-12-05 15:33:00 +08:00

@lianghui
celery毕竟方便嘛
求推荐更优雅的方式 tornado+sqlalchemy合体确实恶心

zenliver

2014-12-05 15:46:44 +08:00

用celery只是绕过了这个问题，而不是解决了，找找有没有人实现过，没有，自己轮一个吧，用tornado ioloop 以及iostream去处理io，，，good luck

ryanking8215

2014-12-05 15:49:15 +08:00

@zhouquanbest ORM一般都有连接池，难道连接池是分进程的？就算是非阻塞架构的，例如nodejs 上的sequelizejs，也有连接池，一个sql请求由于某些问题会阻塞(不是阻塞式api)，其他请求会用连接池里的继续用。和进程没有关系啊。就算mysql的driver是异步的，但ORM的api不是啊，例如不能yield的。

@lianghui ORM不是sqlalchemy最好了吗？其他的ORM，也是同步类型的，和sqlalchemy没区别啊，难道有异步的ORM吗？

起因是这次有个项目使用nodejs+sequelize来做的，由于nodejs的并发模型一致性，其他的组件通过promise或者callback都能集成起来，或者本来就是自然的。
但是python就不是，并发模型有可多线程，可多进程，可twisted的callback或者deferred，可tornado,gevent的coroutine，现在asyncio的coroutine又和tornado和gevent是不同的，在这种多样选择下，各种并发模型不同的库如何配合起来呢？这个是不是pythoner的痛点之一呢？
当然nodejs是好坑的，包括很多第三方的库，本着多学一点的原则，所以想和大家探讨探讨。

ryanking8215

2014-12-05 15:51:06 +08:00

@binux 数据库block，肯定是数据库的设计有问题，但是在ORM在请求时是同步socket，由于网络问题也会block，那tornado的异步就没有意义了。

zenliver

2014-12-05 15:52:58 +08:00

https://github.com/mayflaver/AsyncTorndb 这是我轮的一个不过还是有些问题，仅供参考

binux

2014-12-05 15:56:30 +08:00

@ryanking8215 只能说 tornado 不认为连 mysql 都要堵是个问题。

lianghui

2014-12-05 15:59:07 +08:00

@zhouquanbest

先说最简单的方法，使用OpenResty lua 编写数据库落地接口

tornado 优化一个能够长连接的http client 或者直接使用自带的异步client 发送请求如

req: /query?op=user.find_by_user&uid=1222

res ： {"uid" : 1222, "name", ...... }

req /execute?op=user.save&data=<User.as_json>

req: 200 0k

这类架构数据库使用openresty 作为dbproxy

上面的例子中使用的http协议，数据可是用json或者google protobuf（这个比较高效）

效率在 3k-4k req/s

### 使用长连接

如果绝对http协议不够高效，那么使用tcp自行封装一个简单长连接的协议。不过这样dbproxy serverlength需要使用c++之类的做个异步server了。协议可以选高效的二进制协议 protobuf只是一个选择。

如

req: {"op": "user.find_by_uid", "data": {"uid": 12}}\r\n

使用这类行协议

回复如下：

7200 ok
23{"uid" : 1222, "name", ...... }

回复消息定义首4位标识消息状态长度上面是状态200 msg为 ok 之间是空格分隔
然后紧接着32位标识数据长度，后面自定义解析的raw数据，觉得要省事可以使用protobuf。

这类优化后到 5-6k req/s问题不大。但这时，妈蛋去多关心你的数据库压力，然后去优化吧。

lianghui

2014-12-05 16:07:17 +08:00

@ryanking8215 抱歉呀，sqlalchemy没用过，做游戏的，不关心这类的，更喜欢直接使用data-mapper模式。

http://martinfowler.com/eaaCatalog/dataMapper.html

推荐看这位作者企业架构书 http://www.amazon.com/Patterns-Enterprise-Application-Architecture-Martin/dp/0321127420

ryanking8215

2014-12-05 16:48:57 +08:00

@lianghui RPC？就好比tornado收到request后，和后端的db_proxy通信，db_proxy可以用啥哈nodejs+sequelize也可以啊，那就没有这个问题了，呵呵。大概你们做游戏的都是分层的，如果只是撸个blog，那就太厚了，这儿问题还是存在的。

openroc

2014-12-05 17:02:40 +08:00

用nodejs吧，异步到你爽YY~~

qbeenslee

2014-12-05 17:12:25 +08:00

可以开ThreadPool来异步处理

ryanking8215

2014-12-05 17:21:49 +08:00

@qbeenslee 貌似只能这样了

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/151662

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.