集思广益,上司提了个需求要短时间可以扛住 200 万 req/s

2023-12-14 10:37:03 +08:00
 owen800q

先说下背景,跨境电商,主要是 tiktok 直播带货,我们是下游平台,平台技术架构是用 aws serverless lambda, api gateway 和 dynamodb

一开始 aws 是给了 3000 的 concurrency quota, 后来业务爆发性增长,年中时我们向 aws 申请加到了 5 万 lambda 并发数,本来以为应该可以应付一切了,但上星期日志出现了大量 500 internal server error, 原来是达到 5 万+了,我们问了下 aws 技术支持,说我们当天的峰值到达了 12 万+ req/s

导致大量商家无法创建下游订单, 大老板直接提了个要求是不允许再发生这种情况, 要求要扛住至少 200 万 请求

Api gateway 和 dynamodb 是没性应限制的,主要是 lambda 并发数提不上去, aws 那边说最多只能把 lambda 最大并发只能提到 100k

23604 次点击
所在节点    程序员
159 条回复
zzNucker
2023-12-14 13:39:40 +08:00
你们技术团队没有先分析一下需求的合理性吗?
diagnostics
2023-12-14 13:39:57 +08:00
@coderzhangsan CPC 和 CPR 还是不一样的,你看到广告就会注册吗?有效点击大概率是误触,当然也不乏快手有作弊嫌疑
coderzhangsan
2023-12-14 13:48:25 +08:00
@diagnostics 不可能是误触,开启广告投放的时间点属于低谷期,直播间人数高峰期也不过百人,还需要用户点击直播间风车组件,点击后会直接引流到应用市场,所以这几十万条有效点击数明显是灌水数据。
Pythoner666666
2023-12-14 13:49:09 +08:00
12 万 QPS ,如果是下单的接口,那不赚发了
justfindu
2023-12-14 13:50:29 +08:00
超出了我的能力认知范围. 不知道 12306 和 淘宝 这些能不能搞到
dko
2023-12-14 13:56:55 +08:00
考虑下分流+多活?
wheat0r
2023-12-14 13:57:40 +08:00
200 万 req/s
莫非 lambda 这些产品是贵公司自家的产品?
herozzm
2023-12-14 13:57:46 +08:00
被攻击了,还傻乎乎的提升 qrs
justfindu
2023-12-14 14:00:02 +08:00
首先考虑已经上了这么多 req 之后 , 业务增长有多少? 就能分辨出来是否正常了.
zzNucker
2023-12-14 14:01:54 +08:00
@justfindu 200w 估计都超过天猫双十一峰值购物车 QPS 了
diveIntoWork
2023-12-14 14:03:51 +08:00
200 万 qps ,比 tiktok 还牛
owen800q
2023-12-14 14:05:05 +08:00
@dko 分流的前提是最外层得有个东西可以接住 12 万+ 请求吧,然後再做分流?
tairan2006
2023-12-14 14:08:12 +08:00
12w 已经够离谱了。。这不财务自由了
owen800q
2023-12-14 14:12:36 +08:00
12w + 全是 API 调用。没有 html js css 那些,不全是下单请求,还有运费查询和商品详情
@sankooc
@murmur
@Hyschtaxjh
@dusu
salmon5
2023-12-14 14:13:53 +08:00
我感觉你这是面试题,套方案
cnbatch
2023-12-14 14:14:02 +08:00
第一反应,应该是被盯上受到攻击了吧

就算做到了扛住 200 万,攻击者可以继续加码弄到 300 万、400 万。

所以对于“大老板”的要求,不如索性往这个方向调查,让大老板知道是你们被人盯上、遭到了攻击,哪怕弄到能抗住 1 千万请求都是徒劳,正确做法恐怕是使用流量清洗服务。
tqyq88
2023-12-14 14:14:38 +08:00
简化方案,随机 drop 99%就行了
owen800q
2023-12-14 14:15:20 +08:00
@hsymlg 是的,主要是底层支撑
salmon5
2023-12-14 14:16:06 +08:00
这个业务规模,研发至少数千人规模,还有时间来 v2 问?
zzNucker
2023-12-14 14:16:20 +08:00
拆分一下你们的服务,不要全放一个集群

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1000267

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX