扇贝的烦恼:用户使用时段太集中?

2017-02-23 22:08:45 +08:00
 banxi1988

前几天扇贝到 11 点左右就会卡得不要不要的. 今天是这个点直接挂了.

500 Internal Server Error nginx/1.9.15

从去年的时候,我就经常在其论坛见到有登录不进去打不上卡的. 看来今年开学以来用户量是显著增长不少. 我也是扇贝的用户,这几天我也是深受其服务故障的烦恼. 因为我是开了三个月计划的人. 所以我感觉, 扇贝的烦恼估计是,用户的使用的都集中在晚上 12 点之前.

在我看来扇贝保持用户活跃度其中一个杀手锏就是 扇贝小组. 很多大组的打卡率都在 90% 以上. 几年之前我在 V2 上了解到了扇贝单词, 也用了下,但是没啥意思,我不是喜欢记单词的人. 上年加入了其中一个大组,现在是连续 200 多天打卡了. 当然另一个主要原因是我觉得他们的扇贝听力等全家桶比较好用.

希望扇贝服务尽快稳定, 因为我可是开了三月计划的.

6399 次点击
所在节点    程序员
25 条回复
lightening
2017-02-24 21:47:36 +08:00
扇贝只有英语吗?想学日语,不知道哪个 app 好用?
mreasonyang
2017-02-24 21:52:27 +08:00
@lightening 《新标准日语》这书会随书送个他们自己的日语 APP 的 Key ,内容和书是一样的,但是有发音等额外功能,我们当时学日语都用的这个,比看书还方便。可以参考下
lightening
2017-02-24 23:16:06 +08:00
@mreasonyang 好的。谢谢。是不是现在书配套 app 是标配了?不像小时候那样用磁带……
cheka
2017-02-27 00:05:28 +08:00
直接利益相关人来回答了。

首先你的三十天计划不受影响,我们第二天已经发补卡通知,一键修复各种计划,同时也给予了其他补偿,还发了一枚大难不死徽章。

另外问题的直接原因并非人数(虽然同时在线人数的确不少,但是我们的架构是可以顶住的),而是我们当时的程序自身出了 bug 。

转我们内部事故总结邮件中的一段

“在此期间,我们对队列经过了几次优化,包括提高了队列系统的内存上限,增加了队列的服务器。 因为之前消息队列系统中发现数据有丢失,我们增加了 ACK 机制 (也就是确认机制),这个机制增加后,开始对系统造成较大的影响。 之后,在昨天下午 4 点钟,我们上线了一个安全机制,这个机制会导致数据在我们多台机器间进行数据同步,因为这个同步需要消耗较多的时间,磁盘和网络双重延时造成了该次事故。 ”

所以大家如果发现自家服务器突然当机, CPU ,数据库,缓存这些中心资源都看似良好,但应用服务器就是不停的挂,那么可以去怀疑有没有队列进程阻塞了各种操作系统资源。
banxi1988
2017-02-27 09:13:21 +08:00
@cheka Thanks for your reply
我反馈一个问题.
就是最近我经常晚上打卡之后, 第二天提示我: 完成了任务但是没有打卡. 虽然可以补打卡,但是还是让人郁闷, 因为没有打卡小组管理会发来一个警告.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/342761

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX